[リストへもどる]

一括表示

▼ ネットワーク障害'08 - としき@家主 2008/01/15 15:39 No.1160
  ┣Re: ネットワーク障害'08 - としき@家主 2008/01/18 23:33 No.1163
  ┃┗Re^2: ネットワーク障害'08 - としき@家主 2008/01/21 14:20 No.1164
  ┃ ┗Re^3: ネットワーク障害'08 - としき@家主 2008/01/27 19:33 No.1166
  ┃  ┗Re^4: ネットワーク障害'08 - としき@家主 2008/02/24 22:22 No.1180
  ┣Re: ネットワーク障害'08 - としき@家主 2008/01/24 23:31 No.1165
  ┣Re: ネットワーク障害??? - としき@家主 2008/02/02 14:02 No.1167
  ┃┗Re^2: ネットワーク障害??? - としき@家主 2008/02/08 20:43 No.1172
  ┣Re: ネットワーク障害'08 - としき@家主 2008/03/18 21:53 No.1193
  ┣Re: ネットワーク障害'08 - としき@家主 2008/03/21 14:06 No.1199
  ┣Re: ネットワーク障害'08 - としき@家主 2008/03/28 15:14 No.1212
  ┣Re: ネットワーク障害'08 - としき@家主 2008/04/06 11:28 No.1224
  ┣ネットワーク停止予告(2008/05/13) - としき@家主 2008/05/12 00:26 No.1238
  ┃┗Re: ネットワーク停止予告(2008/05/13) - としき@家主 2008/05/14 20:50 No.1239
  ┣Re: ネットワーク障害'08 - としき@家主 2008/05/29 12:17 No.1246
  ┣Re: ネットワーク障害'08 - としき@家主 2008/06/19 21:19 No.1250
  ┃┗変わるIPアドレス - としき@家主 2008/07/02 23:05 No.1274
  ┣Re: ネットワーク障害'08 - としき@家主 2008/07/10 00:36 No.1305
  ┃┗Re^2: ネットワーク障害'08 - としき@家主 2008/07/10 21:06 No.1307
  ┣Re: ネットワーク障害'08 - としき@家主 2008/08/03 19:39 No.1368
  ┣Re: ネットワーク障害'08 - としき@家主 2008/08/06 22:31 No.1369
  ┃┗Re^2: ネットワーク障害'08 - 久志本克己 2008/08/07 07:04 No.1370
  ┃ ┗Re^3: ネットワーク障害'08 - としき@家主 2008/08/07 11:53 No.1371
  ┣Re: ネットワーク障害'08 - としき@家主 2008/09/08 23:51 No.1418
  ┃┗Re^2: ネットワーク障害'08 - としき@家主 2008/09/11 23:22 No.1420
  ┃ ┗Re^3: ネットワーク障害'08 - としき@家主 2008/09/14 23:02 No.1422
  ┃  ┗Re^4: ネットワーク障害'08 - Bunta 2008/09/15 22:21 No.1423
  ┃   ┗Re^5: ネットワーク障害'08 - としき@家主 2008/09/16 09:35 No.1424
  ┃    ┗Re^6: ネットワーク障害'08 - Bunta 2008/09/16 22:25 No.1425
  ┃     ┗Re^7: ネットワーク障害'08 - としき@家主 2008/09/17 23:58 No.1426
  ┃      ┗Re^8: ネットワーク障害'08 - Bunta 2008/09/24 10:03 No.1431
  ┃       ┗Re^9: ネットワーク障害'08 - としき@家主 2008/09/24 22:05 No.1432
  ┃        ┗Re^10: ネットワーク障害'08 - まっちゃん 2008/09/24 23:46 No.1433
  ┣Re: ネットワーク障害'08 - としき@家主 2008/10/23 16:40 No.1482
  ┣Re: ネットワーク障害'08 - としき@家主 2008/10/27 02:23 No.1485
  ┃┗Re^2: scandiskの不具合? - konno 2008/10/28 01:34 No.1486
  ┃ ┗Re^3: scandiskの不具合? - としき@家主 2008/10/28 10:28 No.1487
  ┃  ┗Re^4: scandiskの不具合? - konno 2008/11/01 00:43 No.1488
  ┃   ┗Re^5: scandiskの不具合? - としき@家主 2008/11/02 10:42 No.1489
  ┃    ┗Re^6: scandiskの不具合? - konno 2008/11/04 01:23 No.1490
  ┣Re: ネットワーク障害'08 - としき@家主 2008/11/08 00:36 No.1492
  ┣Re: ネットワーク障害'08 - としき@家主 2008/11/30 21:44 No.1496
  ┃┗Re^2: ネットワーク障害'08 - としき@家主 2008/12/01 23:05 No.1497
  ┃ ┗Re^3: ネットワーク障害'08 - konno 2008/12/03 00:18 No.1498
  ┃  ┗Re^4: ネットワーク障害'08 - としき@家主 2008/12/03 23:38 No.1499
  ┗Re: ネットワーク障害'08 - としき@家主 2008/12/16 12:02 No.1501
   ┗Re^2: ネットワーク障害'08 - としき@家主 2008/12/31 22:32 No.1503
    ┗Re^3: ネットワーク障害'08 - めざら 2009/01/01 07:51 No.1504
     ┗Re^4: ネットワーク障害'08 - としき@家主 2009/01/01 17:30 No.1505
タイトルネットワーク障害'08
記事No1160
投稿日: 2008/01/15(Tue) 15:39
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
一ヶ月半ほど安定運用していたこの掲示板ですが、ここ2日ほど、とても調子が
悪いです。ぶっちゃけ、猛烈なアタックを受けております。アタック元は、IP
アドレスが偽装されていなければ「Google」です。単に、好ましからざる頻度で
クローラーが訪れているだけ、という言い方もできますが。

まずは時系列。
1月14日午前1時過ぎ、約10日ぶりにサーバを直接さわりました。サーバの
アクセスログの整理など、基本的にファイルの移動・コピーしかしなかったので
すが、この際、異常な状況が発覚。サーバとしての機能には全く異常がなかった
のですが、マイコンピュータというかエクスプローラというか、要するに開いた
フォルダを閉じようとしても、デスクトップ上は消えてくれるのですが、タスク
バーに残ってしまって、こちらの方は消えてくれない。タスクバーで右クリック
して「閉じる」を選んでも消えない。[CTRL]+[ALT]+[DEL]でタスクの一覧を見た
ら、軒並み「応答なし」となっている。そういうのが全部で5〜6個あったかな。
仕方ないので、その画面で「シャットダウン」を選んだのだけど、シャットダウ
ンしてくれない。最後の手段と、電源スイッチ長押しで強制終了。再起動してく
るまでに約5分くらいかな、サービス中断になったのは。ま、それほど大したこ
とはありませんね。なお、この時点では、まだGoogleの津波は押し寄せていませ
んでした。
その前にサーバ再起動を行ったのは12月17日です。この時は、深夜1時から
4時半くらいまで3時間半ほど止まっています。利用者にはほとんど影響のない
時間帯で助かりました。ということで、連続運用は27日間ぐらいになりますね。
こんなに長く運用できたのは久しぶりです。というか、そのくらい連続運用を続
けていると異常になる、という方が正解かもしれません。
さらにその前は、12月1日にリブートしています。あまり詳しく覚えていませ
んが、確かその時も、やはり操作中に具合が悪くなったという事でリブートして
いたはずで、サービス中断時間はやっぱり5分程度だったはず。
ま、1ヶ月に1回、3時間程度のダウンなら、私としては十分問題ないサービス
グレードだと思っておりました。稼働率だけをとらえるなら、かつてのニフティ
の定期メンテナンスと大差ないわけですから。不定期というか突然発症するとこ
ろは大問題ですが、そこはそれ、自宅サーバという事で言い訳させてもらうつも
りです。その前というか、11月までが結構ひどかったんでね。

が、その後がいけない。
14日12時50分頃、お馴染みの青画面で停止している事に気がつく。この時
に真っ先に思ったのは
「え、なんで?リブートしてからまだ半日しか経っていないのに」
というものでした。再起動してからログをチェックしてみたところ、落ちたのは
12時30分頃と判明。つまり、サービス中断は約20分あまり。このとき既に
Googleの波涛は押し寄せていたのですが、それほど深刻にはとらえていませんで
した。理由は、それまでの数日間と比較してそれほどアクセス数が多くなかった
から。でも、これは間違いです。それまでの数日間は24時間のアクセス数なの
ですが、14日分はまだ12時間あまりしか経っていません。つまり、1時間あ
たりで比較すれば2倍以上なのです。が、その時はそれに気がつきませんでした。

さて、14日は宿直勤務でした。
14時過ぎに自宅を出て、会社に着くのは16時ごろ。いつもなら出社してすぐ
に会社から自宅サーバの死活チェックをするのですが、ちょっと忙しかったもの
で、実際に死活チェックを行えたのは18時ごろ。ここでサーバダウンを検知。
やきもきしながら迎えた15日朝、終業してすぐに飛んで帰ったのですが、再び
いつもの青画面。リブートして回復したのは11時50分前。ログをチェックし
たところ、落ちたのはどうやら17時30分ぐらい。そうか、会社についてすぐ
に死活チェックをしていたら、その時にはまだ落ちていなかったはずなのね。

ということで、結局、14日はトータルで7時間くらいサービスが止まっていま
した。が、それにも関らず、1日合計のGoogleからのアクセスはここ数日の平均
の約1.5倍くらい。ということは、24時間換算で比較すると、通常の約2.5倍。
短時間集中率というか、1時間あたりのピークでいうと、多分、3倍以上。それ
に加えて、その他のお客さんも来るしね。
う〜ん、現在、robots.txtでCrawl-delayを600にしてあるんだけど、Googleって
これをサポートしていないようだからなぁ。



あ〜あ、今年もこのツリーは大きくなってしまうのかもしれません。
 

タイトルRe: ネットワーク障害'08
記事No1163
投稿日: 2008/01/18(Fri) 23:33
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
> あ〜あ、今年もこのツリーは大きくなってしまうのかもしれません。

どうもいきなり大きくなってしまいそうです。
18日は15時ちょっと前から20時ちょっとすぎまで、5時間20分ほど停ま
ってしまいました。立て続けということで、ちょっとしおしお。
今回も集中的なアクセスだったんですが、相手はスパマーさん。常連というか、
大阪方面からのアタック。このスパマー、今までにもocnやdionなど、あちこちの
プロバイダからスパムを送り付けては、すぐにそのプロバイダに契約を打ち切ら
れて、また別のプロバイダと契約する、ということを繰り返しているようなんで
すよ。今日はso-netでした。こういう時、海外のプロバイダならプロバイダごと
規制してやるのですが、さすがに国内が相手だとそんな度胸はない。
ちなみに、今回のアクセス集中がどのくらいかというと、ログに残っているだけ
で67秒間に12回。サーバの負荷とかネットワークへのデータの転送量の問題
などがあるので一概には言えないけど、1日あたり1000回以上のアクセスが
あっても落ちない時もあるので、やっぱり問題は短時間集中度にある可能性が高
そう。
  

タイトルRe^2: ネットワーク障害'08
記事No1164
投稿日: 2008/01/21(Mon) 14:20
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1163
どっちにレスをつけようか迷ったのですが、こちらにつけます。
ちょっと小旅行だの宿直だので書き込みをしているヒマがなかったのですが、先
日、また落ちていました。今度は、19日の午前2時40分頃から8時過ぎまで、
またも5時間20分程。まぁね、落ちている事に気がつき次第回復させるわけで
すから、止まっていた時間がたまたま同じくらいというのは単に偶然です。今回
も、もうちょっと早く起床していたらもうちょっと早く回復できたわけで。
問題は、リブートしてから連続でどのくらい稼動していたか、という点。
1月14日までは約27日間連続稼動。
14日の深夜のリブート後は約11時間の連続稼動のあと、約20分停止。
その次は約4時間45分稼動して約18時間20分停止。
そのあとは3日と3時間ほど動いて5時間20分ほど停止。
そして、6時間20分動いたらまた5時間20分停止。
それから現在まで、2日と6時間程度は安定して動いておりますがね。
もしかして、次の停止まであと1日くらいなんでしょうか。
 

タイトルRe^3: ネットワーク障害'08
記事No1166
投稿日: 2008/01/27(Sun) 19:33
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1164
> もしかして、次の停止まであと1日くらいなんでしょうか。

#1165に書いたとおり、19日の次は24日まで持ってくれましたが。
その後がいかん。またも、連日のように落ちています。
25日が11時過ぎから19時過ぎまで約8時間強。これも大阪のスパマー。
26日が11時半から13時半まで2時間弱。これも大阪のスパマー。
そしてまた、6時間弱しか動かず、19時過ぎには再度停止。今度はgoogle。
今回も私は宿直だったもので、復旧は27日の12時半。停止時間は17時間半。

とりあえず、#1165に書いたgoogleパージに関しては、確率9割で再導入。
ただ、これは、あくまでも対症療法にすぎません。
と言いつつ、根本原因が今ひとつつかめていないから仕方ない。
サーバのソフト的な過負荷のようだ、というところまでは間違いないのですが。
OSなのかアプリなのかも原因不明。
ちなみに、世の中には「OSパニック」だの「カーネルパニック」などという用
語もあって、症状としては同じようなもののようですが、うちの例がこれに該当
するかも不明。なにせWindowsだから。

一応、他の可能性も空想できて。
その1。
データの転送量が増えたときに落ちていますので、実際はNICのハードウェア
またはデバイスドライバが耐えきれずに落ちてしまう。
その2。
WEB用として公開している9801番ポートに対して、HTTPではないプロトコ
ルでのアタックがある。この場合はHTTPサーバにはログは残らない。google
のアクセスの後に落ちているように見えるのは単なる偶然、というか、googleの
アクセスの絶対数が多いので確率的に当然高くなるわけであり、実際にはgoogle
のアクセスから数分後に落ちている。なにせ、落ちた瞬間を捕まえているわけで
はなく、あくまでもログに残っている最終アクセスから推測しているだけなので。

一応、これら2つの可能性であるか否かを判定する方法というのは存在します。
Ethereal(イーサリアル)でモニタすればいいわけです。
が、そんなソフトを入れるマシンがない。というか、そういうマシンがあれば、
そっちでサーバを運用します、みたいな。

う〜ん、なかなか八方塞がり。
  

タイトルRe^4: ネットワーク障害'08
記事No1180
投稿日: 2008/02/24(Sun) 22:22
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1166
2月25日もお馴染みパターン。
今日は日曜日だけど当番で出社の日。朝、06:50頃、出社前は正常運行。
8時半すぎに会社から死活チェックをしたらダウン判明。
帰宅したらいつもの青画面。19:30頃、リブートで回復。
回復後に、07:30頃から倒れている事を確認。約12時間のダウン。

前回、2月2日に意図的にリブートしているので、連続運用としては3週間強と
なりますか。ま、この程度であれば、頻度としては容認できる範囲ですね。
でも、ダウンする頻度が下がったという事は、google除けが効いているという事
なのかな。どうもそんな感じ。
 

タイトルRe: ネットワーク障害'08
記事No1165
投稿日: 2008/01/24(Thu) 23:31
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
今日、24日も、14時過ぎから5時間半弱、落ちていました。
帰宅して、19時半頃に復旧。原因は、またぞろ、大阪方面のスパマー。
今日はinfowebでした。

さて本題。
実は、昨日の23日、ちょっと妖しい実験をしていたのです。
一つは、googlebot追い返しルーチン。ここしばらくのgooglebotのアクセス回数
は、24時間きっちりサーバが動いていた時の最大で1日あたり500回近く、
少ない時で100回弱、平均すると200回ぐらいかな。他のサーチエンジンの
場合は、Crawl-delayをサポートしているとか、あるいは数百のアクセス元から、
まるでアタックの様にアクセスしてくる某サーチエンジンについてはfirewallで
いくつかのアクセス元をアクセス拒否したりして、何とか1日あたり数十回に抑
え込んでいるけど、こいつは単一のアクセス元だし、どうにも始末が悪い。
ではどうしたかというと、あまり好ましくないとは思ったのだけど、googlebotに
対してだけ「503 さぁびす てんぽらりぃ あんあべいらぶる」というステ
ータスを一定の確率で返すようにしたのですね。具体的な確率は、なんと8割。
でも、これは効きましたねぇ。23日の午前1時ごろに導入して、後述の理由で
21時ごろに外したのですが、その時までのアクセス回数は40回余り。見事に
80%削減できてウハウハしていたのですが、今日、サーバ復旧後に、昨日1日
の総回数を見たら、なんと80回以上。おいおい、このルーチンを外すと、それ
までにアクセスできなかった分を取り返そうとするのかね。これはもしかして、
やめると禁断症状の出る妖しい薬のようなルーチンですか。仕方ない、あとで再
び仕込んでみましょうか。

そして今回、もっとずっと危険なルーチンの実験も同時に行っていたのでした。
何かというと、#973に書いた、直リンク強制転送機能。ただし、リンク元が大手
の検索エンジンの時だけ、という制限付きですが。
実験結果は、一応、成功しました。
例えば、どこかの検索エンジンでこの板塀を引っかけて、その検索結果をクリッ
クすると、きちんとフレーム側にパラメータをくっつける形で自動でリロードし
て、フレームの中に目的の部分が表示されました。また、そこからさらに、板塀
の本体部分というかフレーム内に表示されているアンカーをクリックすると、フ
レームの外側というかブラウザのURL窓に表示されているパラメータとは関係
なく、きちんと目的のページが表示されてくれました。ここまでは計画通り。
ところが、このあとが良くなかった。検索エンジンに戻って、あるいは別の検索
エンジンを使ってもなんでもよいけど、もう一度、今度はこの板塀の別のページ
を表示させようとする。と、これがうまく行かない。さっきと同じページが表示
されてしまう。ここで思いっきり「あ!」と叫んでしまいましたが、実はこれ、
ブラウザ依存の部分があるかもしれないけど、ある程度は仕様通りなんですね。
というか、そういう仕様にしていたことをすっかり忘れていたのですが。
何かというと、#93に書いたキャッシュ設定。つまり、ブラウザが認識している読
み込むべきファイルというのは、パラメータなしの「wforum.cgi」なのです。そ
して、サーバにアクセスがあった時点で、CGIがrefererから必要なパラメータ
を読み取って、しかるべき情報をブラウザに送っているのですが、ブラウザの方
からすると、

「パラメータなしだからさっきと同じファイルだな」
「お、キャッシュされているぞ」
「なら、サーバにアクセスせずに、そのまま表示してしまえ」

ということで、2回目からはサーバへのアクセスそのものが発生しないのです。
なので、さっきと同じページが表示されてしまうのです。もちろん、キャッシュ
されているのは1時間だけという設定になっていますから、それ以上時間を開け
てからアクセスすればうまく行くことも確認済みです。あるいは、ブラウザに、
毎回読み込みなおすと設定していればOKかもしれませんが、こっちは未確認。

ということで、危ないという事もないのですが、家主として納得できないので、
元に戻してしまったというわけです。う〜ん、どうしようかな、強制転送時だけ
キャッシュしないようにするということは可能かな。あるいは、家主がアクセス
した時だけキャッシュするようにして、その他の場合はキャッシュしないように、
なんて設定の方が簡単かも。ま、仮に導入に再挑戦するとしても、短く見積もっ
て数週間から数ヶ月後になることは間違いないでしょうが。
 

タイトルRe: ネットワーク障害???
記事No1167
投稿日: 2008/02/02(Sat) 14:02
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
2月1日も宿直でした。
昼過ぎ、出社する時は、サーバは元気元気。
ところが、17時半頃、会社から死活チェックしたところが応答なし。
うへぇ、宿直のたびに狙い撃ちされるのかね。
ところが、2日の昼過ぎ、帰宅したところが、サーバは正常運用中。あれ?
ログをチェックしても落ちた形跡なし。
会社からはIPアドレス直打ちで死活チェックしているんだけど、IPアドレス
にも変更はない。
うぅん、これはいったいどうしたことだ。

考えられることとしては、セキュリティの関係で会社のネットワークでブロック
されるようになったのではないか、ということ。変なポート番号を使っていたり
するからねぇ。それに1月31日までは正常にアクセスできていたわけで、月が
変ったタイミングで何らかの社内のセキュリティの見直しが行われたというのは
十分考えられます。
あるいは、昔の職場では、IPアドレス直打ちのアクセスが全て遮断されていた
こともあるけど、今回はそれには当たらない。だって、hpcgi3に対してはIPア
ドレス直打ちで読み込み可能というのが現在も継続しているから。あ、だけど、
なぜIPアドレス直打ちにしているかというと、名前指定だと読み込みは可能だ
けど書き込みはブロックされていたからだったわけで、もしかしたら2月からは
IPアドレス指定でも書き込み不可になってしまっているかも。こちらも要確認。

ということで、次に出社したら調べることは、今まで通りのアクセスが相変わら
ず不可能かをまずチェック。それがダメなら、次は名前指定でのアクセスにチャ
レンジ。それもダメなら、80番ポート経由ではどうかを確認。あ、でも、その
ためには、現在閉塞中の80番ポートを一旦開放しなければならないから、さら
に次の機会になってしまう。これもダメなら、現在のIPアドレスはブラックリ
ストに載ってしまったという事で、当面は会社からのアクセスをあきらめるか、
それともIPアドレス変更を行うか。
ただ、「次に出社したら」と書いたけど、しばらく研修等で出社しない日が続く
ので、次回出社日は来週後半。ま、いいけどね。
 

タイトルRe^2: ネットワーク障害???
記事No1172
投稿日: 2008/02/08(Fri) 20:43
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1167
> ということで、次に出社したら調べることは、今まで通りのアクセスが相変わら
> ず不可能かをまずチェック。それがダメなら、次は名前指定でのアクセスにチャ

なぜか、正常にアクセスできてしまいました。実に不思議。
なので、帰宅してからもう一度サーバのログをきちんと調べてみたら、とんでも
ないことが判明。

会社からの自宅サーバの死活チェックは、基本的には4時間に1回、自動で行っ
ています。前回の宿直の場合も同じです。ただ、会社のマシンはノートパソコン
なんで、深夜の仮眠時間帯は省電力モードに落ちて止まってしまいますがね。
で、前回のアクセスログを見たところ、なんと、会社からの死活チェックのアク
セスに対して全て「503」を返しておる。#1168からのツリーに書いたとおり、
サーバの負荷軽減のためにかなり帯域を絞ったのですが、自分の首まで絞めてし
まったようなありさま。全ての死活確認のタイミングで、正に狙ったようにピン
ポイントで、直前に誰かが同時アクセスしていたわけです。

ということで、帯域をちょっと開きました。
現在、同時3アクセスだと制限がかかりますが、2アクセス目まではOKとなっ
ています。これでしばらく様子を見てみます。
 

タイトルRe: ネットワーク障害'08
記事No1193
投稿日: 2008/03/18(Tue) 21:53
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
いつもいつもご迷惑をおかけしています。

ちょっと書き込みをサボってしまいましたが、前回の分も一応書いておきます。
3月16日、起床したら青画面。サクッとリブートで回復。
落ちていたのは午前1時過ぎから8時過ぎまで約7時間。
お客さんの少ない時間帯で助かりました。
原因は、メキシコのスパマーからのアタックによる撃墜。
googleとほぼ同時のアクセスだったし。

で、本日、18日は通常の日勤。
出社時はまだ正常。
8時半頃に会社からチェックしてダウンを確認。
帰宅したら青画面、リブートで回復。
落ちていたのは8時過ぎから19時過ぎまでの11時間強。
ただ、今回は原因がよくわからない。
最後の正常なアクセスは国内というかYahoo!BB。
その前のアクセスはgoogleだけど、10分ぐらい間があるし。

実は、11日ごろから、サーバが落ちた訳ではないけど、何回かリブートを行っ
ています。#1166にちょっと書きましたが、サーバの処理能力が足りないのではな
いかと疑っております。で、高速化とか安定化に関係しそうなWindowsの各種設定
をいじっては再起動、ということ行っている訳です。が、ボトルネックとなって
いるのが前にも書いたとおりNICだのデバイスドライバであるとするならば、
Windowsの方が高速化するのは逆効果かもしれません。ハードウェアが隘路となっ
ているのに、OSの方がますます高速・大量にデータを押し込もうとするように
なる訳ですから。

ちなみに、3月6日頃から、スパマーによるアタックが猛烈になっております。
通常、ここの板塀の読み込みアクセス数は、検索エンジンのクローラーによるも
のを除くと、スパマーからのものを含めて、1日あたり50〜70回くらいでし
た。そして、書き込みアクセス数は1日あたり10回程度。数えてみればすぐに
わかりますが、正規の書き込みは2日に1回くらいですから、95%はスパム書
き込みとして遮断されていることになります。
ところが、3月6日は書き込みが70回以上、読み込みは200回以上。
ちょっとアクセス制限をかけたところ、7日は書き込みが50回弱にまで落ちま
したが、8日は再び書き込みが70回以上。今度は本腰を入れてアクセス制限を
かけて、ようやっと、書き込み回数は1日あたり20回弱まで落しました。
いやぁ、ひどいですなぁ。
でも、それだけの猛烈なアタックをくらっても、1回もスパムに書き込みを許し
ていないので、罠認証欄はそれなりに効果があるようです。もっとも、サーバそ
のものが落ちてしまうようでは悲しいというか情けないというか。書き込み規制
を行おうとして失敗して書き込み不可になってしまっているところもあるけど、
サーバが落ちてしまうのはそれ以上にひどい話だからなぁ。

数少ないご利用者の皆様におかれましては、これに懲りず、長い目で見守ってい
ただけると幸いです。というか、家主はご利用者の皆様の好意にすがるというか
好意に甘える気満々だったりしますもので。
 

タイトルRe: ネットワーク障害'08
記事No1199
投稿日: 2008/03/21(Fri) 14:06
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
また、サーバが止まりました。ごめんなさい。

21日も宿直明けでした。
仮眠から起きて、4時前の時点では、まだ正常に運行している事を確認していま
した。ところが、8時過ぎには停止している事を確認。
11時過ぎに帰宅したら青画面。リブートで回復。
ログによると、6時前くらいから落ちている模様。
外国のスパマーからの多量アクセスにより轟沈。
えぇっと、これはどこの国だろう、.mdって、モルドバ?モルジブ?


そろそろ自分でも不安定さが嫌になってきたので、仮称「生け垣モード」または
「幻モード」を導入することを決断しました。正式名称をどうするかは今のとこ
ろ名称未設定というか無題です。もちろん、そのような小手先の小細工を弄する
ぐらいなら、とっととレンタルサーバに移行して土塀にしろ、という考えの方が
正論であることは間違いないのですが。
#まだまだ遊び足りないお年頃なんですもの。ウフッ(はぁと)
##やめれ>おれ

具体的には、単にバックアップサーバを導入するだけ。
バックアップ板塀は、現行ログの閲覧専用。書き込み不可。過去ログ閲覧も不可。
バックアップとの切換は、動的に「板塀の土台」ファイルを書き換えることによ
って実現。つまり、きちんとフレームの方のURLをブックマークしている方と
か、うちのサイトのトップページからリンクをたどってくるような人の場合なら
ほぼノンストップ、というのは無理ですが、それなりにサービス断時間が短くて
済む。板塀本体に直リンクしている人は今まで通りサービス停止となってしまい
ますが、その手の方にはその程度のリスクは負ってもらいましょう。ま、これも
フレームへの誘導策の一つかな。
ただ、今回思いついた方法の場合、断時間を短くしようとすると、今度は現用サ
ーバの負荷が上がってしまい、すると今度は現用サーバが落ちる確率も上がって
しまうので、ちょっとさじ加減が難しいかも。例えば、3時間落ちていたら切換
実施、とか。それなりに無理のない設定にするつもりではおります。
一応、向こう数ヶ月以内には導入予定ですが、3日に1回落ちるという最近のペ
ースが続くようであれば、大幅に前倒されるかもしれません。例えば、数週間後
に導入、とか。
 

タイトルRe: ネットワーク障害'08
記事No1212
投稿日: 2008/03/28(Fri) 15:14
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
ごめんなさいごめんなさい。
久々に、落ちている事に気がつかない、という失態を犯してしまいました。

3月28日は朝から何回もサーバの画面を見ていました。
少なくとも、起床時、外出前、帰宅後、昼食後には画面を見ています。
状態としては、青画面になっているわけでもなし、いつものスクリーンセーバー
というか画面消去状態で、正常に運行していると思い込んでいました。
昼食後、かなり経ってから、サーバのメンテをしようと思い、メインマシンから
NFSで接続しようとしたところが接続できず。あれっ、と思ってスクリーンセ
ーバーを解除したら、なんか再起動が走ったみたいで、SCANDISKの途中の入力待
ち状態。すぐに手動介入したら無事立ち上がりました。
立ち上がってからログをチェックしたところ、最後の正常なアクセスは午前1時
すぎ、再起動が完了したのは14時半頃なので、最大で13時間強ぐらい止まっ
ていた計算。

いつものことだけど、最大の謎は、なぜ再起動が走ったのか、ということ。
だって、私、その時間は既に就寝済みだし、他の誰もサーバには触らないし。
停電があった痕跡もないけど、仮に停電があったとしても、サーバはバッテリー
搭載だから落ちることはありえないはず。

ということで、いささかの謎は残ったままなのでした。
  

タイトルRe: ネットワーク障害'08
記事No1224
投稿日: 2008/04/06(Sun) 11:28
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
う〜ん、おおむね1週間に一度のペースかなぁ。
またも、続けざまに落ちたというか落したというか。

4月5日は日勤でした。
普通なら、出社してすぐに板塀の死活チェックをするのですが、中央線の信号ト
ラブルの影響で遅刻寸前。いつもなら東京駅から会社までの途中にあるコンビニ
で昼食を買っていくのだけど、もちろんそんな余裕もなく、会社に着いたのが始
業1分前。余談ですが、東京駅での構内アナウンスでは「8時48分から運転を
再開」と言っていたのですが、帰宅してから夕刊を読んだら「8時20分までに
全線で運転を再開」と書いてあった。真実はどこに。
で、業務が始まったらこれがまた猛烈に忙しくて、1日中個人端末を立ち上げる
ヒマもない。当然、死活チェックもできない。本来の終業時間は17時30分な
のですが、やっと個人端末が立ち上げられたのは18時チョイ前。が、サーバの
応答なし。うげげ、いつから落ちていたんだろう。
結局、残業2時間となって、帰宅できたのは20時50分頃。青画面をリブート
して回復。回復後、ログをチェックしてみたら、最後の正常応答は17時55分。
異常応答の履歴なし。なんか、またしても、私が落してしまったみたい。
影響時間は約3時間。わりと短時間で復旧できたのが幸い。

疲れた1日だったので、いつもは0時過ぎまで起きているのですが、早々に、と
言っても23時過ぎですが、就寝してしまいました。で、今日は8時過ぎに起床。
またも青画面で止まっている。そう簡単に落ちるなよな。さくっとリブート実施。
再起動後、ログをチェックしたところ、最後の正常応答は0時55分頃。ところ
がそのあと、1時5分ぐらいまで数回、異常応答を返しているのです。う〜ん、
微妙に事象が異なる。
とりあえず、今度は影響時間約7時間。ちょっと長い。
 

タイトルネットワーク停止予告(2008/05/13)
記事No1238
投稿日: 2008/05/12(Mon) 00:26
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
今回は、停止というほどの停止でもないんですがね。
一応、地主から連絡がきたもので。
5月13日の午前2時から6時の間で最大5分程度の断があるとの事。
ただ、うちのやしき、1年以上IPアドレスが変わっていないもんでね。
そろそろ変化するかも、と思ったもので、念のためのご連絡でした。
 

タイトルRe: ネットワーク停止予告(2008/05/13)
記事No1239
投稿日: 2008/05/14(Wed) 20:50
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1238
> 今回は、停止というほどの停止でもないんですがね。

特に何事もなく、無事に終了しました。
いやぁ、よかったよかった。
 

タイトルRe: ネットワーク障害'08
記事No1246
投稿日: 2008/05/29(Thu) 12:17
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
久しぶりに、サーバを長時間止めてしまいました。

最初の停止は、多分5月28日の12時半ごろ。
ログを見ても異常アクセスの痕跡はなし。熱暴走かなぁ。
そろそろ暖かい季節になってきたし、またファンを引っ張り出さなくては。
残念ながら、28日は6月1日で人事異動で転勤する人の送別会があってすぐに
帰宅できず。日付が変わって、やっと酔いどれて帰宅したらお馴染みの青画面。
1時過ぎにリブートでサービス回復。サービス停止時間は約12時間半あまり。

ところが、酔いどれていたせいで、ここで失敗。
リブート時に電源コネクタが接触不良になってしまい、しかもそれに気がつかな
かったのです。結果、約3時間半で内蔵電源を使い果たし、再びサービス停止。
9時過ぎに起床してすぐに状況に気がつき、再起動させて回復。
4時半ごろから9時過ぎまでだから、今回のサービス停止は4時間半以上。

どうもご迷惑をおかけしました。
 

タイトルRe: ネットワーク障害'08
記事No1250
投稿日: 2008/06/19(Thu) 21:19
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
今回は、ちょっと怪我の功名というか。

いつもうちにアタックをかけてくる大阪のスパマーさんがいらっしゃるのですが、
そろそろ本腰を入れてきたというか、先日、書込みに成功されてしまいました。
ただ、それはまだ試験書き込みのようで、そのあとも色々と試行錯誤されている
ようです。delexifなんてパラメータを送ってきているところを見ると、うちを画
像対応の高機能WebForumと誤解しているみたい。
とりあえず今回書き込まれていたのは日本語(2バイト文字)の無意味文字列で
したし、そもそもアクセス元が大阪ですから、日本語なしを排除、というのは意
味がないので、まだ当分は導入しません。逆に言うと、#986からのツリーで議論
していますが、現在の混乱方式は、まだ海外のスパマーに対しては有効性を保っ
ているようです。一方で、国内のスパマーにはそろそろ突破されてしまいそうと
いう事で、有効期間は約1年弱といったところでしょうか。

仕方ないので、混乱方法をちょっといじってみようか、と思ったのですが、その
前に大どんでん返しがありました。なんと、地主の側のネットワーク障害により、
この板塀のIPアドレスが変化してしまったのです。

6月18日の朝、9時過ぎですが、今ではすっかり毎日の恒例作業となってしま
っている、アクセス状況のチェックを行いました。すると、スパマーはおろか、
検索エンジンのクローラーも含め、午前2時半頃を最後にぱたっと止まっている
事が判明。ただ、ネットワークが停まったままでない事も確認。だって、その際
にすぐに自宅から外部にアクセスを試してみて正常に行えることが確認できたし、
サーバのログからも、8時過ぎにはきちんと外からのアクセスを受け入れている
記録が残っている。それ以前にそもそも、1時間に1回のネットワーク断線検知
バッチが断線警報メールを送ってきていない事から考えて、そんなに長時間切れ
ていない事も間違いない。

ということで、地主のサポートコーナーを確認してみたところ、案の定というか、
お知らせの掲示がありました。ネットワーク機器の故障に伴う緊急メンテナンス
のため、6月18日の午前2時から午前5時の間でネットワーク停止があるとの
こと。この手のことは通常、何日も前にメールでお知らせがくるのですが、今回
はメール連絡もなく、また、この掲示の日付が6月16日であったという事から
も、かなりの緊急事態であった事がうかがえます。

ここまで確認したところで、ではやはりIPアドレスが変わってしまったんだろ
うな、と考え、IPアドレス変更検知ツールのログを確認したところ、案の定、
2時57分頃にIPアドレスの変化を検知して、板塀の土台など、必要なところ
の書き換えを行っている事がわかりました。実に1年2ヶ月ぶり。
その後も断続的にアクセスができなかった時間帯があった可能性もありますが、
IPアドレスが変化した事によるアクセス不能時間は最大で30分弱。いろいろ
と変な自作ツールを投入している事はそれなりに効果を発揮しているようです。

これで向こう数週間はスパマーさんも来ないだろうし、しばらくは静かなサーバ
環境が維持できそうです。ただ、なんとなく、検索エンジンのクローラーが大拳
して押し寄せてくるような気はしますが。
 

タイトル変わるIPアドレス
記事No1274
投稿日: 2008/07/02(Wed) 23:05
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1250
今回は率直に言って何があったのかよく分かりません。
どうもルータが勝手にリブートしてしまったみたいなのですが、過去、ハードウ
ェア的に電源をOFF/ONしたときもソフトウェア的にリブートしたときもIPアド
レスは変わらなかったので、もしかしたらちょっとまずい状態なのかも。

7月2日の朝、定例のサーバのログ監査を行いました。
この時、各検索エンジンのクローラーからのアクセスが完全にゼロであることを
確認。ただ、この時は、あれっ、と思っただけで、そのままスルーしてしまった
のです。なぜなら、ここ数日、クローラーからのアクセスが著しく減っていたか
らです。具体的には、

> 環境が維持できそうです。ただ、なんとなく、検索エンジンのクローラーが大拳
> して押し寄せてくるような気はしますが。

前回のIPアドレス変更から数日たって、googleからは1日に1000回以上、
msnからも1日に100回以上のアクセスがありましたが、月末になってからは、
日に5回といったところに落ち着いていたからです。また、百度やyahooに至って
は、前回の変更後からの合計がほんの数回といったような感じ。このような状況
では、朝の8時間ぐらいでアクセスが全くなくても、確率的には十分に起こりう
る状況だと判断してしまったのです。

夜になって、つまり、つい先ほど、恒例の月1回のサイト更新を行いました。
今回は、#1247で予告していましたが、Vzの部屋にマクロを1件掲載しただけ。
本当に些細な更新だな。
この際にサイト全体をチェックして、再びIPアドレスが変わってしまっている
ことに気がつきました。1時間に1回動作するように設定してあるIPアドレス
変更検知ツールのログでは、7月1日の20:50に変更を検知しています。サーバの
ログでは、20:11に旧のアドレス宛にクローラーが訪れていますから、約40分間
のあいだのどこかでIPアドレスが変わってしまっているものと思われます。
でも、こんな時間はまだ宵の口。とてもネットワーク工事があるとは思えません。
念のため、地主のメンテナンス情報も確認しましたが、工事・故障情報ともにあ
りません。ルータのログに何か残っていないかな、とも思いましたが、残念なが
ら、その後に記録された情報が多くて、該当の時間のデータはプッシュアウトさ
れてしまっていました。
が、何気なく、ひょいとルータが起動してからの連続稼動時間のところを見たと
ころ・・・あれ?・・・逆算すると・・・なんか、昨日の20:20頃、ルータがリブ
ートしているみたい。うむむ、原因はこれか。
でも、その時間、停電も無かったし、いったい何が起こったのかは全く不明。
なんか気味が悪いな。また何日かしたら自動でリブートが走ってIPアドレスが
変わってしまうのかな。
 

タイトルRe: ネットワーク障害'08
記事No1305
投稿日: 2008/07/10(Thu) 00:36
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
サーバそのものが止まってしまったのは、5月の下旬以来ですから、約40日ぶ
りですかね。頻度的には、この程度であれば家主としてはおおむね満足ですが。
ご利用の皆様にはご迷惑をおかけして申し訳ありません。

7月9日、16時ごろにはまだサーバが正常に運行できていた事を会社で確認し
ています。今日は東北地方某所の変な故障に巻き込まれてしまったため残業にな
ってしまい、帰宅できたのは22時半頃。そこで青画面確認。リブートで回復。
回復後に確認したところ、最後の正常応答は17時過ぎでしたから、停止時間と
しては約5時間半といったところでしょうか。
ここ4日ばかり、googleのクローラーから、1日あたり1500回以上の、うち
の貧弱なサーバからすれば猛烈といっていいようなアタックを受けております。
きちんと25秒間隔でアクセスしてくるというのが数時間にわたって続き、少し
休憩というかしばらく間が開いて、それからまた25秒間隔、と言った感じです。
今回、落ちる直前にはgoogleの他に、msnのクローラーも来ていて、こちらは数分
に1回なんですが、たまたま同時に来てしまったために瞬間的に負荷が高くなっ
たせいではないか、という気がしています。
うぅん、これから暑い季節になるけど、また冷却ファンを用意しないとダメかな。


さて、今回の直接の原因は上に書いた通りなんですが。
実は数日前からちょっとおかしな事が起きています。
ノートパソコンでサーバを運用しているので、UPS内蔵のようなものなので、
停電が起こっても回線が停まってもサーバの電源は即時に落ちる事はないと安心
しきっていました。ところが、数日前より、内蔵バッテリーの残量がゼロを指し
示しているのです。どうも、内蔵バッテリーのヒューズが飛んだみたい。以前も
似たような状況が起きて、その時はバッテリーも寿命だろうという事で、ベイサ
ンのバッテリーリフレッシュサービスでバッテリーを新品にしてもらって、併せ
てヒューズも新調してもらったのですが、今度もヒューズだとすると、ちょっと
寿命が短すぎる。だって、前回から2年ちょっとしか経っていないのですから。
しかも、最初のヒューズはシャープ純正だけど、今度のヒューズはベイサンオリ
ジナルというか、バッテリーの専業メーカーが選んだ製品ですから、少なくとも
純正よりは長持ちする事を期待していました。
もしかして、充電器とか充電制御回路とかの方に問題があって、簡単に過電流が
流れてしまうような作りになっているのでしょうか。仮にそうだとすると、これ
はかなり問題だけど、ユーザとしてはどうしようもないなぁ。
 

タイトルRe^2: ネットワーク障害'08
記事No1307
投稿日: 2008/07/10(Thu) 21:06
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1305
連日のサーバ停止、本当に申し訳ありません。
今日は特に、「うわ、やっちまった」状態でして。

通常、日勤の時は、朝、6時半頃に家を出ます。今日もそうでした。
出社前、6時20分頃にサーバの状態を確認した時は、元気に動いておりました。
ところが、会社について、9時前ぐらいに状態を確認したら既にアクセス不能。
帰宅したら例によって青画面。リブートで回復は19時30分頃。
回復後にログを確認したら・・・なんと最後の正常アクセス記録は6時25分頃。
うげげ。何というタイミング。

本当にごめんなさい。
 

タイトルRe: ネットワーク障害'08
記事No1368
投稿日: 2008/08/03(Sun) 19:39
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
今回はかなり珍しいパターンでした。

8月2日〜3日にかけて、自宅から約500メートルほど離れた丘の上で野宿し
ていました。もしかしたら、市内の標高最高点かもしれない。仲間内というか、
さる業界筋では「FD」と略称される、とあるイベントに参加していたのです。

3日の16時ごろ、帰宅してすぐにサーバのディスプレイを見ても、特に青画面
なっているような事はありませんでした。いつものスクリーンセーバーで、画面
が真っ暗になっています。が、ここでなんとなくピンと来たんですね。ポチッと
キーボードに触ってみたのです。すると、なんとセーフモードでscandiskが動い
ていて、エラーがあるとかで人間からの入力待ちで停まっておる。とりあえずエ
ラーは修復を選んだのだけど、今度はそこで、なんか停まってっぽい。ハングア
ップしているわけではないのだけど、プログレスバーが右端まで達したところで
なんか無限待ちみたいな状況。仕方ないのでキャンセルを押して、スタートメニ
ューで再起動をかけて、やっとの事で復旧。これが16時半近く。

復旧後、ログを確認したところ、最後の正常動作は午前3時55分頃。というこ
とで、停止時間としては約12時間半。だけど、停止の引き金となったと思しき
怪しげなアクセス履歴はなし。時間が時間だから、あんまり熱暴走って事もなさ
そうだし、停電だの落雷だのって事もない。そもそも、勝手にセーフモードに入
っていたというのが気に食わない。これはつまり、勝手にリブートが走ったとい
う事なんだろうけど、バッテリが死んだノートパソコンなわけだから、ATXな
マシンと同じで、仮に停電があっても自動で復旧するわけはない。連続運用時間
としては、7月の末頃に一度、意図的にリブートをかけているので、まだ一週間
にも満たないはず。その前は3週間も連続運用できていたわけだし。

う〜む、謎だ。
 

タイトルRe: ネットワーク障害'08
記事No1369
投稿日: 2008/08/06(Wed) 22:31
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
こんなに長時間倒してしまったのは随分久しぶりです。
ごめんなさいごめんなさい。

8月5日は宿直でした。
いつもなら会社についてすぐに自分のパソコンを立ち上げるのですが、雷の影響
その他でむちゃくちゃ忙しく、やっと立ち上げられたのが20時過ぎ。そして、
ここが倒れている事を検知。これは困った。6日は仕事が終わってもすぐに帰れ
ないからです。昼過ぎから某国家試験を受験する事になっているのでした。が、
夜の間にちょっと勉強しようかな、と思っていたのが全くそんな時間は取れず。
群馬・栃木方面の落雷の影響で一睡もできないほどの忙しさ。そんな状況で試験
を受けに行くというのも無謀だけど、実はこの試験、過去に3〜4回落ちている
ので、今更1回ぐらい不合格実績を積み重ねても痛くも痒くもないというか。

で、試験を受けて帰宅したのが6日の16時すぎ。
お馴染みの青画面、リブートで回復。なんとか回復させたところでいよいよ精根
つき果て、そのまま爆睡。さっき起床してからログをチェックしたところ、落ち
る前の最後の正常アクセスは5日の18時45分頃。これはおそらく、久志本さ
んからのアクセスではないかな。一応、ログ上では、最後のアクセスに対しては
正常応答を返した事になっているけど、本当に正常だったかどうかは不明。結局、
サービス中断時間としては21時間半くらい。

やっぱり、暑い季節になって、落ちる頻度が上がっているようです。
24Vファンを低電圧駆動で送風してはいるのですが、冷却が追いついていない
のかもしれません。もうちょっと電圧を上げてみようかな。
 

タイトルRe^2: ネットワーク障害'08
記事No1370
投稿日: 2008/08/07(Thu) 07:04
投稿者久志本克己
レス元1369
> 最後の正常アクセスは5日の18時45分頃。これはおそらく、久志本さ
> んからのアクセスではないかな。一応、ログ上では、最後のアクセスに対しては
> 正常応答を返した事になっているけど、本当に正常だったかどうかは不明。
はい、あたりです。ちなみに正常応答でした。
しばらくしてから再読み込みかけたら落ちてました。

タイトルRe^3: ネットワーク障害'08
記事No1371
投稿日: 2008/08/07(Thu) 11:53
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1370
> しばらくしてから再読み込みかけたら落ちてました。

いつもいつもご迷惑をおかけしています。
まさか、アクセスしないで下さい、とお願いするわけにも行きませんし。
サーバを公開している以上、それは本末転倒。

ということで、これに懲りず、気が向いたらアクセスして下さい。
 

タイトルRe: ネットワーク障害'08
記事No1418
投稿日: 2008/09/08(Mon) 23:51
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
しばらく安定運用していたのですが、久しぶりに長時間止めてしまいました。

9月8日、19時半頃に帰宅したときはブルースクリーンになっておらず、正常
に稼動していると信じ込んでいました。が、その後20分ほど経ってもHDDの
アクセス音が全く聞こえず。これは何かおかしいぞと、スクリーンセーバーを解
除してみたところが、#1212 と同様の scandisk の入力待ち。手動介入でサービ
ス回復は19:50頃。
復旧後にログを確認したところ、最後の正常アクセスは16:12頃。またもや、最後
にアクセスしていたのは久志本さんの模様。
うひぃ、ごめんなさいごめんなさいごめんなさい。

さて、なぜリブートがかかるのか疑問なのですが、何か情報を持っていないか、
弟に尋ねてみました。私の弟は派遣社員として東芝でノートパソコンの評価など
を行っていたことがあります。
弟によると、設定次第ではあるが、東芝製の VISTA マシンの場合、リカバリーし
た直後のデフォルト状態では、ブルースクリーンに落ちたら自動で再起動がかか
るような設定になっているとのこと。
この板塀のサーバは WinME なんですが、もしかして同様な設定になっているのか
な。であれば、scandisk を手動介入不要なように設定できれば自動再起動できる
のかもしれない。ただ、その方法が不明。不正な終了をしたときに scandisk な
しで再起動するという設定はあるようだけど、さすがにそれは恐い。もっとも、
ブルースクリーンのまま再起動できずに止まってしまっている確率の方が高いの
だけど、それでも自動的に再起動可能なように設定できれば、1割程度は救済で
きそう。



ということをつらつら考えていたら、メインマシンの PC-98 のHDDが故障を起
こした模様。んげげ、メールが300通近く吹っ飛んだ。200通近くはバック
アップがあるけど、約50通はバックアップがない。そのなかでも本当に重要な
のは10通に満たないのだけど、これは困った。サルベージは可能かな。
何とかサルベージしたら、次は領域の開放と再確保で代替処理を行って、なんと
かなるのかならないのか。なんともならないようならHDDの交換。ただ、ドラ
イブそのものはごろごろしているけど、あいにくと手ごろなサイズがないような
気がする。パーテーションの切り方とか工夫するはめになるのかな。
 

タイトルRe^2: ネットワーク障害'08
記事No1420
投稿日: 2008/09/11(Thu) 23:22
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1418
> な。であれば、scandisk を手動介入不要なように設定できれば自動再起動できる
> のかもしれない。ただ、その方法が不明。不正な終了をしたときに scandisk な
> しで再起動するという設定はあるようだけど、さすがにそれは恐い。もっとも、

エラーがあっても手動介入なしで自動的に修復して終了してくれるというコマン
ドラインオプションがあることはわかりました。ということは、異常終了の次に
起動する場合の scandisk にコマンドラインオプションが指定できればこの問題
は解決できる。けど、そもそも、レジストリかどこかで指定することが可能なの
かどうか。

> ということをつらつら考えていたら、メインマシンの PC-98 のHDDが故障を起
> こした模様。んげげ、メールが300通近く吹っ飛んだ。200通近くはバック

幸いな事に、メールに限らず、ほぼ全てのデータが復旧できました。
8月末の定期バックアップでほとんどを回復できたのです。
それ以降の分はサルベージしたのですが、必要なデータ量が少なかったために、
サルベージの成功率が結構高くて助かりました。
今のところ、失われた事に気がついているデータは、かなりどうでもいいような
メールが10通未満のみ。それと、8月11日付のめざらさんからのメールが、
もしかしたら本文で数バイトの欠落が発生したか、それとも欠落が発生していな
いか判別がつかないと言うくらいの状況になって、文脈で判断がつかなかったの
で、勝手に2バイトの欠落が発生したと判断して修正した、というのが今のとこ
ろの最大の影響。
でも、もし、今後色々と失われたデータがあることが発覚しても、もはや取り返
す事もできないだろうし、ま、いっか。
 

タイトルRe^3: ネットワーク障害'08
記事No1422
投稿日: 2008/09/14(Sun) 23:02
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1420
> 起動する場合の scandisk にコマンドラインオプションが指定できればこの問題
> は解決できる。けど、そもそも、レジストリかどこかで指定することが可能なの
> かどうか。

レジストリは全部洗ってみたけれど、どうもそれらしきエントリは見つからない。
システムに思いっきりビルトインされているのかなぁ。ちと残念。

> > ということをつらつら考えていたら、メインマシンの PC-98 のHDDが故障を起
> > こした模様。んげげ、メールが300通近く吹っ飛んだ。200通近くはバック

壊れたHDDは、手持ちの1GBクラスのものとしては入手順だと2番目ぐらい
のはずですが、多分、製造順では一番古いのではないかなぁ。返してくる文字列
から、どうやらSunのWS用のものらしいのだけど、購入したのはジャンク屋。
一応、コナー製。ただ、ケースはドライブとは別のジャンク屋から買ってきてい
たりする。CENTYRY CORPORATION とロゴが入っているけど、今でも秋葉館などで
大々的にHDDケースを商っている、あのセンチュリーのケースなのかな。

復旧方法は、入手順では1GBクラスとしては一番新しい、文太先生から譲って
もらったHDDをフォーマットしてバックアップから書き戻し。おおっ、壊れた
HDDに比べて10MBほど容量が増えてる。こりゃラッキー。

壊れた方のHDDは、当初予定通り、初期化して・・・と思ったら、どうやって
もクイックフォーマットになってしまう。ありゃ、SCSIボードをそういうよ
うに設定しておいたかもしれない。ボードの設定変更をしてもいいのだけど、そ
の手のフリーウェアで直接SCSIコマンドを発行してみることにする。
まず、どのくらい代替セクタが使われているかを見てみると、なんと、124セ
クタが全て使いきられている。うわぁ、これはもう寿命かな。とりあえず、初期
化して書き込み検査で論理フォーマットして・・・おや? エラーが無くなって
しまっている。念のため、再度 scandisk をかけても全くエラーなし。初期化前
は scandisk をかける度に読み取り不良セクタが増えて行ったのに、これはいっ
たいどうしたことだ。

推測なんですが、多分、磁性体が弱っていて、本当に純粋に読み取り不良が起き
ていただけなんでしょうね。なので、今回、初期化にあたって書き込み検査を行
ったために、一時的に磁力が増えて異常なしになったのでしょう。
という事は、頻繁に読み書きするような使い方をしていればいいけど、書いたら
書きっぱなしで滅多に書き換えないような、例えばバックアップ媒体にするよう
な使い方には適していないと考えられます。
うむぅ、もう一度メインのHDDとして実戦投入してみようかな。
かなり恐いけど。
 

タイトルRe^4: ネットワーク障害'08
記事No1423
投稿日: 2008/09/15(Mon) 22:21
投稿者Bunta
レス元1422
 えーと僕はとしきさんの教え子であることはあっても先生ではないので、文太
さんで宜しくお願いします(awk スクリプトも、読むとこまでまだたどり着いて
ないし。やれやれ)。ま、とにかく、HDが役だってくれたようで何よりです。
嬉しい。*^^*
 モノはやっぱり使われなくちゃですものね。速攻リカバリー、お見事です!

> 復旧方法は、入手順では1GBクラスとしては一番新しい、文太先生から譲って
> もらったHDDをフォーマットしてバックアップから書き戻し。おおっ、壊れた
> HDDに比べて10MBほど容量が増えてる。こりゃラッキー。

タイトルRe^5: ネットワーク障害'08
記事No1424
投稿日: 2008/09/16(Tue) 09:35
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1423
>  えーと僕はとしきさんの教え子であることはあっても先生ではないので、文太
> さんで宜しくお願いします(awk スクリプトも、読むとこまでまだたどり着いて

了解しました。
とりあえず、人にものを教える仕事に携わっていらっしゃるという事で、今回は
ご勘弁を。


さて、この枝の先頭である #1418 と同様な状況がまた発生してしまいました。
9月16日は宿直で夕方出社なので、まったりと寝坊していました。
それでも8時過ぎには起床したら、以下同文というか、その後20分ほど経って
もHDDのアクセス音が全く聞こえず。これは何かおかしいぞと、スクリーンセ
ーバーを解除してみたところが、同様に scandisk の入力待ちで停止。手動介入
でサービス回復は8時半頃。

復旧後にログを確認したところ、最後の正常アクセスは04:50頃。
ただ、最近はログの最後が正常アクセスで終わっている事が非常に多いのですが、
今回は珍しく、その後20分間にわたって異常応答を返し続けていたというログ
が残っていて、最後の応答履歴は05:15頃。ま、どっちにしろ、サービス中断時間
としては3時間半ぐらいですか。

うぅん、早くなんとかしたいなぁ。
 

タイトルRe^6: ネットワーク障害'08
記事No1425
投稿日: 2008/09/16(Tue) 22:25
投稿者Bunta
レス元1424
 技術的なことについてはさっぱりなので、空想して書いてみたりしてしまいま
す。

 やっぱり夏って、PCにとって辛い季節でないでしょうか、とりわけ昨今のマ
シンでは。もちろん旧8の頃だって(個人史でなく歴史的な意味で15年前?)、
雑誌とかには熱暴走とかあったけど、マシンが落ちるなんて経験なかった。とこ
ろが、 風物詩ですが、 はい、今年の文太マウスはけっこう落ちまくりました。
CoolOn オンでも。 室温がたった5度違うだけで、落ちる頻度が間違いなく上が
る。おい、お前は恒温動物の哺乳類か>文太マウス。

 そして、雷! 母屋の無線ラン、お亡くなり(1月前)。我が家のADSLモ
デム、お亡くなり、本日。ここ1カ月調子悪かったもの。実は高温を発していた
スプリッタのほうを疑っていて、しょうがないからムラウチいって高くて熱に強
いの買ってきてギャンブル的実験に出るか、と思ってたら、モデムのほうが完全
に死んでくれました。ラッキー! 
 さくっと交換。NTT東日本。今日電話してその日のうちに交換にやってくる
のだからけっこうすごい。もちろん、毎月レンタル量を払っているので無償(月
130円かな?)。この2つ、原因はよく分からないのですが、今日来たおじさ
んは、とりあえず、「寿命ですかねぇ? コンデンサが破裂するとかあるんです
か?」との質問に対して、「雷じゃないかなぁ」と。「時間が経って出る場合も
あるんですよ」と。ま、そう答えることにしているという雰囲気もあったけど、
まったくの嘘をついているという感じでもありませんでした。

 というわけで、やっぱ暑さと関係してるんじゃないのでしょうかねぇ。どっか
からの攻撃で負荷が多くかかっても、涼しければ、きっとそれなりに…。ぜんぜ
ん分かんないことをしゃべり始めてるぞ、おい。


タイトルRe^7: ネットワーク障害'08
記事No1426
投稿日: 2008/09/17(Wed) 23:58
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1425
>  技術的なことについてはさっぱりなので、空想して書いてみたりしてしまいま

私の方だって、きちんとログが残っているわけではないので、ほとんど妄想です。
御立派なサーバマシンと御立派なOSをそろえれば、かなり詳細なログが取れる
のですが、そこはそれ、ありあわせのマシンと軟弱なOSで遊んでいるわけです
から、信じられないほど低いところに限界があります。

>  やっぱり夏って、PCにとって辛い季節でないでしょうか、とりわけ昨今のマ
> シンでは。もちろん旧8の頃だって(個人史でなく歴史的な意味で15年前?)、
> 雑誌とかには熱暴走とかあったけど、マシンが落ちるなんて経験なかった。とこ

15年前と言ったら「バリバリチューン」なんて言葉ができてきたころだったか
と思いますが、確かに、メーカー謹製のマシンをそのまま使っている分にはほと
んど落ちなかったでしょうね。少しでもコストパフォーマンスのよいマシンを目
指した一部の人々の場合は、サードパーティ製のCPUに載せ換えたりとかクロ
ックアップを図ったりしたので安定性が犠牲になったでしょうけど。
最近は、メーカー製のマシンがそもそも安くないと売れないので、メーカーの方
で変なところをコストダウンして、結果として安定性が犠牲になっている事もあ
るようです。なんとなく「合成の誤謬」だの「進化の袋小路」という言葉を連想
してしまいます。

> んは、とりあえず、「寿命ですかねぇ? コンデンサが破裂するとかあるんです
> か?」との質問に対して、「雷じゃないかなぁ」と。「時間が経って出る場合も
> あるんですよ」と。ま、そう答えることにしているという雰囲気もあったけど、
> まったくの嘘をついているという感じでもありませんでした。

コンデンサのうち、電解コンデンサは、通電時間や温度に比例して劣化していき
ます。これは容量の減少という形で症状が表れます。結構きれいなグラフになっ
たはず。当然、設計時には、どれだけの容量があれば回路の安定性が確保できる
というところから逆算して、何度で何万時間使えてほしいから製造時にはこの容
量にしましょう、という設計を行います。ただ、使用時の温度は設計温度とは異
なるので、設計時間よりも長持ちしたり寿命が短かったりします。もちろん、部
品の個体差というのもありますし。
電解コンデンサ以外のコンデンサの寿命は、残念ながら把握していません。ただ、
破裂っていうのは、雷も含め、過電圧がかかった時ぐらいしか生じないような気
がします。
ちなみに、東京の多摩地区では、今年は例年になく雷の被害が多かったです。私
の担当しているオンライン回線の故障でも、傾向ははっきり見えていました。

>  というわけで、やっぱ暑さと関係してるんじゃないのでしょうかねぇ。どっか
> からの攻撃で負荷が多くかかっても、涼しければ、きっとそれなりに…。ぜんぜ

熱暴走の他に、コンデンサ以外の部品も含め、熱により劣化が促進されるという
面もあります。メインマシンのHDDは、多分、こちらのパターンでしょう。
このマシンが置いてある部屋はエアコンがないので、33度を越えたあたりで人
間の方が耐えられなくなり、メインマシンの電源を落して逃げ出してしまうので
すが、今夏は1回か2回、35度を越えるような時でも必要に迫られて使ってい
た事があります。
メインマシンのHDDに SCANDISK をかけている間、手持ち無沙汰だったので、
サブマシンでHDD復旧関係のサイトをネットサーフィンしていました。その際、
面白い記述を見かけました。HDDは熱に弱いという事で、冷却のために強力に
送風を効かせたHDDケースを自作してしまうような方でした。ところがその方、
ある時、とあるHDDメーカーの温度と耐用年数のグラフを見かけたそうで、そ
れによると、40度のところが寿命のピークで、連続運転で30年ぐらい持つ事
になっていたのかな。ところが、それを越えると急激に劣化して、60度だとわ
ずか5〜6年まで落ち込んでいたのだとか。逆に言うと、温度はあまり低すぎて
もいけないという事なんでしょうね。もっとも、通常使用では簡単に過熱してし
まうというのもあるでしょうが。
それを知って、その方、今度はHDDケースとサーバに使っているマシンを丸ご
と、恒温槽というほどのものでもないけどプラスチックのケースに格納し、その
ケース内部は熱帯魚用のヒーターとサーモスタットで30度を維持するようにし
ているのだとか。それを越える時は外気を導入するようになっているらしいので
すけど。
私もスキモノですから、本格的なサーバ運用を目指すのならそういう事を始める
かもしれませんが、手持ちのジャンキーなリソースでいかに遊ぶか、というのも
テーマの一つだったりします。ということで、これからもご迷惑をおかけする事
は多々あると思いますが、なにとぞよろしくお願いします。
 

タイトルRe^8: ネットワーク障害'08
記事No1431
投稿日: 2008/09/24(Wed) 10:03
投稿者Bunta
レス元1426
としきさん

 17日が最後ということは朝日方面からでは、ほぼ1週間ぶりに繋がったとい
うことかな。日野ケーブルがらみのようですね。下が原因みたいな感じを受けま
した。繋がったので、とりあえず早速の書き込みをしておきます。そう、月曜に
職場からは繋がったのです。

> ちなみに、東京の多摩地区では、今年は例年になく雷の被害が多かったです。私
> の担当しているオンライン回線の故障でも、傾向ははっきり見えていました。

タイトルRe^9: ネットワーク障害'08
記事No1432
投稿日: 2008/09/24(Wed) 22:05
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1431
> した。繋がったので、とりあえず早速の書き込みをしておきます。そう、月曜に
> 職場からは繋がったのです。

いやぁ、今回は本当にネットワーク障害の名前にふさわしい障害でした。
とにかく、サーバのログを見ている限りにおいては、全く異常がなかったのです。
通常時でも、1日あたりのアクセス数は2割〜3割程度の変動は当り前ですので、
さすがに50%減の日が2〜3日も続けば気がついたかもしれませんがそんな事
は全くなく、誤差の範囲内と判断していました。検索エンジンのクローラーから
のアクセス量はほとんど変動がないし、それどころかスパマーからのアタックに
いたっては、故障発生以前の倍に増えている始末。
逆に、こちらからのアクセスであちこちに繋がらなければそれでも気付けたので
すがそういう事もなく、ほとんどの相手には繋がっていたというのも発覚の遅れ
た原因でした。



え〜と、ほとんどのお客さんは何の事かわからないと思います。
なにせ、家主自身がなかなか気がつかなかったのですから。
ということで、とりあえず今回のまとめ。

・ごく一部の相手から、この板塀に接続できなかった
・障害発生期間は9月17日ごろ〜9月24日早朝
・原因は地主の網内設備故障(詳細不明)
・24日早朝の地主による緊急メンテナンスで回復した模様

よくわからないのは、「ごく一部」の相手とのみ、通信が不調だった、という点。
素直に考えると、細い経路が1ルートのみ障害発生、という事になるのですが、
経路数というのはコストに直結するので、プロバイダとしては、たくさんの細い
経路に分散するはずはないのです。ん〜、ハードウェア故障ではなく、ソフトウ
ェア的な故障なのかなぁ。
その他、私の知っている範囲で可能性のありそうな原因としたら、リンクアグリ
ゲーション(LAG)で複数のポートを束ねているルートのうちの1本で障害発
生、というシナリオがありうるかな。LAGの場合、振り分けアルゴリズムによ
っては、IPアドレスとかMACアドレスが特定のパターンに合致した場合のみ
障害が発生する可能性があるので、なんとなくそれっぽい気がしないでもない。
でも、その場合、故障しているポートのみ閉塞すれば済む話なので、多分ハズレ
だなぁ。

回復措置についても、やや不満。
通常、ユーザ影響のある故障であれば、えいやっとリブートをかけてしまうべき
だと思うのですが、それをしていないという事は、ほとんどのユーザには影響が
出ていなくて、逆にリブートをかけると全ユーザに影響が出てしまう、というこ
とぐらいしか考えられません。確かに、私自身、言われるまで影響があることに
気がつかなかったわけですから、この判断はアリだと思いますが、でもねぇ。

ということで、これからも懲りずに遊びに来て下さい。
 

タイトルRe^10: ネットワーク障害'08
記事No1433
投稿日: 2008/09/24(Wed) 23:46
投稿者まっちゃん
レス元1432
詳しいことは私には分からないのですが,ここ数日,としきさんや久志本さんにオアポケのことをいろいろとお聞きできないというのは寂しいものでした。

ネットワーク障害の復旧がいつになるか分からないし・・・ということで,少しでも自分で勉強しなければ,という思いになり,アマゾンで出ていた「DOSユーザのためのOASYS Pocket3 DOS環境パワーアップガイド」を購入することにしました。もうそろそろ到着する予定です。

でもまた色々とお尋ねするかもしれません。どうぞ,よろしくお願いします。

タイトルRe: ネットワーク障害'08
記事No1482
投稿日: 2008/10/23(Thu) 16:40
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
どうしても、1ヶ月から1ヶ月半に1回程度はサーバが落ちてしまいます。
たまに意識的にリブートをかけているので、連続運用としては2週間くらいかな。

10月22日も宿直でした。
夜遅く、会社からの死活チェックでサーバへの接続不可を検出。
翌23日、11時半頃に帰宅したら久しぶりの青画面。
すぐにリブートしてもよかったのですが、ちょっといろいろと実験したいことが
あり、実際に回復したのはなんとかぎりぎり午前中。
復旧後にサーバのログを確認したところ、21:58には異常応答を返しているのだけ
ど、その後、22:04には正常応答を返している。ただ、それが最後。また1時間に
1回、毎時5分に動作するようにタスクスケジューラーに登録された回線の接続
性チェックバッチですが、最後に動作した記録が21:05であり、22:05には起動し
た形跡がないので、どうもそのあたりで落ちてしまった模様。ということで、サ
ービス中断時間は約14時間。

さて、帰宅してから何を実験していたかというと、どうやってサーバが落ちてい
ることを検出するか、ということ。正攻法で考えると、WEBサーバですから、
HTTPで応答がなければ落ちていると判断すればいいのですが、うちの場合、
実にしょうもない理由からこれは避けたい。どんな理由かというと、ログが残っ
てしまうから、というもの。例えば、1時間に1回アクセスチェックをしたとす
ると、1日で24回。ところが、うちのサーバの1日平均アクセス数、検索エン
ジンのクローラーからスパマーまで全てひっくるめて、純粋な掲示板のみへのア
クセス数が200回程度、タイトル画像やらCSSファイルやらをを全て含んで
も500回から600回といったところ。そんなところに24回もアクセス増え
たら、なんと5%ですよ!
では、ということで、ネットワークでの死活チェックの基本のping。これなら、
通常ではサーバ側にログは残りません。ところが、これ、以前実験したところに
よると、青画面だろうがscandisk出停止中だろうが、pingの結果はOKになって
しまうのです。これでは使えません。
次に考えたのが、1時間に1回動いている回線チェックバッチがあるのだから、
これにFTPも組み込んで、push型でなんかのデータをどっかのサーバにアップ
ロードする、というもの。そのデータの時刻チェックをして、1時間以上更新が
停まっていればサーバ障害発生中途判断するというもの。ところがこれも、青画
面でWindowsそのものが停まればアップロードも止まりますが、リブートがかかっ
てscandisk状態に落ちた場合は、Windowsそのものは動いているわけですから、ア
ップロードは正常に行われてしまうのですね。ということで没。

さらに考えて、現段階で採用しようと考えている方法は、timeプロトコルで時刻
取得が失敗すればサーバがコケていると判定しようというやり方。timeサーバは
自作でして、一切ログを残しませんから、前提条件は満足します。青画面の時は
当然止まりますし、scandiskの時も、スタートアップに放り込んであるツールが
起動する前のリブート直後のタイミングという形になるわけですから、やっぱり
接続不可です。と、机上ではそう思っていたのですが、はたして本当にそうなる
のかを実験していた、というのが真相です。
さて、結果なんですが、今のところは私の思った通りになっていますので、当面
はこの方法でなんとかできるか工夫してみたいと思っております。
 

タイトルRe: ネットワーク障害'08
記事No1485
投稿日: 2008/10/27(Mon) 02:23
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
頻繁なサービス中断を起して申し訳ありません。

10月26日は日曜日にも関らず出勤日でした。
朝9時過ぎの会社からの死活チェックには元気元気。
ところが、13時過ぎの死活チェックには応答なし。
とっとと帰宅して状況を確認したかったのですが、こういう時に限って仕事が山
のように押し寄せてくるもので、結局残業4時間。帰宅したのは日付も変わって
27日になってから。
自室に入って、まず「あれ?」と思った事は、HDDがカリカリと動いている事。
いつもの青画面で停まっている時も、scandiskの入力待ちで停まっている時も、
通常はHDDは停止しています。という事は、もしかしてサーバは正常で、単に
会社とのネットワークの経路の問題が生じていただけ?
と思ったのだけど、残念、ディスプレイを確認して見たところ、最近多くなって
きたscandiskの入力待ちでの停止状態と判明。ということで、手動介入で回復。
回復後、ログを確認したところ、サーバが落ちたのは26日午前10時半すぎ。
回復は27日0時半すぎですから、サービス中断時間としては約14時間。

ほんと、いつもいつも御迷惑をおかけします。
 

タイトルRe^2: scandiskの不具合?
記事No1486
投稿日: 2008/10/28(Tue) 01:34
投稿者konno
レス元1485
> と思ったのだけど、残念、ディスプレイを確認して見たところ、最近多くなって
> きたscandiskの入力待ちでの停止状態と判明。ということで、手動介入で回復。

これ、サーバーがWinMEでしたよね。再起動時の自動scanでハングアップする現象はうちでも
ありました。どうも McAfee VirusScan の不具合っぽいです。
ここのサイトから引用すると、
http://internet.watch.impress.co.jp/www/article/2003/0326/mcafee.htm

 マイクロソフト株式会社は、「McAfee VirusScan 5.1」がインストールされている環境下で、完全なスキャンディスクを行なうとPCがハング(応答を停止)する不具合を発表した。対象となるOSは、Windows ME/98SE/98となっている。

 この問題は、[完全]を選択してスキャンディスクを行なうとPCがハングすることがあるというもの。スキャンディスクを行なう際にMcAfee VirusScan 5.1のプログラムが動作中の場合に発生するという。

 同様に、PCを正常にシャットダウンしなかった場合には、次回起動時に自動的にスキャンディスクが行なわれるが、この自動で行なわれるスキャンディスクの時にも、同じ現象が発生する可能性がある。なお、起動時に行なわれるスキャンディスクがこの症状で停止した場合に改めて再起動すると、またこの不具合が発生する可能性があるため、一度Safeモードで再起動し、[スタートアップ]フォルダにあるMcAfeeのショートカットを無効にする必要があるとのこと。

 問題を回避するためには、スキャンディスクを行なう際に[標準]を選択するか、システム設定ユーティリティー「Msconfig.exe」を使用して、[スタートアップ]フォルダにあるMcAfeeのショートカットを無効にする方法がある。


という記述があります。うちもこの現象に悩まされて、スキャンが始まったらすぐに「ESC」でキャンセルし、
後でスキャンしなおすようにしてました。(^^;
もし外していたらごめんなさい。

タイトルRe^3: scandiskの不具合?
記事No1487
投稿日: 2008/10/28(Tue) 10:28
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1486
> ありました。どうも McAfee VirusScan の不具合っぽいです。

うげ、マカフィーはうちのマシンにも入っていたはず。
でも、ハングアップするわけではないので、状況は異なります。
それに、最近はAVGを使っているはず、と思って確認したところ、とりあえず、少
なくとも現時点では常駐はしていない。スタートメニューからマカフィーを起動
させようとしたら、うわ、青画面になった。でもリターンで復旧。と思ったら、
再び青画面。再度リターンで復旧して、やっと起動。いやぁ、心臓に良くない。
AVGあたりと競合したのかな。でも、とりあえず起動はした。
履歴を確認したところ、最後のウイルスチェックは2007/02/29。そうだよなぁ、
確かその頃、AVGを導入したんだものなぁ。さらに、バージョンもチェックしたの
ですが、該当のバージョンではないことも確認できました。

どうもお気遣いありがとうございました。
 

タイトルRe^4: scandiskの不具合?
記事No1488
投稿日: 2008/11/01(Sat) 00:43
投稿者konno
レス元1487
> うげ、マカフィーはうちのマシンにも入っていたはず。
> でも、ハングアップするわけではないので、状況は異なります。

あ、ハングアップというより、scandiskがいつまでも終わらず、先に進まないという症状でした。
いずれにしても、とりあえず再起動時には自動scanしないようにして、後でやるようにしたほうが
良さそうに思います。

どうも、MEのバグのような気がするんですがねぇ。(^^;

タイトルRe^5: scandiskの不具合?
記事No1489
投稿日: 2008/11/02(Sun) 10:42
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1488
> あ、ハングアップというより、scandiskがいつまでも終わらず、先に進まないという症状でした。

いつまでも終わらない、と言うわけではないんですよ。
「エラーがありました。どうしますか?」
と入力を求められて、いつまでも入力待ちで待っている、という状況なんです。
ここで人間がボタンを押せば、きちんと終了まで持って行ってくれます。

> いずれにしても、とりあえず再起動時には自動scanしないようにして、後でやるようにしたほうが
> 良さそうに思います。

う〜ん、そうすると、自動で再起動がかかった事に気がつかず、いつになっても
scandiskをかけない、という事になりそうな気もしています。


現在、妄想しているのが、サーバのサービス停止時は自動でミラーに切り替わる
ようにする、というもの。要素技術は8割方確立できたので、残り2割で足元を
すくわれるようなことがなければ、現有リソースでも導入できそうです。もちろ
ん、リソースの方を充実させて、難しい技術は導入しない、という方が素直です
けどね。
なお、ミラーの方は書き込みはできないようにします。現在ログの閲覧専用。
 

タイトルRe^6: scandiskの不具合?
記事No1490
投稿日: 2008/11/04(Tue) 01:23
投稿者konno
レス元1489
> > あ、ハングアップというより、scandiskがいつまでも終わらず、先に進まないという症状でした。

すみません、思い出してみると、やっぱりハングしてたかも。scandisk起動直後に「ESC」でキャンセル
できましたが、ちょっともたつくと、もうキャンセルできなかったような気がしました。
設定で標準を選んでも利いてない気がしました。なので、MEのscandiskのバグではないかと
思っているわけです。Win98ではそういうことがなかったので。

ウィキペディアのスキャンディスクの注意事項に
http://ja.wikipedia.org/wiki/%E3%82%B9%E3%82%AD%E3%83%A3%E3%83%B3%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AF
常駐プログラム(ウイルス対策ソフト・スクリーンセーバー等)はできる限り停止しておくべきである。
仮に常駐プログラムが検査中に実行した場合には動作が不安定になる可能性がある。 

とあるので、うちのはこの状態だったのかもしれませんね。

> 「エラーがありました。どうしますか?」
> と入力を求められて、いつまでも入力待ちで待っている、という状況なんです。
> ここで人間がボタンを押せば、きちんと終了まで持って行ってくれます。

う〜む、やはりうちとは違うようですね。でも、先に進まないのはいっしょですね。

> う〜ん、そうすると、自動で再起動がかかった事に気がつかず、いつになっても
> scandiskをかけない、という事になりそうな気もしています。

これはスタートアップの最後でログとかを開いておくだけでいいのでは。タスクバーでわかるでしょうし。

> 現在、妄想しているのが、サーバのサービス停止時は自動でミラーに切り替わる
> ようにする、というもの。要素技術は8割方確立できたので、残り2割で足元を
> すくわれるようなことがなければ、現有リソースでも導入できそうです。

おお、さすがはとしきさん。こちらのほうが面白そうですね。(^^;


タイトルRe: ネットワーク障害'08
記事No1492
投稿日: 2008/11/08(Sat) 00:36
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
どうもよろしくないですな。
これは、とっととバックアップ体制を整えろというお告げなのか。

11月7日、朝、会社からアクセスした時は正常に応答がありました。
が、夕方に確認した時には応答なし。でも、もともと残業の予定が入っていたの
で、とっとと帰るというわけにもいかん。20時半ぐらいに残業を終えて、カッ
プめんを1個食べてから会社を出たのが21時過ぎ。帰宅したら23時。状況は
お馴染みの青画面。リブートで回復。
再起動後にログを確認したら、最後の正常応答は午前10時過ぎ。ということは
サービス中断は約13時間。今回はちょっと長いなぁ。最近は、月間のサービス
中断時間が24時間までなら容認しようか、というような気になってきています
が、月の上旬でその半分を越えてしまうと、さらに基準を緩めないといかんかな。
   

タイトルRe: ネットワーク障害'08
記事No1496
投稿日: 2008/11/30(Sun) 21:44
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
今日はかなり肝を潰しました。サーバマシンが物理的に壊れたかと思ったのです。 

このサーバマシン、回線障害検出のために、1時間に1回、毎時05分に自動で
検出ツールが起動するようになっています。この時、仮にHDDのモーターが停
止状態であっても、自動的に動き出します。ところが、30日19時過ぎ、待ち
構えていたにも関らずモーターの動作音がしません。
おやっ、と思ってサーバマシンを見てみましたが、外見では全く異常がありませ
ん。LEDは動作中を示すものと100V給電を示すものの2つがきちんと点灯
しているし、液晶画面はいつも通りの無地のスクリーンセイバー状態。これはま
た、いつも通りというか、よくあるscandiskの入力待ちに落ちてしまったな、と
思って、スクリーンセイバーを解除しようとキーボードに触って見たところが、
全く反応なし。ポインティングデバイスをぐりぐりしたりカチカチしても状況は
変わらず。
えぇいままよと電源ケーブルを引っこ抜いたら普通に電源断。内蔵バッテリーが
死んでいるので、これは当り前というか予測通りの動作。再度電源ケーブルを接
続したら、100V受電中のLED点灯。ここまではOK。ところが、この次、
電源スイッチを押しても起動してこない。各LEDの反応を見ていると、スイッ
チを押した瞬間、HDDのアクセスランプが一瞬だけ点灯し、あとは沈黙。
ひ〜、HDDがお亡くなりになったのか、マシン本体が悪いのか。

問題の切り分けのため、HDDを抜いて、USBアダプタを取り付け、他のマシ
ンに接続して見たところ、きちんとモーターも回って、中の情報も読み取り可能。
とりあえず、HDDが生きていることがわかって、かなりほっとしました。最悪
の場合でも、中のデータは丸ごと救出できるのですから。
でも、そうなると、悪いのはマシン本体。ん〜、何が悪いのかな。こうなると、
サービス回復は次の週末くらいかな、押入れの奥から予備のマシンを引っ張り出
さなきゃならないから。なんて事を考えながら、HDDを組み付けなおし、念の
ため再度スイッチを入れると、ありゃりゃん、立ち上がってきた。
あ〜よかった。でも、一体、何が悪かったのだろう。

再起動後、ログを確認したところ、13:20すぎを最後に沈黙。
サービス回復は20時ごろなので、サービス中断は6時間半とちょっと、といっ
たところでしょうか。

でも、ほんと、原因は一体なんだろう。そろそろHDDが寿命なのかな。
一応、この掲示板のログだけは何重にもバックアップをとってあるからそんなに
困ることはないけど、その他にもいろんなデータが入っているわけで、そういう
のはどうしようかな。
 

タイトルRe^2: ネットワーク障害'08
記事No1497
投稿日: 2008/12/01(Mon) 23:05
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshik/
レス元1496
追加情報。

> さなきゃならないから。なんて事を考えながら、HDDを組み付けなおし、念の
> ため再度スイッチを入れると、ありゃりゃん、立ち上がってきた。

いきなり電源をぶちっと落したにもかかわらず、立ち上がってきた時、scandisk
がかからなかったのですね。これはどういうことだろう。システム的には、わり
と安全な状態になっていたという事なのかな。



さて。
せっかく再起動で立ち上がったというのに、その後も多少不安定な挙動を示して
います。このツリーのルート、今年の最初の障害の時もそうですが、一度落ちる
と、数日間は不安定な挙動を示すようです。
12月1日早朝、起床したら青画面。出社しなければならないので、再起動して
そのまま出社。会社からの死活チェックでは、昼過ぎまでは正常だったのですが、
夕方は応答なし。帰宅したら、またも青画面。再度リブートで回復。
回復後にログを確認したところでは、12月1日早朝分については、何の前触れ
もなくというか、特に異常応答を返していた履歴もなく、ストンと落ちている。
最後の正常応答が午前1時になる数分前、回復が6時ちょっと前で、サービス中
断は5時間ちょうどくらい。
ところが、夕方の分については、なんか随分と異常応答を引きずっている。最初
に異常応答を返したのが15時過ぎ、最後に正常応答を返したのが16時40分
ぐらい。その後も延々と異常応答を返し続け、最後に異常応答を返しているのが
17時50分。ここでやっと沈黙。回復は19時半ぐらい。これ、停止時間はど
うしようかな。4時間半とするか、1時間半とするか。

今後も継続して、1日に何回も落ちるという事象が発生するようであれば、いよ
いよマシンを交換しなければならないかなぁ。でも、マシンそのものは何台もあ
るのだけど、どれもこれも今のマシンよりもうるさいからなぁ。どうしようかな。
 

タイトルRe^3: ネットワーク障害'08
記事No1498
投稿日: 2008/12/03(Wed) 00:18
投稿者konno
レス元1497
> 今後も継続して、1日に何回も落ちるという事象が発生するようであれば、いよ
> いよマシンを交換しなければならないかなぁ。でも、マシンそのものは何台もあ
> るのだけど、どれもこれも今のマシンよりもうるさいからなぁ。どうしようかな。

そこでマシンの静音化という新たなプロジェクトを立ち上げると。(^^;
ファンとHDDの音をなんとかできればそうとう静かになりますよね。
期待してます。(^_^)

タイトルRe^4: ネットワーク障害'08
記事No1499
投稿日: 2008/12/03(Wed) 23:38
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1498
> そこでマシンの静音化という新たなプロジェクトを立ち上げると。(^^;

立ち上げませんよ〜。

> ファンとHDDの音をなんとかできればそうとう静かになりますよね。

一番安直には、ノートPCあたりのFANレスなマシンを新規購入。
中古で2〜3万円のもので十分。
HDDとOSがついていれば、httpのデーモンをインストールするだけ。
それが一番楽ですから。
HDDがついていなければ、CFやSDを使ってゼロスピンドルマシンに仕立て
るのが一番静かだと思う。

手元にゴロゴロころがっているマシンは、ほとんどがデスクトップで、タワーが
1台あったかな、そういうのは何がうるさいってFANの音がうるさいんですよ。
冬の間だけならFANを止めておいても何とかなると思いますが、5月頃になれ
ばそうも行かなくなるはず。わざとクロック速度を遅くする、という手もあるか
もしれないけど。
 

タイトルRe: ネットワーク障害'08
記事No1501
投稿日: 2008/12/16(Tue) 12:02
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1160
またこのパターン、というか。
12月16日は宿直明けでした。
明け方、午前4時ごろに会社からのチェックでアクセス不能であることを確認。
11時過ぎに帰宅したら、おなじみの青画面。リブートにて回復。
回復後にログを確認したところ、午前2時のちょっと前に正常応答を返している
のが最後。特にアクセス集中とか異常ログの痕跡はないので、今回も原因不明。
サービス中断時間としては9時間強。

うぅん、このツリーにつけるのは、今年はこれを最後にしたいんだけどなぁ。
あともう1回くらいあるかなぁ。
年内には、板塀高度化計画の一環として、サーバが落ちた場合のバックアップを
何とかできるようにしたいけど、はたして間に合うか。
 

タイトルRe^2: ネットワーク障害'08
記事No1503
投稿日: 2008/12/31(Wed) 22:32
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1501
> うぅん、このツリーにつけるのは、今年はこれを最後にしたいんだけどなぁ。
> あともう1回くらいあるかなぁ。

ありました。それも、暮れも押し詰まった大晦日に。

31日は出勤日でした。
出社しても、幸いなことにそれほど仕事もなく、自宅から持って行った物理メー
ルの処理なんかをしていたりしたのですが、夕方にサーバの状況を確認してみた
ところ、アクセス不能を確認。実は、正式運用には入っていなかったのですが、
ほんの数日前から、サーバがダウンしたことの自動検知機能とバックアップへの
自動切換機能を試験運用中でして、幸いというか、これがきちんと働きました。
もしかしたら見られた方もおられるかもしれませんが、「板塀の残骸」というペ
ージが表示されていたかと思います。あ、この掲示板に直接アクセスしていた人
はダメですよ。最近は直リンクされている方も少ないのであまりアナウンスして
いませんが、bbs.htmlからきちんとアクセスしている方なら大丈夫。なぜなら、
bbs.htmlを書き換えてバックアップに飛ばそうとしているわけだから。

裏から手を回して調べたところ、バックアップに切り替わったのは14時過ぎ。
自動検知の周期は1時間に1回なので、少なくとも13時過ぎまでは大丈夫だっ
たはず。

勤務が終わって、19時半頃帰宅。
ちょっと見には、サーバマシンには異常なし。が、触ってみて発覚。
#1496と同じような状況に陥っていたのでした。
今回は、HDDを他のマシンに繋ぐことをせずになんとか復旧できないかと色々
やってみたのだけど、どうしてもうまく行かない。具体的には、HDDを外して
すぐに取付、とか、バッテリの取り外し・取付、内部メモリの取り外し・取付ま
で行ってみたのですが効果なし。とりあえず、先に夕食をとることにして、一旦
組上げました。電源だけは接続しておかなかったのですが。

さて、約1時間後、21時前くらいに戻ってきましたが、あと、やることといっ
たら、前回と同様に、HDDを他のマシンに繋ぐことくらいしか思いつきません。
が、その前にと、何の気なしに電源ケーブルを取り付け、電源ボタンを押したら、
あらら、普通に立ち上がってくるでないの。う〜ん、電源を外して放置しておい
たのが効果があったのかなぁ。

ところが、このあとにさらに話が続きます。
上記の自動検知機能、まだ試験運用中でした。
今回、たまたま、きちんと動くことが実証されてしまったので、正式運用に入れ
ようと思いました。そのために、その装置の電源の引き回しを変更しようとして、
うっかり、サーバマシンの電源線に触ってしまいました。結果、サーバマシンは
いきなり電源断。すぐに電源再投入しようとするも、またもや全然立ち上がらず。
何やってんだか。

ここまでくると、なんとなく、既にお亡くなりになっている内蔵バッテリーが悪
いのではないかという気がします。そこで、電源ケーブルを外し、バッテリーを
外して待つこと5分。再度組上げて電源を投入すると、無事に起動。なるほど、
やっぱりそのあたりが原因なのね。

とりあえず、1ヶ月の間隔で2回発生というのが気になります。
今後、頻度が上がるようだったり、あるいは毎月必ず月末に発生する、というよ
うな傾向があるなら、いよいよサーバマシンの更改に踏み切らざるをえません。
ただ、手持ちのマシンは大量にあるのだけど、現状のサーバほど静かで、かつ、
場所をとらない物って他にはないんですよねぇ。うぅ、どうしようかな。

なお、ダウン検知機能と切換機能については、そのうちに、簡単な解説を書きま
す。誰も期待していないでしょうが。
 

タイトルRe^3: ネットワーク障害'08
記事No1504
投稿日: 2009/01/01(Thu) 07:51
投稿者めざら
参照先http://homepage3.nifty.com/mezala/
レス元1503
あけましておめでとうございます。

「倒壊中」が出てしばらく復帰しないので,ああ,仕事中なんだな〜,大晦日に大変だな〜と思っていました。

今年もよろしくお願いします。

タイトルRe^4: ネットワーク障害'08
記事No1505
投稿日: 2009/01/01(Thu) 17:30
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1504
どもども、新しい年になってしまいました。本年もよろしくお願いいたします。
昨年は、この掲示板も、千客万来とは言わないまでも、十客百来くらいに賑って
いましたが、今年もスローペースでのんびりやっていきたいと思います。

> 「倒壊中」が出てしばらく復帰しないので,

自動切換機能を導入したので、今年は、これがきちんと機能した時は、ネットワ
ーク障害のツリーを起さないようにしようかな、なんて考えています。つまり、
暫定で、かつ、制限があるとはいえ、サービスが中断していないのだからいいん
じゃないか、という甘い考えが根底にあります。特異的な故障とか長時間故障の
場合はきちんと報告しますけど。もちろん、切換がうまく行かなかった時も。
#少なくとも、新幹線が停まるに比べたら影響は極微

ちなみに、本格運用に移行したといいつつ、この自動切換、いろいろとチェック
したら、細かいところでまだまだ問題が残っていることが判明。バックアップ側
のスクリプトが古くて携帯電話からのアクセスに対応していないとか、サーバの
停止と自宅のIPアドレスの変更が同時に起こると復旧時に自動的に破綻すると
か、問題山積。この辺を修正してからが、真の本格運用ですかね。

> ああ,仕事中なんだな〜,大晦日に大変だな〜と思っていました。

新年も、2日〜3日にかけてが宿直だったりします。
4日と6日は休みですが、5日は出社。
うちの職場の場合、仕事始めって、仕事が溜ってるんですよね〜。
閏秒も、ほとんど影響はないとは言え、ほんのちょっとだけ関係あったし。