[リストへもどる]

一括表示

▼ HDDクラッシュ - としき@家主 2009/11/23 00:03 No.1665
  ┣Re: HDDクラッシュ - としき@家主 2009/11/23 13:21 No.1666
  ┗Re: HDDクラッシュ - としき@家主 2009/11/30 22:50 No.1669
   ┗Re^2: HDDクラッシュ - としき@家主 2009/12/06 00:48 No.1671
タイトルHDDクラッシュ
記事No1665
投稿日: 2009/11/23(Mon) 00:03
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
4日もサーバをとめてしまいました。お騒がせしました。

18日は、昼前に一度、サーバが停止しました。
意図しないサーバ停止としては6日ぶりのことでした。
15日の昼前に1回、メンテナンスのために5分程度、意図的に落としています
ので、連続運転としては3日となります。
#1650に書いたように、昼間にダウン検知メールが発信されたので、夜、会社から
の帰りがけに実家に立ち寄って復旧させました。これが19時半ごろ。
このとき、ちょっと勘が働いたのですよ。
普段なら、そのまま再起動させるだけなのに、システムモニタとリソースメータ
を立ち上げて、数日ほど様子を見てみようかなと思ったのです。
が、リソースメータはともかく、システムモニタを立ち上げたところ、なんとな
く怪しげな音がHDDからし始めました。「かつん、かつん」という感じの音。
本能的に、これはやばい、と思ったのですが、システムモニタを終了させたら、
異音も停止しました。なので、ちょっと不安も感じながらも、異音の発生原因は
システムモニタと判断し、リソースメータは起動させたままとしました。
その後、実家で夕食をご馳走になって、徒歩で30分以上かけて自宅に戻ったの
が21時ごろ。
ところが、それから1時間ほどたった22時過ぎ、再びサーバダウンを通知する
メールが発信されました。そこで実家にとんぼ返り。今度は車なので、10分は
かかりません。
サーバの様子は、見た目には、いつもの青画面。早い話が、数時間前と同じ状況。
そこで[CTRL]+[ALT]+[DEL]を押したところ、いつもと同じように再起動がかかっ
て・・・立ち上がらない。BIOS画面がふっと消えて、次に、通常であれば瞬間的
に消えるはずの「Starting Windows」のメッセージが画面左上に表示されたまま、
HDDが「かつん、かつん」と言っている。

この状況が何を表しているか、いくら私でもわかります。
その夜のうちの復旧はあきらめました。
とりあえず、板塀の残骸表示部に状況を掲示して、その日は帰宅しました。


復旧に当たっては、旧マシンは全くあてにしませんでした。
本当は、新しいHDDを旧マシンに入れて運行を再開させたかったのですけど、
リカバリCDが弟の部屋に食われている状況なのです。
別マシンはいくつもあるのですが、すぐに設定可能なものはノートマシンが2台
だけ。#1576の工人舎マシンと東芝その2マシンです。また、設置場所が、普段は
無人の旧自室なので、仮に音の大きいタワーマシン何ぞで復旧させた場合、家人
が何かの都合で部屋のドアを開けたときに驚くことは必定。という理由もあって、
ノートPCで仮復旧を行うことに決定。
では、どのマシンを使うか、ということですが、新居に移転するまでの暫定使用
とはいえ、一定の期間は張り付けっぱなしになるわけですから、なるべく日常の
使用頻度の低いものを選ぶ必要があります。そこで、英語キーボードなマシンを
この任に当たらせることにしました。
実は、入手した当初は気がついていなかったのですが、このマシン、似非英語キ
ーボードだったのです。どういうことかというと、弟が変な改造をしたせいで、
キーボードの刻印は英語キーなのですが、OSは日本語キーと誤認しているので
す。結果、刻印と実際に入力されるものが異なる上に、一部、どうやったら入力
できるのか不明なキーがあるという、実に使いにくいマシン。

20日の夜から21日いっぱいをかけて、サーバ用としての最低限の調教を施し
ました。
まず、自動で電源が落ちたりしないように、といったハードウェア面の設定。
次に、サーバソフトは今まで使っていたものと同じものを使おうと思ったのです
が、これがVista非対応。WEBで調べても、対応していないという記述はいくつ
か見つかるのですが、動いたという記述はほとんどない。でも、皆無でもない。
試行錯誤の結果、サービスとして動作させることは無理なようですが、アプリと
してなら動作可能なようなので、そのように設定しました。
それから、Perlのインストール、などなど。
さらに、Vistaなので、セキュリティが強化されたファイアウォールの設定を変更
して、ポートを開ける必要もあります。ここまでやって、他のマシンから正常に
アクセスできることを確認しました。

22日は、午前中は某国家試験。
午後から、ノートマシンを抱えて実家に乗り込みました。
まず、旧マシンから、どの程度のデータを救出できるかを試みました。
が、なんと、時間は相当かかりましたが、必要なデータはほぼ救出できました。
現時点で失われてしまったことに気がついているのは、JPGファイルが2つと、
ほとんど使っていない某フリーウェアの実行ファイルが一つ。このフリーウェア、
説明書やら.iniファイルやらは救出できたけど、新しいバージョンが出ているか
もしれないし、すっぱりと整理してしまおう。画像ファイルのほうも、どこかに
はバックアップがあるような気がする。


ということで、22時半前に、ほぼ4日ぶりに板塀が立ち上がりました。
やっつけで立ち上げたものなので、これから設定したいものが多数あります。
ファイル交換用のNFSサーバもなければFTPサーバもまだなので、母艦との
ファイルのやり取りが全くできません。
回線の通信途絶検出やバックアップサーバ(ニフティ)へログ転送を行わせてい
るツールも動いていません。さらに、サーバのダウンを検知してバックアップに
切り替えるシステムも動作しないようになっています。今度のマシンは旧マシン
に比べれば頑丈なOSなので落ちにくいというのはあると思いますが、意図せず
ハイバネーションが効いてしまったりした場合に、現状では全く検知・切り替え
ができないのは困りものです。
さらに、IPアドレスの変化を検出するツールも止まったままです。
これらの設定は、次の週末にでも行いたいと思います。
 

タイトルRe: HDDクラッシュ
記事No1666
投稿日: 2009/11/23(Mon) 13:21
投稿者としき@家主
レス元1665
言ってるそばから、やってしまいました。

> 回線の通信途絶検出やバックアップサーバ(ニフティ)へログ転送を行わせてい
> るツールも動いていません。さらに、サーバのダウンを検知してバックアップに
> 切り替えるシステムも動作しないようになっています。今度のマシンは旧マシン
> に比べれば頑丈なOSなので落ちにくいというのはあると思いますが、意図せず
> ハイバネーションが効いてしまったりした場合に、現状では全く検知・切り替え
> ができないのは困りものです。

思いっきり、意図せずに落としてしまいました。
電源コンセントを間違えた、というのが原因。本来、常時通電のタップから給電
させなければならないものを、いわゆる、自動連動タップ、というものにしてし
まった、というのが失敗の原因。そして、これが何に連動しているかというと、
母艦に連動しているのです。
昨夜、寝る前には母艦が動いていたので正常に給電されていました。ところが、
就寝時に母艦を落としてしまったため、必然的に給電途絶。その後も1時間半程
は内蔵電源で動いていたのですがね。結局、起床するまで6時間ほど止まってし
まいました。

これはまずいということで、とりあえず、ダウン検知および切替システムを復旧
させました。ただ、まだ片肺というか、従来どおりの性能は発揮できていません。
復旧させた方法というのは、TIMEプロトコルで時刻が取得できればサーバは正常、
できなければ異常、というロジックでした。これは、HTTPサーバが落ちるときに
はTIMEサーバも道連れにするという、軟弱なOSだからこそできた方法です。
現在は、OS的にはそのようなことはないはずです。もちろん、昨夜のような、
物理的にサーバが止まってしまったときには有効なので、とりあえず従来通りの
方法で復旧させただけです。
のちほど、きちんとHTTPプロトコルでサーバの死活監視をするようにロジックを
変更します。TIMEプロトコルで監視していたもう一つの理由は、HTTPで監視する
とHTTPサーバのログが肥大化する、というのがあったのですが、かつて、ほとん
どアクセスがなかった時代ならともかく、最近のようにたくさんのアクセスがあ
る状況では、監視に伴うログ量の増大なんて全体から見たら微々たるもののはず、
というのもありまして。
もう一つ問題があって、現在はまだバックアップサーバに対するログの自動転送
が行われておりません。これは回線の死活監視ツールで行っていたのですが、こ
ちらがまだ再開されていないためです。当面は手動バックアップとなります。な
ので、切替が発生した場合、かつてはサーバダウン直前の発言まできちんとバッ
クアップ側で閲覧可能だったのですが、現在は古い発言までしか表示ません。


上記のように、難しい設定は後回しになっていますが、

> さらに、IPアドレスの変化を検出するツールも止まったままです。

これは、設定ごと救出できた自作のツール一発で何とかなったので、現在、正常
に稼動しています。
 

タイトルRe: HDDクラッシュ
記事No1669
投稿日: 2009/11/30(Mon) 22:50
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1665
現在、復旧率は90%といったところでしょうか。

> ファイル交換用のNFSサーバもなければFTPサーバもまだなので、母艦との
> ファイルのやり取りが全くできません。
> 回線の通信途絶検出やバックアップサーバ(ニフティ)へログ転送を行わせてい
> るツールも動いていません。さらに、サーバのダウンを検知してバックアップに
> 切り替えるシステムも動作しないようになっています。今度のマシンは旧マシン
> に比べれば頑丈なOSなので落ちにくいというのはあると思いますが、意図せず
> ハイバネーションが効いてしまったりした場合に、現状では全く検知・切り替え
> ができないのは困りものです。
> さらに、IPアドレスの変化を検出するツールも止まったままです。

ここに書いたものでは、NFSサーバ以外は全て復旧しました。
次の週末でNFSサーバの復旧を試みます。


余談ですが、新居側での新サーバの構築も開始しました。
この新サーバ、現在の暫定サーバに比べれば大幅にスペックダウンの予定。
OSはNT4WS、クロックは100MHz、メモリは128MB。
HDDの容量は現在まだ検討中。
だけど、OSのインストールされているドライブは、なんとたったの850MB。
セカンダリに増設する予定だけど、でも、合計で2GBに満たないかも。
あ〜、でも、どうしようかな。
余っているマシンはまだいくつもあるから、サーバの二重化なんていうことを試
すのもかっこいいかもしれない。バックアップサーバのほうがメインサーバより
もスペックが上になったりするかもしれないけど。

でも、マシンの前に、LANの配線も何とかする必要があったりするのですが。
 

タイトルRe^2: HDDクラッシュ
記事No1671
投稿日: 2009/12/06(Sun) 00:48
投稿者としき@家主
参照先http://www.hinocatv.ne.jp/~toshiki/
レス元1669
> 現在、復旧率は90%といったところでしょうか。

> ここに書いたものでは、NFSサーバ以外は全て復旧しました。
> 次の週末でNFSサーバの復旧を試みます。

さんざん苦労しましたが、NFSサーバも復旧できました。
これで、実質的には稼働率100%、復旧作業終了です。

実は、マシンを変えたせいかどうかはわからないのですが、以前と全く同じにな
らなかった部分が発生しました。回線側の断線検知ツールなんですが、断線時の
メール通知用に、ダイヤルアップでニフティに接続して、ニフティのアカウント
で、ニフティのメールサーバを経由して携帯電話などにメール送信しています。
問題は、ニフティのメールサーバの名前。以前は、ごく普通にニフティのサーバ
を指定して断線メールを送信できていたのですが、今回、チェックしてみたとこ
ろ、なぜかうまくメールが飛ばない。いろいろと試してみた結果、どうもDNS
が迂回側にうまく切り替わってくれていない模様。サーバ名指定ではなくサーバ
のIPアドレスを直接指定してやることにより、何とかメールが飛ぶようになり
ましたが、いまいちパッとしないなぁ。
ちなみに、断線警報メールなんて数ヶ月に1回程度の頻度でしか発信されません
が、最後に発信された9月19日の段階では、きちんとDNSが引けていました。


ついでに、Vistaへのいくつかのサーバの導入に関する備忘録。
RFC868に準拠したTIMEサーバソフトでWindows用フリーウェアって、国産というか
ドキュメントが日本語のものって、探した範囲では2つしか見つからなかった。
そのうちの一つは私が公開しているもので、もう一つは他の作者のもの。
数年前、さらに別の作者の作られたものを見かけた記憶があるのだけど、どうし
ても見つからなかった。
で、今までは自作のものを使っていたのだけど、自作のソフトほど信用できない
ものはないので、ここはありがたく、他の作者さんのものを使わせていただこう
としました。・・・が、どうもうまくない。
私の作ったものは、プロトコルとしてTCPとUDPの両対応なんだけど、この方のも
のはTCPにしか対応していない模様。さらに悪いことに、返してくるのはJSTでは
なくグリニッジ標準時。環境変数TZの問題かと思っていろいろと設定を変えてみ
たのだけど、どうも思わしくなくて、結局、このサーバを使うことはあきらめま
した。ん〜、とっても残念。アイコンなんか、私のものに比べてはるかにかっこ
よかったんだけど。

もう一つ、NFSサーバについて。
これは、残念ながら、Windows上で動くものに国産のものはありません。
今までは、1998年製のソフトを使っていました。
今回、良い機会だと重い、半ダースあまりのサーバソフトを試してみました。
が、これも残念ながら、今までと同じものを使い続けることになりました。
手持ちのものでは、古すぎて、そもそもインストールできないものもありました。
一番新しいものは、2001年ごろのものとかもあったんですが、何が問題というと、
日本語のファイル名。ファイルの存在そのものが認識できなくなってしまうもの
がほとんどでした。そんな中、従来から使っていたものだけは、文字化けは発生
するものの、少なくともファイルの存在だけは認識できるわけで、これにかなう
ものはありませんでした。



> 余談ですが、新居側での新サーバの構築も開始しました。

> HDDの容量は現在まだ検討中。
> だけど、OSのインストールされているドライブは、なんとたったの850MB。
> セカンダリに増設する予定だけど、でも、合計で2GBに満たないかも。

内蔵ドライブについては、どうもそんな感じで落ち着きそう。
でも、SCSI外付けをいくつか取り付けるかも。