災害時のサーバー運用の問題点
新潟県中越地震で、小千谷市の情報システムがクラッシュしたという話。
壊れた原因は、地震ではなく電気で、最初の地震で給電がストップしたときに、サーバ専用の非常用電源が稼働せず、市役所の非常用電源は供給されない仕組みで、UPSにより動作、バッテリー切れによる自動停止。
その後、給電が再開したので、サービスを再開する為にサーバを再起動。
しかし、直ぐに給電が停止してしまい、自動停止する為のUPSもバッテリーが切れていた為、マシンが強制停止しクラッシュしてしまったそうです。
サービスを出来るだけ早く再開したかったとはいえ、バックアップ体制が整わないうちにマシンを運用再開しようとしたのは運用ミスですね。現場で実際に起きたときに適切に判断できるかは不明なので、事前に如何にシュミレーションし運用マニュアルを整備でき、周知徹底できるかが鍵になります。
これは、サーバだけではなく、普段の自分のPCでも問題が起きたときの対応を検討しておいてはどうでしようか?
慌てて最後のトドメを自分でしてしまわないように(^_^;
●関連記事
○【新潟県中越地震】不安定な給電でサーバーがクラッシュ──小千谷市の情報システム(2004年11月07日 11時23分)(nikkeibp ITPro)
| 固定リンク
コメント