2011年3月21日月曜日

ネットワーク診断 宇宙線飛来によるCISCOルータ再起動

埼玉県さいたま市大宮区の法人企業からネットワーク不調のお問い合わせがございました。

計画停電後に社内のネットワークがすべて切断する事象が発生し、その後自然に復旧したそうですが念の為診断してほしいということで現地に急行しました。

今回のトラブルはカテゴリ的にネットワーク障害に位置付けられ、更に社内のネットワーク全体が一斉に不通に陥ったという状況証拠からまずはネットワークも大元にあるルータを探すことにしました。

依頼元の会社の総務の方と一緒に探すこと15分、サーバルームの片隅にそれらしきCISCOルータを発見!!
さっそく、持込PCでルータに直接繋ぎ、コンソールログを開くと以下内容を確認しました。

%RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
%RSP-3-ERROR: MD error 00800080C000C000

ログの中に「parity error」が存在しました。これはメモリーで引き起こされる異常で、可能性として2種類ある。
それは"ソフトパリティエラー"と"ハードパリティエラー"の2つです。

今回どちらが原因に当たるのかは私では回答致しかねる為、素直に製造元であるCISCOへ問い合わせて同時に採取済みのログも送信しました。結果は前者である"ソフトパリティエラー"でした。さらに次のような解説もありました。「推測の範囲を出ませんが、この種のエラーの発生要因のほとんどが宇宙線によるもので、それがメモリセルを通過するときに蓄えられた電荷量の値を乱してしまうのです。」ということです。

今回の場合はソフトパリティエラーで再起動でリカバリ(修復)を済ませているので対処不要となり、経過観察することにしました。

以上、本日のブログでした。