2010年9月18日土曜日

構内ネットワークが不安定になる・・・・

こんにちは、名古屋の時間貸しレンタルオフィス、レンタル自習室の@Spaceアットスペース管理人の中井です。

さて、本日(9/18午後14時ごろ)構内ネットワークが不安定になる現象が発生致しました。
不安定との表現は、一時的に接続不可であったが直ぐに回復する状況でした。
インターネットをご利用中の皆様へはご迷惑をおかけし申し訳ございませんでした。

以下に原因状況を対応策(済み/実行中を含む)を記しましたのでご覧ください。

発生事象)
・構内接続のパソコンからインターネット接続しえいると、急に重くなり接続エラー画面が表示されました。
・暫く数分待って再度接続すると、要求したインターネットページが画面に表示されました。
・しかし、数分後 また同現象が発生!。但しその後は発生しない。
・平日中での発生は認められない。

確認事象)
・フレッツ光りの各端末(CTU、ONU)や構内LANのルーターの物理的電源障害やエラーLEDの点灯もない。
■「超高速光インターネットの実現」を参照下さい。
・NTTさん光フレッツのエラーが出ていないかコールセンターへ問い合せをしました。
NTT側から弊社のCTU、ONUまで接続状態の問題ないことをご確認いただきました。

発生理由に関する考察)
・前回も構内ネットワーク中で同様の事象が発生致しました。
 その対応として、ネットワークルーター(弊社ファイヤーオールを兼用)のファームウエアーをバージョンアップいたしました。
このルーターは外部インターネットと構内LANとのデータを受け渡しの機能であるため、現時点の最新FWを導入して、過去問題の解決を図った。
■「ネットワーク機器のメンテナンス」を参照下さい。
⇒結果は暫く同事象が発生せず安定しておりました。
そのため、問題の解決を判断した。(継続的な機器FWの更新は実施予定)

しかし、本日同現象が発生いたしました。

原因は、次のどれかだ。
1)別にあった。
2)複数の要因がある。
3)新規要因の発生。

過去のSE経験上、1)の可能性よりも2)の複数の要因が存在する可能性のほうが高いと考察する。
しかし、現時点では複数要因の特定は困難なので表面化した要因を一つずつ取り去り、その他要因を見つける作業となります。その為の作業が、後述のその場の対応となります。
また、3)新規要因は、やはり構内LANネットワーク中のトラフィック増加が挙げられます。

では、
(その場の対応)と(今後の対策)の2つに分けて説明させて頂きます。
まずは、

その場の対応)
・外部インターネットと、その接続先のファイヤーオール/ルーターのFWは最新であり、機器障害も無いと判断して、3)の新規要因である構内LANトラフィック増加の際のクライアントPCに着目いたしました。
つまり、
トラフィック増(LAN回線中のパケット数の増加)に伴いクライアントPCは自己の要求(インターネットページの表示)を完了できなかったエラーが表示された。
これは、クライアントPCが要求した結果が、パケットロス等のLAN回線側の何らかの問題でタイムアウトを検出したために発生した事象と考えられます。
個々の原因が、コリジョンなのかは不明ですが、ネットワーク中のパケット負荷をコントロールする必要がありますので構内LAN中に複数配備されているインテリジェントスイッチの設定値を以下のように変更したしました。
【構内インテリジェントスイッチの設定値変更】
全ポート設定 FlowCtrl(フローコントロール)をEnabledに変更。
その場で全ての構内スイッチへ設定反映。(9/18午後17時ごろ完了)
■「ネットワーク機器のメンテナンス設定方法 その2」をご参照ください。

今後の対応)
外部インターネット回線へのもう1回線(光ファイバー)を追加とそれに伴うファイヤーオール/ルータ追加
⇒予想される効果)
a.外部インターネットとやり取りされるネットワークトラフィックを光回線分担により改善。
b.外部インターネットとのやり取りのための、負荷集中したルータの負荷分散(NATテーブルが実質2倍)
c.現行の外部インターネット回線は、変更なく追加するため現行ネットワークシステムへの影響が最小。
1)NTTのフレッツ光ネクスト(ハイスピードタイプ200Mbps)回線追加。 そんなに早いの!
2)ビジネスタイプのファイヤーオール/ルータ追加導入。
3)構内LANの外部インターネット向けパケットの振り分け(ネットワーク設計の改訂&実施)

1)の光ファイバーの進化は著しいですね!
以上、3つの順次進めてまいります。
完了次第また、ご報告させて頂きます。

0 件のコメント: