大きすぎたネットワーク
昨夜NTT東日本のフレッツサービスが麻痺した。
さて、原因は。
NTTともあろうものが、これだけの大規模な障害を出した、収拾できなかった原因は。
その原因は、ネットワークが大きすぎたから。
ルータ(通信のより分け装置。)が一台故障。
恐らくは、何千何万とある機械の一つ。
そんだけあると、しょっちゅう壊れるわけで。
例えば、ルータの耐用期間が10年だったとしよう。
10年は、3650日とちょっと(閏年分)しかないわけで。
ルータが10000台あれば、単純計算で一日に三台は壊れるわけです。
なので、ルータが壊れるなんてのはよくある話。(NTTクラスになると。)
普段は適切に設定をして、壊れたルータと交換するはずです。
でもきっと、昨日はしくじったんですな。
ルータは、それぞれが持つネットワーク情報をやりとりします。
適切な経路で通信するために、余計な情報をいらんところへ流さぬために。
しくじらなければ、新しい情報は流れないので、交換しても何も起きません。
正確に言えば、局所的には起きますが、全体に波及するようなことはありません。
そうして、なりたっているわけです。IPネットワークは。
でも、なんかちゃんと設定していない、つまり、その場所にあってはならない、
ルータがネットワークにポンって入ってしまったのだと思われます。
そのルータ(ネットワークという方が正しいけど)への通信をするための情報が新規に作られたわけです。
その追加したルータによって。
まったく新しい通信経路情報は、あっという間に、つながっているルータに伝播します。
そのルータもまた隣のルータに。
しかも。一般の道路(車が走るあれだ)と同じで、
最高速度やトラフィック(交通量)が、違うのです。
その中で、最高の速度が出るように、自動的にルータ同士が計算してくれているのです。
一般企業クラスのネットワークでは、人間が計算して手動で設定することもありますが、
NTTクラスだとそれは不可能だと思われます。
やったとしても、基幹部分だけでしょう。
なので。
新たなルータが変な経路情報を流すと、その経路への最適なルートを改めて
計算し直して、さらにその結果を隣のルータに流して...
というのは、一ヶ所で起きて一回伝播して終わりでなくて、
風呂桶に起こした波紋のように、反射してあちこちから違う情報がどどどどどどっと。
あー、そら、パニックだ。
で、ルータもパニック起こして(処理能力を超えて)次々とダウン。
たぶん再起動がかかると思うのですが。
再起動かかると、また経路情報作り直しなので...無限ループ。
あやー。
大変だ。
これは、大変だ。
昨夜のNTT東日本の担当者はパニックだったでしょう。
どうやったら、この広がってしまった波紋を止められるか。
とりあえず、うそ情報を流しているルータを撤去して、うそ情報が消えるのを待つしかない。
積極的になんかやるんなら、ルータ再起動しまくり。(論理的にでもよい。)
しかし、その数は半端ではない。
順番もあるだろうし。
よう一晩で収拾したもんだ。
えらいのNTT。
ニュースではたった四行(しかも二行は総務省からの注意。)ですが、裏ではこんなことがあったと推測されます。
みなさんが、インターネットをいつでも好きなだけ使えているのは、
こういう人たちが裏でネットワークを支えているからなのです。
というのを少しは分かって欲しい。
以上、元ネットワーク屋でした。
---
追伸:本当のところ、何が起こったかは、
こちらの記事に書いてあります。
水神の推考は、かなりあやしいということが分かりました。
んー、なんか、無念。