【視点】システム障害事故が後を絶たない。東京証券取引所は08年7月22日にシステム障害が発生したため、東証株価指数(TOPIX)先物や国債先物取引などの派生商品の午前の取引を停止した。また、全日空は9月14日に国内線予約システムにトラブルが発生、全国50の空港カウンターでコンピューター端末を使った搭乗手続きができなくなった。さらに、大和證券は8月20日、9月12日、9月18日と3回にわたりシステム障害事故が発生し、取引ができなくなるなどのトラブルが発生した。これらのシステム障害事故は、いずれも初歩的なミスが原因と見られており、今後も同様なシステム障害事故はなくなりそうもない。原因としてソフト開発者の数の不足を挙げる向きもあるが、今回の3社の事例を見ると“数”の問題ではなさそうだ。今、「事業継続」が大きな課題として各企業に突きつけられているが、これらの事故の続発で「事業継続」は空念仏に終わりかねない。
東証の事故は、新ソフト導入時、システムのメモリー処理能力を1280バイトとすべきところを4バイトと間違えてプログラムを設定したことによる。全日空の事故は、外部から購入した端末認証管理サーバーの暗証管理の機能の期限が1年で切れることを見逃したことによるもの。大和證券の9月12日の事故は、株式注文システムのプログラム変更作業時の設定ミスが原因。いずれもうっかりとしたミスであり、今後同様なトラブルがなくなる保証はまったくない。ないどころか、今後同様な事故は必ず起きると見たほうが正しいようである。よく、国内には約50万人のソフト開発者がいるが、あと15万人が必要などのようなことがいわれるが、今回の3社の事例を見る限りではいくらソフト開発者数を増やしても、システム障害事故はなくならないと見た方がいい。
ソフト開発者の数を増やしてもシステム障害事故がなくならないとすれば、どうすればよいのであろうか。システム障害事故をなくす前提条件として、原因をIT(情報技術)に求めないことが肝要だ。ともすると、システム構築の仕様書の細目の再検討だとか、定義の問題なので解決を図ろうとするが、これをいくらやってもまた別の原因でシステム障害事故は必ず発生する。つまり、いたちごっこに陥るのが関の山だ。システム障害事故の原因は人間の注意力の限界を突いて起こるのであるから、この対策を打たなければならない。人間の注意力には限界があるのだから、事故が起きるのが当たり前のことと割り切って対処することが肝心だ。
有効な対策の一つはチェックを一人でやっていたなら複数でチェックをする体制に移行させることだ。これでも期限切れの見逃しは起きることは避けられそうにもない。なぜなら一人が見落とすということは、二人でも、三人でも見落とす可能性が高いからだ。次に打たねばならない手は、過去日本および世界で起きたシステム障害事故の事例集を作成し、システム構築終了後に、これを基に徹底的にチェックをすること。これによって、少なくとも二度同じ過ちをすることだけは避けられる。そして、システムダウンは起きないではなく、「起きる」と考えを変え、起きたときいかに最短時間で立ち上げるかを、あらかじめ想定しておくことだ。いずれにしてもシステム障害事故はITの問題なんだという固定概念を払拭しなければ、今後も同じ事故は必ず起きることだけは確かなことだ。(ESN)