goo

Sa-ポータルの遅延問題の収束宣言とは

未唯へ。Sa-ポータルの遅延問題の収束宣言を行うことになりました。自分なりに論点をまとめてみます。重要なのは、今回の問題が販売店および販売店システムにとって、「何だったのか」を明確にすることです。電算部、ソフトベンダー、パッケージメーカーという中間者の存在の意味を問うものです。

1.現状認識(結局、どういう現象だったのか):

 レスポンスの不安定さの原因がつかめなかったことです。10月からシステムの不安定さを訴えてきたが、トラブルでサービスが停止するまでは、適当にやっていた。トラブル停止後し、動きだして、2か月かかって、チューニングが完了した。

2.課題(なぜ、5ヶ月もかかったのか):

 パッケージのサーバとデータベース、アプリのサーバとデータベースの4つのシステムの間にメッセージがやり取りされ、その都度、ジョブが起動するシステム構成に対して、全体の関係を押さえている人が居なかった。
 ポータルが狙ったのは、販売店の多様なニーズに対応することであった。従来のスタティックな手法ではなく、ダイナミックな手法を採用した。一つのリクエストに対して、パッケージ部分とアプリ部分がそれぞれを担当して、処理して、結果として集まったものを表示している。
パッケージのようなブラックボックス部分も含めて、全体のシステムを抑えられなかった。
3.原因(何が悪かったの):

 4つのシステムでの起動・制御・リリースのバランスおよびタイミングにジョブの滞留が発生して、秒単位での遅延が発生した。

4.対応(今後、大丈夫ですか):

 4つのシステムと対応関係に対して、上流から下流まで、一つずつ確認してきた。2万人ぐらいの入力には耐えられるバランスまでは検証された。あわせて、システム状況を把握することで、トラブル発生以前に対応を可能にしている。

こんなところでしょう。本当はパッケージソフトの中のブラックボックスをすっきりできるプロを求めています。

私の得た教訓は、電算部とかシステム会社という、中途半端な中間者は当てにならないし、コストと期間と信頼性に欠けるということです。それらに任せるのではなく、より大きな構えのシステム--ローカルの個人に対するグローバルなSaaSとかクラウド--との関係を作り上げていく必要があるということです。
コメント ( 0 ) | Trackback ( 0 )