GridTeam 諸葛瑾JAPAN

IBMグリッドコンピューティング『WorldCommunityGrid』参加中。
ねこねこソフトも応援中。

統計確認ページとグリッドの意義

2004-11-20 22:16:10 | WCGエージェント操作説明
いろいろ説明しないといけないのですがなかなか書けていません。
よくわかっていらっしゃる方には説明が不要でしょうが、
何にでも最初がありますから、まだグリッドを知らない人向けに少しでも説明をしたいと思います。
もちろん、既にネットに沢山記述はありますので『UD』『タンパク質解析』とかで検索すればいいのですが、自分も少し書きたいと思います。


■統計確認ページ

エージェントを最初にプログラム起動したときに、サーバに対してIDとパスワードを設定したと思います。
このアカウントで、WEBでマイページにログインし、日々の自分の成績が読めます。
https://secure.worldcommunitygrid.org/ms/viewMyMemberPage.do
宿題提出後一日に一回サーバが集計して翌日に反映されます。
(集計中はマイページは読めません。集計中とのアナウンスが出ます)
毎日これを眺めてみましょう。
ロゼッタは時間がかかるので毎日は提出しにくいのですが…


■グリッドとは何か?このプロジェクトは何をしているか?

簡単に言うと、世界中の個人パソコンに協力してもらって、複雑な演算を分担して処理する仕組みです。
UDやworld community gridは非営利団体として、新薬開発に必要なタンパク質解析をしています。
グリッドは分割配信して分担する処理です。
例えるなら、封筒に会報を入れて宛名ラベルを貼るのを1000人分あるとしたら、1000人の作業員が居れば各自1回で一気に作業を完了できます。
逆に一人なら千回かかります。
このように、似たような処理を大量にする場合は、高性能中央演算処理1台よりも、低級でいいからたくさんのCPUを揃えた方が効率が良いのです。
グリッドコンピューティングでは、サーバが各エージェントにワークユニット(WU)を配って各エージェントはそれを処理し結果をサーバに返します。
結果の正確さも考慮されており、同じWUを複数のエージェントに配っています。
それらの結果を比較して極端な値のものは破棄します。また、誰かがどうしても提出できなくても他の人が同じものを提出してくれる保険にもなるわけです。
1台の汎用機よりも、企業の社員1万人のパソコンが勝る場合もあります。
最近の安価サーバは、高級CPUではなくintelの市販CPUをたくさん並列されたものが増えています。それと似たような思想です。
IBMやNTTデータは、このシステム基盤をビジネスグリッドとして販売…もうしてるのかな?
社員の各パソコンにエージェントを入れて、例えば給与計算みたいに簡単で大量にある宿題を計算させれば汎用機要らずになるわけです。
当然平文でなく暗号通信&表示させれば、セキュリティも安心。
さらにそういう台数では追いつかないヘビーな処理の場合、このボランティアのように世界中に呼びかけて募集し、メーカーが何万台ものパソコンパワーを確保し、各企業に時間貸しさせることも…もうしてるのかな?
この場合、募集時には参加者に謝礼出すかもしれません。見返りがあるなら参加しても良い人はいるでしょうし。
NTTデータが試験運用していたセルコンピューティング実証実験では希望者にノベルティグッズがプレゼントされていましたね。


■タンパク質解析

グリッドの解析成果は医薬機関にオープンに提供されます。
結局製薬会社はそれを有料で販売することになると思います。
なので、営利企業を手助けすることになります。
しかし値段は企業が自己研究するよりは安くするかもしれません。グリッドの成果を借用したのですから、変な販売もできないでしょう。
私はそういう価格より『とにかく早く製品化されればよい』というスタンスです。
薬自体が無いと助かるものも助かりません。
タンパク質解析の主なターゲットはガンです。その中に白血病も含まれる場合もあります。
エージェントでやっていることは、ターゲットとなるタンパク質にどういう化学分子が結合しやすいかを総当りでマッチングさせて探すのです。
例えば悪玉タンパク質ならば、それに良く結合するものが見つかれば、その活動を阻害する薬を作れます。
そうした良く結合できるものが見つかると、それを使って製薬会社が実験検証をします。
つまり、やぶからぼうに効果的素材を探すよりもIT解析である程度の当たりをつけて絞り込んだ方が断然早いのです。
そうした基礎的でたくさんこなす必要があるところをIT技術で賄うわけです。


■私の場合は…参加の理由

*パソコンのベンチマークになる
新品パソコン買ったらすぐ入れて、宿題(WU)がどれくらい速く処理できるかを見ます。
さらに24時間1年中稼動させてOSやハードの耐久力を試しています(笑)。
エプソンダイレクトのデスクトップを主に使っていますが、歴代のマシンは無休で夏の暑い部屋でもハングすることなく動いていました。
なかなかのパソコン耐久性能だと喜んでいます(笑)。
*病院にお世話になっているから
二度の脳神経外科手術や、帯状疱瘡とかとんでもない痛みを経験しましたが、
今どきの医療技術ではいろいろ痛みをとれる薬があります。
入院手術のときはもう数えきれないぐらいの種類の薬を飲んだり打ったりしました。
タンパク質とは全然関係無いですが、医療技術がより良くなるとありがたいです。

それに、パソコン新製品とか新しい技術が好きなので、グリッド自体に興味がありますし。


CPU100%稼動では、電気代も余計にかかりますが、
元から常時接続&常時電源ONしていて、昼間は仕事で部屋のパソコンはヒマしているとか、既にトリップ検索とかを走らせているとかであれば、
それにこのグリッドも入れてみてはいかがでしょうか?

統計で比較するUD版2ちゃんねるとwcg

2004-11-19 22:10:37 | WCGニュース
世界統計(プロジェクト開始3日目)
11/19/2004 06:00:01 世界標準時現在

Members 8209 世界参加人数(有効アカウントID)
Devices 9391 世界参加台数(エージェント稼動数)
Teams  1650 世界チーム結成数
Members 5416 チーム参加人数
Total CPU Time 25:163:18:53:45(year:day:h:m:s) 3日間での累計CPU時間
Points Generated    5892566 3日間でのポイント総計
Results Returned     17790 3日間での宿題提出総計
※正確には10月から少人数で試験運用されており、そこからの累計値
つまりこの数日で約8000人参加となり、9300台のパソコンが稼動中、
その数日間で25年163日相当の演算結果を得られた、ということです。

本家のUD-gridはもっと桁の違う規模です。
例えば「チーム2ちゃんねる」はそのチームだけで累計値は…
チーム参加 メンバー数    47978(毎日10~40人増加中)
Total CPU Time 21032:113:16:30:09(CPU時間貢献2万年)
Points Generated    3081739022(一日あたり+500万)
Results Returned     18295161(一日あたり+17000)

2ちゃんねる参加者のホンの一部がチームで集まって今は4万人、
彼らがパソコンを回した時間は2万年越えています。
このプロジェクトはWindowsパソコンだけですが、そのCPUを2万年分提供すれば、そこらのスパコン以上の成果が出せるわけです。
一般的な医薬品開発は、自社研究所のスパコンで総当り演算とかしていたわけですが、何十年間に及ぶ計算結果を患者は待ってくれません。
そこでとにかく一秒でも早く新薬を開発するために、ボランティアのグリッドの力を借りているわけです。

ちなみに、昨日今日の私NTDの成績。
Total CPU Time  1:21:06:45 (1051位)
Points Generated 1114ポイント (1343位)
Results Returned   4回 (577位)


千里の道も一歩から。

ワークユニット(WU)の処理時間

2004-11-19 10:08:19 | WCGニュース
昨日今日の解析を見た範囲の印象ですが、
WCGで現在進行のプロジェクト「Human Proteome Folding Project」で与えられるワークユニット(俗に宿題と呼ばれています)1個の処理所要時間(俗に固さと呼ばれる)は、
36時間ぐらいでしょうか。これはかなり固い部類になります。
(UD-grid.orgではこの同じ宿題はロゼッタと命名されているようです)
私のパソコン、ノートP4Mの2.2Ghz(デバイス総合値128)とデスクトップP4HTの3.2GHz(総合値200)ではエージェント単独実行で30時間超かかっている最中でまだ終わりません…。
これだと宿題提出にフル稼働で2日かかり、サーバの統計は翌日反映なのでWEBサイトに自分の統計が表示反映されるまで時間がかかりますね。
気長に待たないといけないようです。

表示はグラフなので、一日に1回は提出できたほうが毎日数字が入ってグラフが綺麗に出るのですがね。2日がかりで提出すれば提出時にCPU寄与48時間とかちゃんと数字的には反映はされるので、気分の問題です。

クライアントアプリ(World Community Grid Agent.exe)の紹介

2004-11-17 15:09:31 | WCGエージェント操作説明
今日触ったばかりで誤解もあると思いますが、気付いた範囲でレポート。

■今回のGrid Agentのエンジンは従来のUDと同じもの
 UD-grid.org、NTTデータのcell、今回のWCGのグリッドエージェントは
 体裁がどれもそっくりの同じUDプログラムのようです。
 操作や挙動は従来のをご存じであれば疑問はないと思います。
 ただ、色調デザインがUD-gridの青黒なデザインよりパステル調淡色で見やすい感じ。
 プログレスバー(進捗度グラフ)も従来より分かりやすいデザインになっています。

■エージェントで進行度合いが判りやすくなった
 進捗度グラフ(%)は小数点も表示するので、以前よりは進行が判り易く。
 さらにscore折れ線グラフの動きが処理の調子を良く見せてくれて便利です。
 CPUのパワーが与えられているほど、折れ線がサクサク進んでいきます。

■CPUプロセスプライオリティ低い?
 エージェントは原則として空きCPUを借用するので、
 他に何かアプリが動いていればそちらにCPUを譲るようにプロセス優先度は低いです。
 ノートパソコンの場合は、バッテリのときはスリープ(冬眠)します。
 複数の常駐物があると、原則CPUパワーを等分して動作します。
 しかしこのWCGは、もうひとつプロセスがあると「自分は3割相手に7割」とか
 余計に遠慮している印象が。なのでなかなか進行しない?
 時々にタスクマネージャでWCGridのCPU占有率をチェックしてみてください。

■従来の他のUDとは共存できない
 今回のGrid Agentをセットアップ開始する場合、既に他のUDエージェントを持っている場合
 アンインストールウイザードが働いてディレクトリごと削除しようとします。
 削除しないとセットアップの続きができないようです。

■ログインなど通信方式も従来のUDと同じ
 PROXY設定も相変わらず必要です。最近の通信ソフトは「IE設定を継承」とかあるのに。
 もちろんプロキシの無い環境であれば関係のない話です。
 ストレージもデフォで1Gなので、デバイスプロフィールで10Gに変えたいところ。
 ユーザ情報も匿名で構いませんが「居住:JAPAN」だけは設定しましょう。
 そうしないと世界統計で日本からの参加者が見た目少なく表示されますので。

■参考資料
 私が所属している『チームねこねこ』のサイトにUD-agentの解説ページがあります。
 WCG-agentも姉妹品なクライアントですので読むと参考になるでしょう。
 http://homepage3.nifty.com/mshige/ud/kaisetu/

チームサイトをとりあえず設置

2004-11-17 14:02:32 | 諸葛瑾Japanについて
NTDと申します。(グリッドアカウントではntd7です)

IBMが2004年11月に開始したグリッドセルコンピューティング、
『World Community Grid』
まだ日本からの参加が少なくてチームも少ないため、
統計上成績をとりまとめるために自分でチームを暫定的に作ってみました。
チーム名は、gird.orgでの『チームねこねこ』や、しょんぼり、みずいろ、ぽんこつ…
既にいろいろありますのでそれらと区別するために諸葛瑾としてみました。
要は、ゲーム制作メーカー『ねこねこソフト』ファンサイトなチームイメージですが、
ねこに関係なく日頃からしょんぼりやぽんこつしてる方もどうぞ。
本命のチームが見つかるまで成績を預ける一時利用にとりあえずここに参加とか。

細く長くやれたらいいなと思っています。
(grid.orgは3年続けていました)
このIBMのグリッド計画は医学だけでなく地球環境にも解析貢献するものだそうですが
私はもっぱら、買った自分のパソコンの耐久ベンチマークとして解析を回している感じです。

今日設定したばかりですので、おいおい情報を増やしていきたいと思います。