炉端での話題

折々に反応し揺れる思いを語りたい

エキスコン(2)

2009-12-30 18:26:38 | Weblog
スパコン(スーパー・コンピュータ)の歴史上に記録されているIlliac IVについて、言及する。
ウィキペディアには冒頭、つぎのような記述がある。そのまま部分的に引用する。
「Illiac IV(イリアック・フォー)は、イリノイ大学の一連の研究から生み出された最後のコンピュータであり、史上最も悪名高いスーパー・コンピュータでもある。ILLIAC IV の設計の鍵は、256 プロセッサによる高い並列性で、後にベクター処理と呼ばれる大きなデータセットを処理することを指向していた。マシンは十年の開発期間を経て1976年に動作を開始したものの、極めて遅く、極めて高価で、Cray-1のような商用マシンには敵わなかった。」
「史上最も悪名高い」ということは、出典を要すると注釈がついているもののどういうことか。

手元に2冊の成書がある。1冊は1976年に出版された加藤・苗村著「並列処理計算機-超高速化へのアーキテクチュア」オーム社であり、いま一冊は1982年に刊行されたR.M. Hord による“The Illiac IV, The first Supercomputer”, Computer Science Pressである。
前者は、主としてイリノイ大学において1970年頃までIlliac IVの設計と製造にあたった方の著書である。後者には、Illiac IVがAMESに設置されてからの当事者による記録が残されている。
Illiac IVはコンピュータの歴史上始めて、並列処理を行うように設計・製造された実験機である。コンピュータ・メーカであれば試作開発機に相当するものである。メーカでの試作品は企業秘密もあり、試作品が公開されることはまずない。大学として研究開発し、製造工場をもたないだけに多大な困難に遭遇したが、これを克服しながら実機の稼動をもたらし、スパコンの歴史の1頁に残るコンピュータと位置づけされている。
 Illiac IVは、一つの命令で多数の演算装置により、個々に異なった数値をもとに同時平行的に演算処理を行うコンピュータである。いわばSIMD (Single Instruction stream Multiple Data stream)として、最初に実現したコンピュータである。音楽会をイメージすれば、通常のコンピュータは独奏の演奏であり、SIMDは中央にいる指揮者がオーケストラを指揮しながら演奏する様相と似ている。
オーケストラの演奏をイメージする様な演算処理として、天気予報がある。つい先日手元に届いたIEEEのSpectrum に“A Real Cloud Computer”という記事がある。気象解析にあたり、現在は200キロメートル四方に区分して処理しているが、理想的には1.5キロメートル四方に区分して解析処理したいと書かれている。そのためには 消費電力の少ないプロセッサTensilica X Tensa LX2を1千万個使用したGreen Flashと名付けたエキスコンを提案している。消費電力は3メガワット程度になると推定している。必ずしもこのエキスコンはSIMDではないが、Illiac IVは現在のエキスコンの源流であるといえる。
エキスコンによる天気予報は、気体流力学をもとにした物理現象をもとに行われる。天気予報以外にも高層建築ビル、ダムの堤防、船舶、航空機、自動車などの強度計算、地震とか風圧に対する外力の耐性を確認する手法にSIMD並列処理は適している。逆の見方をするとエキスコンは汎用性がない。Illiac IVも汎用性に乏しいコンピュータであった。

Illiac IVのプロジェクトは様々な困難に直面した。
まず大まかに年代をもとに開発の経緯を辿る。
Illiac IVのプロジェクトは1965年に国防省DARPA(Department of Defense's Advanced Research Project Agency)の開発基金の支援を得て、イリノイ大学の計算機工学部のダニエル・スロートニク教授を主導者として開始している。当初の予算は800万ドル(当時の円換算レートで28億8千万円相当)であった。計画としては64プロセッサPU(Processing Unit)を統括する中央制御装置CU(Central Unit)を1クォドラントとし、全体を4クォドラントで構成するので256台の演算装置を並列動作する計画であった。1966年12月にはコンピュータの製造会社Burroughs Co.から検討契約最終報告書(Study Contract Final Report)が提出されている。事実上この報告書のもとにIlliac IVの構想がまとまり、事後のプロジェクトが推進されている。
 スロートニク教授は、このプロジェクトの推進にあたり予算的に不十分であることを国防省に上申して2000万ドルの予算規模に拡大している。後に述べる様々な困難な事態からIlliac IVはAMES国立研究センタに設置されて、1975年11月から稼動開始した。稼働までには累積総額として3100万ドル(当時の為替レートによる邦貨換算では約93億円)を要している。予算規模からみると現在のスパコン、いやエキスコン程ではないともいえそうである。記録によると1982年に電源を落として廃棄されるまで現役として稼働している。

社会事情による困難な事態をみよう。
1960年代後半には、アメリカ合衆国はベトナム戦争に巻き込まれている。ニクソン大統領は1969年11月、軍事にかかわる予算は直接軍事的利用可能に限るとする方針に署名した。これがきっかけとなり、国防予算を投入したIlliac IVプロジェクトは軍事研究にかかわるものと学生に予測がひろがって校内設置に反対する学生運動が起こり、州兵が出動し、事実上の戒厳令に相当する外出禁止令が発動された。プロジェクトの主導者であるスロートニック教授はこの事態を受けてIlliac IVの大学キャンパス内の設置を断念した。ここにIlliac IVのプロジェクトは、この事件が起こった1970年春を境として前段と後段に分けられる。

次に、開発途上に生じた技術的な問題を掘り起こしてみる。
まずはイリノイ大学がかかわっていた前段についてである。Illiac IVの製造についてはBurroughsが主契約し、論理回路素子は、Texas Instrumentsが製造・供給、主メモリは当時Burroughsが開発していた薄膜磁気メモリを使用する計画でスタートした。Texas Instrumentsは当時開発していた高速動作するECL(Emitter Coupled Logic)論理回路素子を高密度で中規模の集積回路として実装することを提案した。半導体集積回路素子の黎明期であり、ようやく小規模TTL(Transistor Transistor Logic)論理回路素子が実用化にこぎつけていた時期である。
 1968年秋になってTexas Instrumentsは、中規模のECL論理回路素子に様々な課題があったようで製造できないことを告げてきた。やむなくすべて小規模のECL論理回路素子を用いるように変更された。一方Burroughsは、開発途上の薄膜磁気メモリの開発には、予測した以上のコストがかかることを告げてきた。
 スロートニック教授は、アメリカ全土にわたって主記憶メモリについて再調査し、Fairchild社が半導体メモリを試作しており実用化の目途をたてていることから、これを採用することを決定した。Illiac IVはかくして半導体メモリを主記憶装置として最初に導入したスパコンとなった。しかしながら製造コストの高騰は避けられないことから、4クォドラントの実現は断念し、1クォドラント、すなわち並列の規模を1/4に後退させた。並列動作する演算処理装置PUは256から64となった。その後に前記の学生運動に遭遇している。

Illiac IVにかかわる技術的な困難は、後半のAMES研究センターに持ち込まれる。
カルフォルニア州にあるAMES研究センタには1972年の春から設置し始めたが、当時のセンタ長は、Illiac IVは本当に実働開始して、利用できるようになるだろうかと危惧したという。夏になって計算処理を開始したところ一見正常に動作しているように見えても得られた結果は正しくなかったからである。
 1975年の夏から徹底的に再検査を開始した。11万カ所にわたり抵抗素子の交換、配線のやり直し、論理回路の誤り――主として配線長が不適切であるための時間要素の論理誤り――が4ヶ月間にわたって実施され1975年11月、Illiac IVは稼働開始した。しかしながら一週間の内60-80時間稼働し、なお44時間の保守時間を必要とした。

次にIlliac IVを利用する側面から眺めてみよう。すでに前述したようにこのコンピュータはSIMDと位置づけられるので汎用性はなく、計算処理の構造が並列コンピュータの接続構造に適合していることが好ましい。
計算処理の構造とは、なじみが薄い方もいるかも知れないので少しばかり補足する。最も汎用性があるコンピュータは、単一命令で単一のデータを処理するSISD(Single Instruction stream Single Data stream)の普通コンピュータである。Illiac IVの64個の処理装置PUは、8×8の配置とし、東西南北の四方向にデータが転送できるように接続されている。端の処理装置PUは螺旋状になるように別の端に転送できるようになっているので全体としてば閉じた空間接続になっている。
 流体力学の課題、高層建築ビル、ダムの堤防、船舶、航空機、自動車などの応用には多くの場合マトリクスで表現されている。このマトリクスを計算処理構造とみなせば、このマトリクス構造を並列コンピュータの構造に展開する。必ずしも、適合した展開とはならない。解こうとする課題のマトリクスを切り分けて、コンピュータの構造の上に張り付けていくことになる。いわばパッチワークである。SISDのコンピュータのプログラミングさえ困難極まりないのに、処理構造のマトリクスをちぎって、コンピュータ構造に張り付けるというパッチワークに相当する別のプログランミング作業が加わる。The Illiac IVの図書にはこれにかかわる内容が記述されている。新たな並列処理のためのFORTRANも開発されたという。

The Illiac IVはAMES研究センターで稼働開始された後に、まとめられた成書であり、Illiac IVを停止するときに出版されていると想像するが、最終章には多くの方々のコメントが収録されている。その冒頭を引用する。
「Illiac IVは様々な議論をもたらした機械である。あまりにも高価で、あまりにも開発に時間と人手がかかったが、コンピュータの技術に飛躍をもたらし、見るべき成果があった。Illiacの初めの夢は必ずしも達成できなかったが、今日必要とする課題に対してコンピュータ技術の進歩をもたらし、そしてその有用性を明らかにした。」
 そして利用者の多くから賞賛のコメントが寄せられて、それが綴られている。

 スロートニック教授が言った言葉が、その図書の中に書かれている。
「私は非常に失望した。と同時に大変喜んでいる。喜びととまどい。
とまどいはあまりにも費用がかかったこと、時間がかかりすぎたこと、そして大したことができなかったこと、あまり多くの方々に利用されなかったことである。が、嬉しいことは有終の美を飾ることができたことである」と。

当初に掲げたいずれの著書からも、ウィキペディアの「史上最も悪名高い」という理由は、わからない。これは、開発にあたる先人の労苦に対して失礼であるばかりでなく、ウィキペディアとしての価値を疑う内容である。悪口を述べることで先人の辛酸をなめた労苦からはなにも引き出せない。新規開発には失敗がつきものである。それをあざ笑っていては進歩はない。「Cray-1のような商用マシンには敵わなかった」いう記述もThe Illiac IVの成書に書かれている記録によると正しくないことも指摘しておきたい。
(納)

メタ解析

2009-12-16 08:24:23 | Weblog
脳科学のことを調べているが、いまはヒトの自閉症のことにかかわっている。ある中学校教諭から最近の児童の不登校が自閉症と関係があるのではないかとの相談を受けたからである。特に青少年の自閉症は、発達障害を伴うので早期発見し、事前に処置を施すことが重要な課題となっている。米国のカルフォリニア州の一部では、幼児のうちに自閉症となる可能性を見いだす試みがなされているという。
自閉症と一口にいってしまうが、細かく見ていくと様々な局面があることから、自閉症スペクトルというとらえ方をしている。光のスペクトル分解のように色分けされても個々の境界をもつ色別まではできない。自閉症に関して、精神医学とか発達心理学などで広く研究が進められているが、スペクトルのように広範囲にわたるから、なかなか焦点が合わせられない。
そこでメタ解析(Meta-Analysis)を手法として用いた論文が登場している。メタ解析の起源は、調べた範囲によるとGlassにより1976年に発表された”Primary, secondary, and meta-analysis of research”によると思われる。

ここではメタ解析としたが、メタ分析とか原語のままメタ・アナリシスともいう。定かな内容については日本薬学会による薬学用語解説から下記に引用する。
「過去に独立して行われた複数の臨床研究のデータを収集・統合し、統計的方法を用いて解析した系統的総説。採用するデータは、信頼できるものにしぼり、それぞれに重み付けを行う。一般的には、様々な試験の要約統計量を用いるが、生データを結合して解析する場合もある。叙述的な総説とは異なり、体系的、組織的、統計学的、定量的に研究結果をレビューするという特徴がある。」

メタ解析による学術論文を始めて読まされたとき、私は「他人がやった仕事を自分流にまとめるのは論文ではない。解説である」と思った。上記の薬学用語解説を読み直せば、メタ解析を用いた寄稿文は、必ずしも論文として位置づけしていない。総説とみなしている。私が所属していた学会では通用しないであろうし、もし私がこのような論文を査読したら、独創性に欠けるとして採録に反対したであろう。しかし、いまやれっきとした論文として学術誌に掲載されている。学術的な貢献があるとすれば、これは納得できる。
自閉症スペクトルは様々な局面がある。光学スペクトルで言えば、赤、緑、青の三原色のように自閉症スペクトルは容易に分解解析できないであろう。ヒトの精神を形作る構造は多次元にわたる。様々な局面の多数の研究論文が刊行され、それを基にしたメタ解析が自閉症スペクトルを解明するための論文になる。

研究分野もヒトの脳構造のように階層化しつつあるといえそうである。
(脳)

エキスコン(1)

2009-12-15 13:48:39 | Weblog
いまスーパーコンピュータ(以下スパコン)について関心がよせられている。2009年夏に行われた衆議院議員選挙によって民主党が政権を取得し、来年度予算要求を「事業仕分け」として、事前に査定評価した。
その結果、スパコンの予算要求は凍結されている段階である。この事態をマスコミが報道すると多くの反響がよせられ、ノーベル賞受賞者までが科学技術の進歩に寄与する国家的事業の切り捨てとばかりに、鳩山首相との会見もおこなった。いまだにくすぶり続けているスパコンの話題である。
1960年代、イリノイ大学のコンピュータ・プロジェクトで、スパコンといわれたIlliac IVのハードウェア設計・製作に参画した多くの知人がいる。このことからスパコンは関心事であったが、最近のスパコン事情については「事業仕分け」で俎上に乗るまであまり気にしていなかった。仕分けによってスパコンのことに深い関心を呼び起こされた。
つい最近届いたIEEEのComputerという雑誌は、タイムリーにもExtreme-Scale Computingの特集号であり、スパコン事情がよくわかる。スパコンどころかこれを超越するエキスコンである。
この雑誌にも再びイリノイ大学のエキスコンBlue Waterが登場している。その内容を簡単に要約すると、演算速度は10の15乗 operation cycle per secondすなわち10ペタ演算回/秒という。どうやらIBMのスパコンBlue Gene/Pをベースとしているらしく、米国政府のNSFとイリノイ州が資金を提供している。8個のcore(かってのCPU、Central Processing Unitと称した主演算機構のこと)を持つPower7というチップを20万個以上使用するというから、ざっと計算すると160万個のコンピュータの集合体である。大きさはフットボール競技場の1/10程度で、数メガワットの電力を消費するという。記事から推察すると、このエキスコンはどうやら超並列型コンピュータである。
1960年代のイリノイ大学のIlliac IVプロジェクトはDARPA(Defense Advanced Research Projects Agency)という国防省の財源を基にしていたので、定期的に国防省から評価を受けていた。この評価委員会にある知人は出席したという。その評価委員会の席上でIlliac IVのようなアレイ型のコンピュータよりも、パイプライン演算方式を持つコンピュータの方が優れているとの批判をある国防省勤務の職員がおこなった。当時のIlliac IVプロジェクトを采配していたスロートニック教授をはじめとして、これに参画していた一同は、この職員の評価に大きなショックを受けたという。ちなみに代表的なパイプライン方式のコンピュータとしては1974年に市販されたCDC STAR-100、1976年に設置されたCray Iなどの記録がある。いずれも当時はスパコンと呼ばれていた。
その後Illiac IVは、当時ベトナム戦争の最も激しい時期であり、国防省のプロジェクトと位置づけられたことからイリノイ大学の学生運動の標的となり、スロートニック教授はIlliac IVをイリノイ大学に設置することを断念して、国立のAMES研究所に設置されることになったという。
スパコンはその構造上の特徴から、SIMD、MIMDと分類される。SIMD とはSingle Instruction Multiple Dataのことで単一命令のもとに複数データ処理を行い、 MIMD とはMultiple Instruction Multiple Dataのことで複数命令の基に複数データ処理を行うことを表している。Illiac IVは典型的なSIMDコンピュータである。現在のエキスコンはこの分類からいうとMIMDと見なしうるが、細かく見るとSIMDが多数個集まって、全体としてMIMDになっている。このことはすでに述べたBlue Waterの概略説明でもわかる通り、SIMDが基本ベースにある。Illiac IVはコンピュータの歴史の上、失敗したプロジェクトであるとして、いまだに批判の的にさらされているようであるが、SIMDのコンピュータとして歴史的に記録されている。
しからばスパコンIlliac IVはどうして失敗であったといわれているのだろうか。
その理由については、このエキスコン・シリーズの次回にゆずることにする。
(納)


スパコン騒動とノーベル賞学者の異様な反応

2009-12-01 11:18:29 | Weblog
 事業仕分けでスーパーコンピュータ開発予算の削減が大きな話題となった。しかし、私には、報道の取り上げ方、ノーベル賞学者の異様とも思える反応など、全てが不満だ。もっと多くの面からバランスの取れた冷静な議論が必要だ。
 ノーベル賞学者の最初の反応は、スパコン開発予算を削減することへの反論だ。スパコン開発を止めれば、我が国の科学技術の進歩が阻害され将来に禍根を残す、と言うものであった。スパコンが最先端の技術を結集して作られるのは確かだが、最先端の技術の結集と言うだけなら、スパコンに限らず、ほかにも沢山ある。また、ここがよく理解されていないようだが(あるいは意図的に誇張されているのか)、スパコンはあらゆる科学技術の基幹をなすというものではない。それゆえ、「その開発が疎外されると我が国の科学技術の進歩が抑制されてしまう」というのはいささか飛躍した論理だ。むしろ、スパコンは特殊な分野の特殊な人たちが使っている、というのがこれまでの実情ではないか。実際、たくさんいるコンピュータサイエンティスト、コンピュータエンジニアの中でこの分野に関わっている人は決して大多数ではない。一大産業を形成している訳でもない(実際、共同開発民間3社のうち2社が撤退を表明していると言う)。
 極論すれば、ほかにも重要な問題はたくさんあるので、今回のテーマに関して、それが削減されても、そう大騒ぎすることではないのではないか(先にも記したように冷静な議論は必要だが)。この点、さもセンセーショナルな話題提供として書きたてている報道の姿勢に私は不満なのである。
 スパコンで世界一になるということにあまり意味はない。これまでのスパコン開発の歴史を見れば、一時期、トップに立っても直ぐ1~2年後にはその座を奪われていることの繰り返しである。これは、スパコンの開発が、頭脳の結集と言うよりも、計算資源(プロセッサ)を出来るだけかき集めて、その全体で処理速度を高めるという力ずくの仕事に近いからではないか、と私は考えている。トップになることにどれだけ意味があるのかと言う問いかけに対して、「とにかくトップを目指さなければ2位にも3位にもなれない」などと的を外れたノーベル賞学者の発言に私は失望した。
 スパコンの開発研究をしなくてよいと言う積りはない。この「炉端の話題」でも(脳)さん、(納)さんが、スパコンの研究開発の必要性を力説されている。私の真意は、具体的に詰めた議論が必要で、その結果、高額といえども開発予算が必要だというなら、それはそれでよし、と言うことである。
 しかし、今回の騒動には、いささか雑駁な議論を感じる。事業仕分けに提出された資料によると、これまでにこのプロジェクトに約430億円が既に使われており、行なわれたことと言えば、概念設計、詳細設計、一部のシミュレーションソフトウエアの開発となっている。あまり立派な成果とは言えない。むしろ、国家予算が厳しい中、プロジェクトの実施が杜撰ではないかという疑念を感じる。
 総合科学技術会議が「スーパーコンピュータの開発は確実に進めるべきである」と結論した、と新聞に小さく報道された。この意味はどういうことであろうか。最初の提案どおり予算を付けよといっているのか、研究開発は地道に続けるべきだがその予算配分については全体の科学技術関連予算の中でバランスを配慮して決めればよいといっているのか、あるいは、意図的にぼやかしているのか、不明だ。
 スパコンのお金に関するノーベル賞学者の突然の、しかも声高の反応は、少々、驚きであった。最近は発言のトーンが「スパコン予算削減反対」から「科学技術関連予算の削減反対」と変わってきているように見える。もちろんお金の問題は大事だから、広い意味で、科学技術関連予算の削減に異を唱えるのは結構だ。しかし、外国で見られる「賢人会議」のような役割を演じるのなら、大雑把に「科学技術関連予算の削減反対」と言うだけではなく、たとえば、若手技術者支援事業や、大学の役割、性格が劇的に変わってしまいつつある独立法人化の是非、といった重要な問題に関して、沈黙しているのではなく、良識に裏打ちされた正論を大いに展開してもらいたいものだ。お金に関する今回の反応が何か突飛に思えて仕方がない。(ロバート・ニールセン)