中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

応用数理学会若手の会 2012/12/26@本郷 ぜひ来てください!

2012-11-28 12:56:00 | 日記
2012年 若手の会 単独研究会
        日時:2012年12月26日(水)16:00~18:00
        場所:東京大学情報基盤センター(本郷)4階遠隔講義室
        http://www.itc.u-tokyo.ac.jp/itcPage/CNTmap.html
        プログラム:

※本単独研究会の講演者はすべて 若手の会幹事団の推薦による招待講演です。

9:50-10:00  はじめの言葉(若手の会主査 片桐孝洋(東大))

〇セッション1:線形代数

10:00-10:30 山中 脩也(早稲田大学 理工学術院総合研究所)

タイトル:区間演算とその応用

概要:  精度保証付き数値計算は,数値計算において発生する すべての誤差を明示的に把握し,計算機による計算結果に 信頼性を付与する.精度保証付き数値計算において最も 基本的な演算は区間演算であり,閉区間を用いた区間演算を はじめ,さまざまな区間演算法が提案されている. 本講演ではいくつかの高精度な区間演算法について, それらの特徴や性能,実装方法などを述べる.

10:30-11:00 深谷猛(神戸大学 大学院システム情報学研究科)

タイトル:  TSQRアルゴリズムに基づくQR分解の並列計算に対する自動チューニングの検討

概要:  近年,縦長行列に対するQR分解の並列化手法として,TSQRアルゴリズムが注目さ れている.また,一般の行列に対しても,ブロック化を行うことで,TSQRアルゴ リズムの適用が可能となっている.本発表では,このアルゴリズムに基づいて, を共有メモリ型並列計算機の上でQR分解の並列計算を行うことを考える.そし て,アルゴリズム中のブロック幅などのパラメータを機械的にチューニングする 手法について検討する.

11:00-11:30 今倉暁(筑波大学 計算科学研究センター)

タイトル:  Extended Krylov部分空間に対する新しい基底生成アルゴリズムの提案

概要:  近年, 行列関数や行列方程式の求解に対し, 行列Aの冪乗とともに A^-1の冪乗を利用したExtended Krylov部分空間に基づく射影法が注目 されている. 本発表ではExtended Krylov部分空間の基底ベクトルに対する効率的な 生成アルゴリズムを提案する.

11:30-12:30 昼休み

〇セッション2:大規模シミュレーション(1)

12:30-13:00 河東田 道夫(独立行政法人理化学研究所 計算科学研究機構)   タイトル:  マルチコア超並列クラスタシステムに適した高精度量子化学計算手法の開発

概要:  近年の大規模計算システムではマルチコア超並列クラスタシステム構成が一般的と なっており、現在では京コンピュータのような10ペタフロップス級の演算性能を 持つシステムも登場している。理論分子科学の分野においても、巨大分子の高精度 量子化学計算をこれらのシステム上で実行可能とする計算科学基盤技術を整備し、 ナノ分子や生体分子の機能デザインや生体系の現象解明といった応用計算を行う ことが重要な研究課題となっている。本講演では、巨大分子の高精度量子化学計算の ための計算手法およびソフトウェアの開発について、最近の我々の研究成果を紹介 する。特に、巨大分子の高精度電子相関計算を京コンピュータなどのマルチコア 超並列クラスタシステム上で高速・高並列に行うことが可能なRI-MP2法の MPI/Open-MPハイブリッド並列アルゴリズムの概要および本手法を用いた応用計算例 を 紹介する。

13:00-13:30 日野 理(東洋ゴム工業株式会社 タイヤ技術本部)

タイトル  分子動力学によるゴム材料の粘弾性計算について

概要  ゴム材料において、その粘弾性特性は最も重要な物性の一つである。 従来、シミュレーションによる高分子系の粘弾性計算の多くは現象論的な 運動方程式に基づく方法によるものだった。しかし、この方法では高分子、 配合剤およびフィラー等の複合体であるゴムの粘弾性を解析することは難しい。 本講演では微視的な運動方程式に基づく分子動力学を用いた粘弾性計算法と、 ゴムを簡易にモデル化した高分子・フィラー複合系に応用した結果について 報告する。

13:30-14:00 南さつき(東京大学 大学院工学系研究科)

タイトル:  バランシング領域分割法を用いた大規模並列アコースティック流体-構造連成解析 手法

概要:  アコースティック流体-構造連成解析は古くから原子力工学 や海洋工学など多くの工学分野で研究され,人工物の設計や 現象の理解に利用されている.しかし,より高精度な解を予測 するには,より広範囲の解析やより細かいメッシュの作成など, 大規模な解析モデルが必要となってくる.そこで,本研究 では大規模連成解析を目的とし,並列有限要素法の有効 な手法の一つとしてこれまで様々な分野で研究されてきた バランシング領域分割(Balancing Domain Decomposition; BDD)法を三次元アコースティック流体-構造連成問題に適用 する.本講演では流体-構造間の連成項に着目していくつか のBDDタイプの解法を導出し,それらの性能比較や並列化 実装について述べる.

14:00-14:15 休憩

〇セッション3:企業における計算機システム開発

14:15-14:45 浅原理人(NEC クラウドシステム研究所)

タイトル:  LoadAtomizer: ディスク負荷の集中を軽減する MapReduce タスクスケジューラ

概要:  大量のアクセスログやウェブページといった大規模データを高速に並列処理する 基盤として MapReduce が注目されている。MapReduce では高速処理を実現する ために、ネットワークを介した入力データの転送をできるだけ行わない工夫がな されている。しかし、ネットワークが高速化した現在では、性能ボトルネックの 要因がディスクに移りつつある。従来の MapReduce タスクスケジューラでは ディスク由来の性能ボトルネックを回避することが困難であった。本発表では、 性能が向上したネットワークを活用することでディスク由来の性能ボトルネック の影響を軽減する MapReduce タスクスケジューラ LoadAtomizer を紹介する。

14:45-15:15 佐藤 竜也(日立製作所 中央研究所)

タイトル:  SaaS提供システムのための統合監視の実現に向けた取り組み   概要:  SaaS事業者は,多種多様なアプリケーションとそれらを支えるハードウェア を監視する必要がある。しかし,アプリケーションおよびハードウェアの稼働状況 の関連性を短時間で把握する手段が不足している。本講演では,この関連付けを 容易にするために,稼働データを収集分析するSaaS向け統合監視システムの 検討内容について紹介する。

15:15-15:30 休憩

〇セッション4:大規模シミュレーション(2)

15:30-16:00 小野寺 直幸(東京工業大学 学術国際情報センター)

タイトル:  TSUBAME2.0の4000GPUを用いた格子ボルツマン法による都心部1m解像度ラージエ ディ・シミュレーション   概要:  都市は複雑なビルが立ち並び、複雑な構造をしており、 詳細な気流を解析するためには、高解像度格子による 大規模気流シミュレーションが必要となる。 格子ボルツマン法は、単純なアルゴリズムで大規模計算に適した流体計算手法 である。都市の気流はレイノルズ数が100 万を超えるような乱流状態 になるため、 ラージエディ・シミュレーション (LES)の乱流モデルを導入する必要がある。 現在良く使われている動的スマゴリンスキー・モデルでは、モデル定数を決定 するために各格子点で広領域の平均操作が必要になり、大規模計算には極めて 不向きである。 本研究では、モデル定数を局所的に決定できるコヒーレント構造 スマゴリンスキー・モデルを格子ボルツマン法に導入し、大規模な気流のLES 計算を可能にした。 実際の建物データに基づき計算対象のエリアを領域分割し、TSUBAME の Fermi コアのGPU を用いて計算を行った。10,080 × 10,240 × 512 格子に対して 4,032 個のGPUを用い、新宿や皇居を含む 10km 四方のエリアを 1m 格子で計算し た。 これにより、高層ビル背後の発達した渦によるビル風や幹線道路に沿って 流れる「風の道」、台風の際の被害などが飛躍的な精度で予測できるようになる。

16:00-16:30 伊東聰(東京大学 情報基盤センター)

タイトル:  OpenFOAM高速化のための自動チューニング機構

概要:  オープンソースCFDツールキットであるOpenFOAMは、簡便な インターフェースと豊富なサンプルコードを持つことから 利用者が急増している.本研究ではOpenFOAMに自動 チューニング機構を導入し高速化を目指す。

16:30-16:45 休憩 〇セッション5:生体シミュレーション

16:45-17:15 宮本大輔(東京大学 大学院情報理工学系研究科)   タイトル:  京コンピュータによる昆虫嗅覚系神経回路シミュレーションの構築と高速化

概要:TBA

17:15-17:45 小林徹也(東京大学 生産技術研究所)

タイトル:  Path-wiseに捉える確率的生体システム

概要:  ミクロな細胞内反応システムは分子の少数性や 熱ゆらぎの影響で非常に確率的な振る舞いを見せる。 しかし、確率的な反応の総体としての細胞システムは 非常に安定に機能する。確率的な構成要素からマクロな 安定性が創発するメカニズムを理解するためには、細胞反応が作る 非線形ダイナミクスを理解するだけではなく、確率的に 変遷するシステムのpath-wiseな特性を理解することが不可欠である。 本発表では確率的な生体システムを理解するためのpathにもとづく 数理的アプローチについて紹介したい。

17:45-18:15 中村和成(慶應義塾大学 大学院理工学研究科)

タイトル:  GPGPUによる生化学ネットワークシミュレータの高速化

概要:  常微分方程式を用いた生化学ネットワークシミュレータは 様々な形で既に実装され、多くの数理モデルが作られてきている。 しかし、数理モデルを構築するにあたりパラメータフィッティングや、 各種解析を行うには複数回のシミュレー ションが必要となり、計算コストが非常に大きくなるという問題点 がある。  このような問題に対して、研究者個人レベルの効率的な研究環境 の提供のためにシミュレータのGPGPUによる実装・高速化を行なっている。 本発表ではCUDAによる数値積分の実装と性能比較について述べる。

18:15-18:30  終わりの言葉(若手の会幹事 荻田武史(東京女子大))

19:15~ 懇親会

Intel Composerとgccの四倍精度の実装について

2012-11-26 10:20:19 | 日記
Intel Composerとgccの四倍精度では大きく実行スピードが違う。たとえばX5680 3.3GHz x2 (12コア)上でRgemmを走らせると
Intel Composerでは600MFlops, gccでは120MFlopsと五倍程度差が出る(いずれにせよ倍々精度より5倍は遅い)。これは一体何なのだろうかと思って調べた。
REAL test(REAL a, REAL b)      
{   
    REAL temp;
  
    temp = a + b;
    return temp;
} 

だと、Intelでは

movups %xmm0, (%rsp)
lea 32(%rsp), %rdi
movups %xmm1, 16(%rsp)
lea (%rsp), %rsi
lea 16(%rsp), %rdx
call __addq@PLT
movups 32(%rsp), %xmm0
addq $56, %rsp
ret

というコードが生成される。SSEのxmm0, xmm1は128bitのレジスタなので
ちょうどのる。その上で計算している。__addq@PLTは一体なにか、後ほど探ることにして、
GCCではどうなるか。

subq $8, %rsp
call __addtf3
addq $8, %rsp
ret

みたいなコードになって、スタックにつんで計算。__addtf3
どのような精度の演算が来ても良いような、genericなコードになっている。そのため、オーバーヘッドは大きいとおもわれる。

ということで__addq@PLTを探ることにする。


IBMのApache OpenOfficeでの次の取り組み

2012-11-05 10:05:19 | 日記
IBMのApache OpenOfficeでの次の取り組み
Rob Weir
IBMとしての若干のコメントをしたいと思います。

我々IBMは、顧客、内部ユーザー、他のIBMのプロダクトチームに、IBMでのApache OpenOfficeの次のリリースでの
開発の優先順位について、意見を聞いた。明らかに、我々だけが優先順位、興味、意見に関して述べるのではなくい。
Apache OpenOfficeでの意思決定については我々だけで行うのでない。しかしながら、我々IBMの開発の優先順位について
明らかにしておきたい。それはApache OpenOfficeに参加するIBMの従業員に対して、であり、そして
IBMは何を次に焦点を当てるのかも明らかにしたい。Apache OpenOffice 3.4.0や3.4.1でした通り、我々はwikiに何週かのうちに詳細を
まとめる。更にはApacheConで話されるだろうが、私はまずみなさんに知ってもらいたい。

我々の最も高い優先度を持つものは

-- インストールおよびデプロイについての向上。特にデジタル署名をインストール時にサポートすること、マイナーアップデートに
関して完全版をダウンロード、インストールする必要がないように新しい逐次的なアップデート機能を導入することである。

-- ユーザーインターフェースの大幅な改善。Symphonyから移植された編集に関してサイドバーフレームワークおよびその
APIの導入。すでに知られているように、Symphonyに関してはユーザーインターフェースに関して多くの賞賛を得られている。
それらは、サイドバーパネルによるものである。我々はこのアプローチに関して説得力のある議論ができるはず、と私は
思っている。例えば、特に、我々は幅広いディスプレイをより頻繁に使うようになってきており、
画面の大きさということを MS Officeのリボンより、よりよく利用できる、といえる。

-- ライターに関して、目次を改善する

-- WindowsとMacOSのOSへの統合性を高める。可能な「ジェスチャー」を採用することも含まれる。

-- IAccessible2ブリッジをSymphonyから移植し、アクセシビリティを向上する。これは大幅に作業が必要だが大変重要である。

-- ユーザーからの意見を取り入れたクリップアート、テンプレートライブラリの統合。

-- ブランディングおよびユーザーインターフェースの外観(Vusal styling)をアップデートし、現代的、かつ人の目を引くように、新鮮で、適切なものにする。

-- ソーシャルインテグレーション。
我々のユーザーがその商業的な社会的行動を補完する形で、迅速かつ容易にユーザー同士の考えを共有することができるようにする。
消費者サービス固有の機能の統合だけでなく、もっと一般的な共有やアクションをおこなえるようにする。

-- そして多くのこまごまとした改善

明らかにリリース日程は今すぐはっきりさせるということはできないし、リリースはPMCの決定によるもので、IBMによるものではない。しかし、2013年の3月か4月頃というタイムフレームの間に完成、リリースへのテストができると考えられる。そして、リリースに向けた改善は、"4.0"と銘打つには十分なものであるほど大きいだろう。

いずれにせよ、我々はwikiページを設置し、これらの項目を集めることになる。いつもどおり、あなたがあなた自身で先にやりたい、と思っている項目について、wikiに加えていただきたい。これらは4.0での新機能となるだろう。または、上の項目で興味を持ったならば、我々は新機能の設計と実装について一緒に働くことをいつも歓迎している。