最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Intel® Parallel Studio 2018 Update3 登場 その9

2018年08月31日 00時16分08秒 | Weblog
Haswell 世代の CPU も加えてみましたが、BroadWell から Skylake のところ急激に性能が上がっていることがわかります。

SDPARA の方は OpenBLAS 0.3.3dev と OpenMPI 3.1.1 との組み合わせですが、遅すぎるので何か起きてますね。。。

◯問題1:Be.1S.SV.pqgt1t2p.dat-s
SDPA 7.4.1:167.72s
SDPARA 7.4.1 : 3628.70s


◯計算サーバ
CPU : Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz x 2個 (40コア)
メモリ:512GB
OS : CentOS 7.5

コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

AIRC 地理情報科学研究チームと社会知能研究チーム

2018年08月30日 01時51分34秒 | Weblog
産総研-東工大 OIL では以下の AIRC チームからの参加者も増えていく予定です。

産総研 AIRC 人工知能研究センター
地理情報科学研究チーム

あらゆる情報は、「いつ」「どこで」という時空間情報にタグ付けされています。こうした多種多様かつ膨大な地理空間情報を知的に処理できる基盤を開発し、科学研究だけでなく環境管理・資源開発・防災といった具体的な応用に結びつけます。直近の課題は、宇宙から地球・惑星を観測する衛星群をセンサーネットとみなし、そこから得られる画像や測位データを即時・全量処理できる人工知能フレームワークの構築です。

社会知能研究チーム

情報システムにより高度化した現代の都市のサービスは、単にエネルギー的な効率だけでなく、人と人・人とサービスの相互作用を取り入れたシステム設計が望まれます。本チームでは、その設計を工学的に支援するため、人々の振る舞いを継続的にセンシングする技術と、人を系に組み込んだシミュレーション手法を組み合わせ、サービス導入・改変の影響を都市規模で予見することを目指します。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「Windows 95」がアプリとなって登場

2018年08月29日 21時11分30秒 | Weblog
「Windows 95」がアプリとなって登場

1995年8月24日にMicrosoftがリリースしたOS「Windows 95」は20年以上も昔のOSですが、世界的に知名度が高く、ウェブブラウザ上で動作させたり、Apple Watchにインストールしてみたりと、その人気ゆえかさまざまなプラットフォームに移植されてきました。そんなWindows 95が、ついにWindows・macOS・Linux上で動作可能なアプリとなって登場しています。

Windows 95 is now an app you can download and install on macOS, Windows, and Linux - The Verge
https://www.theverge.com/2018/8/23/17773180/microsoft-windows-95-app-download-features

アプリ版のWindows 95を開発したのは、Slackの開発者であるFelix Rieseberg氏。アプリ版Windows 95のソースコードおよびアプリインストーラーはGitHub上で公開されており、誰でも無料でインストールできます。

Releases · felixrieseberg/windows95 · GitHub
https://github.com/felixrieseberg/windows95/releases
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

計算資源 : ABCI

2018年08月28日 00時10分46秒 | Weblog
計算資源 : ABCI
ABCIは1088台の計算ノード、10台のマルチプラットフォームノード、22PBの大容量ストレージシステム、ノード間およびストレージシステムを接続する高速なInfiniBandネットワーク、それらを管理するサーバ群とネットワーク機器で構成されます。

□ 計算ノード
各計算ノードには2基のIntel Xeon Gold 6148と、SXM2で接続されたNvidia Tesla V100が4基、NVMeで接続された1.6TBのSSD、384GiBメモリが搭載されています。
計算ノードの単体性能は、506 AI-TFLOPSで、人工知能研究の機械学習に必要とされる半精度浮動小数点の演算を1秒間に506兆回行う能力を有します。工学的な科学技術計算で必要とされる倍精度浮動小数点演算おいては、計算ノード単体で34.2 TFLOPSの性能を有します。

□ 高速なインターコネクト
計算ノード、マルチプラットフォームノード、インタラクティブノード等のノード群および大容量ストレージシステムは、高速なInfiniBand EDRにより接続されます。1088台の計算ノードは34台ずつ32基のラックに搭載されており、同一ラック内ではフルバイセクションバンド幅で接続されています。32基のラック間はオーバーサブスクリプションバンド幅(1/3帯域)で接続されます。

□ 大容量ストレージ
AIおよびビッグデータを扱うための大容量ストレージは、22PBの実行領域を有するDDN SFA14KXを3セットで構成されるDDN GRIDScaler上で、GPFSによる高速分散ファイルシステムとして提供されます。

□ 外部接続ネットワーク
ABCIシステムはSINET-5(100Gbps)に接続しているため、インターネットを経由してABCIシステムに接続できます。ネットワークの経路には高性能なファイアウォール装置 FortiGate 1500Dを配し、安全なネットワーク接続を実現するとともに、アクセスサーバによる2段階の認証を経ることでセキュアな接続を確保します。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GTC Japan 2018 講演内容変更

2018年08月27日 00時24分30秒 | Weblog
大規模 AI クラウド計算システム「ABCI」と新産業アプリケーションの開発
藤澤 克樹
産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリ(RWBC-OIL)ラボ長
ID: 2018-1075

タイプ: テクニカル セッション

部屋: 1F: Room 1 - 1
日時: 9月13日 13:10 - 13:35

産総研の大規模 AI クラウド計算システム「ABCI」は世界トップクラスの計算性能 (NVIDIA Tesla V100 4352 枚搭載)を持つ国内最大規模のオープンな AI 計算基盤です。公開学習済みモデルやオープンデータも提供する大規模高速計算基盤として AI の実用化を加速していきます。本セッションでは ABCI の特徴や新基軸を説明すると共に、ABCI グランド チャレンジの内容や産学連携等による CPS (サイバー・フィジカルシステム) アプリケーションの開発について解説します。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Chainer 4.3.0 と imagenet

2018年08月26日 00時58分40秒 | Weblog
以下の環境で実験してみました。

train_imagenet.py に以下の部分を追加しました。

ws_size = 1024*1024*1024
chainer.cuda.set_max_workspace_size(ws_size)
trainer.run()

◯ Chainer 4.3.1 + CuPy 4.3.0 + cuDnn 7.1.3

◯ Tesla V100 : FP32
$ time python ../imagenet/train_imagenet.py -a alex -g 0 -E 50 train.txt test.txt
epoch iteration main/loss validation/main/loss main/accuracy validation/main/accuracy lr
4 1000 3.42937 0.275687 0.01
9 2000 2.0102 0.50725 0.01
13 3000 1.31432 0.652125 0.01
18 4000 0.85658 0.763563 0.01
23 5000 0.585906 0.831094 0.01
27 6000 0.422727 0.879281 0.01
32 7000 0.310402 0.910875 0.01
37 8000 0.244246 0.930906 0.01
41 9000 0.209276 0.94025 0.01
46 10000 0.171013 0.951531 0.01

real 5m33.551s
user 54m17.491s
sys 1m47.513s

◯ Tesla V100 : FP16
$ time python ../imagenet/train_imagenet.py -a alex_fp16 -g 0 -E 50 train.txt test.txt
epoch iteration main/loss validation/main/loss main/accuracy validation/main/accuracy lr
4 1000 3.334 0.2735 0.01
9 2000 2.036 0.505 0.01
13 3000 1.331 0.649 0.01
18 4000 0.8945 0.7775 0.01
23 5000 0.6175 0.86 0.01
27 6000 0.43175 0.923 0.01
32 7000 0.32125 0.953 0.01
37 8000 0.2715 0.967 0.01
41 9000 0.212625 0.977 0.01
46 10000 0.173 0.984 0.01

real 4m47.544s
user 48m53.431s
sys 1m36.040s


◯ GeForce GTX 1080 Ti : FP32
$ time python ../imagenet/train_imagenet.py -a alex -g 1 -E 50 train.txt test.txt
epoch iteration main/loss validation/main/loss main/accuracy validation/main/accuracy lr
4 1000 3.37873 0.281375 0.01
9 2000 1.97629 0.511594 0.01
13 3000 1.29579 0.658469 0.01
18 4000 0.867154 0.760156 0.01
23 5000 0.596059 0.830938 0.01
27 6000 0.40342 0.882469 0.01
32 7000 0.314912 0.910125 0.01
37 8000 0.243203 0.929281 0.01
41 9000 0.22406 0.93675 0.01
46 10000 0.17793 0.949656 0.01

real 6m42.212s
user 63m2.643s
sys 1m51.877s

◯ GeForce GTX 1080 Ti : FP16
$ time python ../imagenet/train_imagenet.py -a alex_fp16 -g 1 -E 50 train.txt test.txt
epoch iteration main/loss validation/main/loss main/accuracy validation/main/accuracy lr
4 1000 3.35 0.26975 0.01
9 2000 2.045 0.501 0.01
13 3000 1.306 0.637 0.01
18 4000 0.8805 0.778 0.01
23 5000 0.594 0.875 0.01
27 6000 0.4405 0.9165 0.01
32 7000 0.337 0.951 0.01
37 8000 0.255125 0.97 0.01
41 9000 0.2175 0.9775 0.01
46 10000 0.196 0.98 0.01

real 6m2.340s
user 60m37.003s
sys 1m43.699s
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

九大スパコン ITO 民間利用

2018年08月25日 20時11分15秒 | Weblog
民間利用

九州大学情報基盤研究開発センターでは、イノベーション創出を推進し、わが国の産業振興に寄与するため、保有する研究用計算機システムとその上のアプリケーションプログラムによる大規模計算サービスを民間企業に提供しています。
民間利用の詳細は 九州大学情報基盤研究開発センター民間利用平成30年度利用課題募集要項 をご覧ください。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

cuDNN 7.2

2018年08月24日 00時45分49秒 | Weblog
cuDNN 7.2 を導入してみました。

What’s New in cuDNN 7.2?
Deep learning frameworks using cuDNN 7 and later, can leverage new features and performance of the Volta architecture to deliver up to 6x faster training performance compared to Pascal GPUs. cuDNN 7.2 highlights include:

TensorCore acceleration with FP32 inputs and outputs (previously restricted to FP16 input)
RNN cells now support more use cases with options for cell clipping and padding masks
Automatically select the best RNN implementation with RNN search API

cuDNN Release Notes v7.2.1
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ユーザー参加型+有機的連携によるAI技術の社会実装

2018年08月23日 00時06分40秒 | Weblog
人工知能技術コンソーシアム

ユーザー参加型+有機的連携によるAI技術の社会実装

次世代の産業・生活インフラを支えるAI技術の出口戦略
シーズ/データ/ニーズをマッチングさせた実証事業と知識・データの水平展開
ビジネスへの適用を前提とした実践的なワーキンググループ活動

社会に求められるAI技術を目指して、製造分野、科学分野、生活分野を3軸とした実フィールドでの応用により深化・発展させ、次世代の産業・生活インフラを支えるAI技術の社会連携プラットフォームを形成していきます。

幅広い業種の参画企業が有する、シーズ/データ/ニーズをマッチングし、また広く社会連携も推し進めながら、AI技術の社会実装(実証事業)を行います。
そこで得られた知識・データを水平展開し、成長スパイラルを回す共通基盤となることを目指します。

参画企業が主体的にワーキンググループ(WG)を発足できる体制になっており、各企業の実ビジネスへの適用を前提とした、実践的な実証事業を行います。
データ活用の手法・技術などのソリューション、また最新の技術動向を共有する勉強会なども行っており、参画企業間の有機的な連携をはかります。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「柏の葉IoTビジネス共創ラボ」第2回勉強会

2018年08月22日 13時41分48秒 | Weblog
「柏の葉IoTビジネス共創ラボ」第2回勉強会

■柏の葉IoTビジネス共創ラボとは

「柏の葉IoTビジネス共創ラボ」は、IoTの普及を目指す「IoTビジネス共創ラボ」(事務局:日本マイクロソフト株式会社 幹事企業:東京エレクトロン デバイス株式会社)の地域グループで、「柏の葉キャンパス」をはじめ、つくばエクスプレス沿線エリア一体に構築されたIoT実証フィールド環境を活用して、柏市を中心とした近隣地域へのIoTの普及や活用、およびIoT関連ビジネスの機会創出を目的に、企業、地方自治体、教育機関など様々な参画企業・団体とともに活動してまいります。

勉強会終了後、懇親会(参加費1,000円 領収証を発行致します)の場を設けております。ぜひミートアップの場としてもご活用ください。

対象

IoT にご関心のある事業企画、IT 管理部門の皆さま
Pepper や ドローン、xR(VR/AR/MR) にご関心のある事業企画、IT 管理部門の皆さま
企業、自治体、医療関係、教育機関等のIoT にご関心のある皆さま
ビジネス、サービス向上、業務改善にIoTを活用したい皆さま
Microsoft Azure やマイクロソフトとの IoT ビジネスにご関心のある事業企画の皆さま
IoT ビジネス共創ラボご参加にご関心がある担当の皆さま
スタートアップ/デベロッパーの皆さま
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Panasonic Laboratory Fukuoka 訪問予定

2018年08月21日 22時40分04秒 | Weblog
8月後半に以下に訪問してきます。。。

福岡事業場に共創の場「Panasonic Laboratory Fukuoka」を開設


パナソニック株式会社は、「知」と「知」を織りなし、パナソニック創業の精神である「周知を集め」、新たな価値を生み出すことを目的に、福岡県福岡市にある、福岡事業場構内において共創の場となる「Panasonic Laboratory Fukuoka」(パナソニックラボラトリー福岡、以下PLF)を開設します。PLFは、大阪の「Wonder LAB Osaka」(ワンダーラボ大阪、以下 WLO)、東京の「Panasonic Laboratory Tokyo」(パナソニックラボラトリー東京、以下PLT)に続く、当社3拠点目の共創の場になります。
PLFは、「人と人、技術と技術、想いと想いが入り交じり、新しい価値に織り上げる“織りなすラボ”」をコンセプトに、福岡発の新しい価値・商品・技術の創出を目指した活動を行います。
WLO、PLT、PLFの活動は、「より良いくらしの向上と社会の発展に貢献する」という基本理念をベースに、新しい価値創出のしくみを構築し、共創による価値創出に取り組んでまいります。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

柏の葉スマートシティ

2018年08月20日 20時37分01秒 | Weblog
柏の葉スマートシティ

世界の未来のために、この日本が託された課題の解決に向けて、私たちは街づくりのテーマを3つ掲げました。

この地球にどこまでもやさしい「環境共生都市」。
豊かな自然環境を地域資源として、環境やエネルギー問題に応え、災害時にもライフラインを確保する街を目指し、世界最先端の知と技術で、未来型の環境共生都市を目指しています。

日本の新しい活力となる成長分野を育む「新産業創造都市」。
大学・研究機関・インキュベーション施設が集まる新産業創造集積のまちづくりが進んでいます。ビジネスコンテストや支援団体が新産業の創出を目指し続けて企業や起業家をサポートしています。

すべての世代が健やかに、安心して暮らせる「健康長寿都市」。
高齢社会都市の提案、自治体と連携した健康事業、学際的観点からの予防医学、実証実験のモデルタウンなど、健康長寿都市の実現に向けてさまざまな取り組みがなされています。

ここ柏の葉スマートシティは、この3つのテーマの最適解を求め、ハードとソフト、そしてここに集うひとのハートまで、すべてを叶えることで、「世界の未来像」を具現化していくのです。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ABCIグランドチャレンジ2018(第2回)

2018年08月19日 01時08分21秒 | Weblog
ABCIグランドチャレンジ2018(第2回)

国立研究開発法人 産業技術総合研究所(以下、産総研)は、莫大な演算能力によりはじめて可能になる人工知能分野の最重要課題への挑戦を支援するため、AI橋渡しクラウド(ABCI)で「ABCIグランドチャレンジ」プログラムを実施します。ABCIグランドチャレンジは、ABCIがもつ最大計算ノード数である1,088ノード(4,352GPU)を最大24時間、1研究グループでの占有利用ができる公募型チャレンジプログラムです。世界最大規模の人工知能処理向け計算インフラストラクチャであるABCIを用いて画期的な成果の達成が見込まれる、挑戦的な研究課題のご提案をお待ちしております。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel® Parallel Studio 2018 Update3 登場 その8

2018年08月18日 12時30分17秒 | Weblog
前回の続きです。この問題での高速化は Intel コンパイラで起きている現象で、gcc では見られません。

ソフトウェア SDPA 7.4.1

◯問題:Be.1S.SV.pqgt1t2p.dat-s
icc 18.0.3 + Intel MKL 2018.3:248.78s
gcc 4.8.5 + OpenBLAS 0.3.3.dev : 550.74s
gcc 4.8.5 + Intel MKL 2018.3:535.51s
gcc 8.2.0 + OpenBLAS 0.3.3.dev : 549.41s


◯計算サーバ
CPU : Intel(R) Xeon(R) Gold 5120 CPU @ 2.20GHz x 2個 (28コア)
メモリ:256GB
OS : CentOS 7.5
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel® Parallel Studio 2018 Update3 登場 その7

2018年08月17日 00時13分03秒 | Weblog
前回の実験の続きです。量子化学系の問題(1と2)だけ異様に Skylake が速いことがわかります。

ソフトウェア SDPA 7.4.1

◯問題1:Be.1S.SV.pqgt1t2p.dat-s
計算サーバ1:248.78s
計算サーバ2:601.23s

◯問題2:N.4P.DZ.pqgt1t2p.dat-s
計算サーバ1: 889.47s
計算サーバ2: 1883.22s

◯問題3: theta83.dat-s
計算サーバ1: 646.91s
計算サーバ2: 455.50s

◯問題4:DSJC1000.9.col.dat-s
計算サーバ1: 1456.84s
計算サーバ2: 1002.23s


◯計算サーバ1
CPU : Intel(R) Xeon(R) Gold 5120 CPU @ 2.20GHz x 2個 (28コア)
メモリ:256GB
OS : CentOS 7.5

◯計算サーバ2
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個 (24コア)
メモリ:512GB
OS : CentOS 7.5


コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする