5月27日
NHK技研公開2017
に行ってきた!
まず、入って「スマプロ=放送XAI」ということで、
・AIを活用したスマートプロダクション
・IoT連携で広がるテレビXネットXライフ
ハイブリッドキャストとハイブリッドキャストコネクトで
スマホからテレビ画像とロボット、照明を連動させると・・・
ゴールすると、ロボットがよろこび、照明がゴールチームの色になる
・メディア統合プラットフォーム
ネット配信と放送を場所に選んで表示できる
とかやってたんだけど、まあ、AIですよ・・ということで、
・三次元被写体追跡スポーツグラフィックスシステム
はい、はいると、なんかバンバン音がするんですけど、
これですね。バレーボールをやっていて、それを4台のカメラでとり、
そのボールを追跡している「機械学習で」
にわかAIディープラーニングやっている人を寄せ付けない
会話をしてきました!以下、その内容をまとめて書きます!
機械学習を使っているが、DeepLearningは使っていない
→処理時間の問題
SVMを使っている。
特徴量としては、色のヒストグラムを使う(ローカル・バイナリー・パターン)
学習方法には、事前学習と逐次学習が考えられるが、今回は事前学習
→ボールの見え方は変わらないから
毎回判定している。判定範囲を四角形で囲んでいる。
ボールが外れると、全画面サーチする。
ボールが2つ検出されてしまった場合、
前画面の位置から、近いものを選ぶ
ハイビジョンで60フレーム
表示している画像が暗いのは、入力は普通の画像。このうち、特徴量で判定した
色にあったところを際立たせている(それ以外を暗くしているから)
・もちろん、8K関係の展示もあった。8Kカメラとか。
・地下1階が詳細展示。
番組制作のための音声認識とか、顔認識とか
顔認識は、位置をわかってから、だれか判定するっていう感じ。
・音声のほうは、22.2chのマイクと、すっごい薄いスピーカー
・音声の自動作成の話は、まあ、昔からあるよね。
・入ってすぐの展示「メディア統合プラットフォーム」は、
「行動連携」というらしい。詳しく展示してあった。
・立体映像としては、なんか、算数のお勉強のやつをやっていたんだけど、
時間待ちになるので、みないできた。
・で、AI
サッカーで顔の向きを判定しているものがあった。
向きの判定には、機械学習を使っている。
1秒3枚のペースで、各選手の顔がどちらむきにあるかを見ているらしい。
もちろん、ディープラーニングではなくSVM
ここでは、色ヒストグラムだけではなく、
HOGも使っている
頭の部分を向き(0°、30°、60°、90°・・・)ごとに、事前学習していて、
その学習結果と、今、対象としている顔が、どれに近いかで、顔の向きを判定
しているらしい。
・7階は食堂!(親子でなにかつくる教室もやっているみたい・・)
Dランチとアイスコーヒー(コーヒーは奥のほうで提供してくれるんだけど、
食券は、入り口でランチと一緒に買う必要あり)にしたんだけど、
う~ん、ことしもCランチ(どーも君弁当?)は、売り切れ・・・
・・・あれ、技研公開のときには、売っていないのか?
それとも、自分が平日行かないからなのか・・・?
とにかく、ことしも、どーもくん弁当は、たべられなかった・・・
帰り際、入り口のおくのほうにも、スペースがあることを発見!
いつも提供されるところの前ぐらいで食べていたので、混んでいたが、
そこすいていた!来年、そこ使おう・・・(って、思って忘れちゃうんだろうな・・)
ってなかんじ。ことしは、去年みたいな8Kオンリーという感じでなく、
AIも自然に入ってきている感じ。
でも、そこでのAIは、ディープラーニングではなく、SVM
やっぱ、計算時間が問題だよね~日本全国、どこにでも、GPUがあるわけじゃないし・・
・・・え、学習済みモデルの計算なら、GPUいらないだろって?
いや、グラフィックの場合、1個だけでなく、いくつもの画素、ブロック
を並列で計算しないといけないので、学習済みモデルの適用でも、
高速でモデルの計算を並列で処理するプロセッサユニットが必要なのよ・・・
つまり、
画像処理には、専用のプロセッサユニットが必要なわけさ!
・・・AIのGPUみたいに・・・あれっ???