8月23日、
「中小企業も無視できない、統計学・人工知能の知識」
をきいてきたので、その内容をメモメモ
(時間を間違えて、はじめのほう、聞けなかった)
■これからの企業経営と統計科学
(途中から)
従来の統計学:全体的な傾向は見れる
はずれ値処理
→ビッグデータになると、孤立データがクラスタになる
→ニッチ層にもとどけられる
即時的:ベロシティ
時間的、位置的情報の反映
→ベイズ統計学
ビッグデータ利用の実例
東京ゲートブリッジ:点検が必要な箇所を割り出す
→東京都、NTTデータ 大量、バラエティ、スピード
タクシー需要予測配車(開圏システム)
お薬手帳の電子化
ビッグデータ利用の現状
ブームで飛びついた企業は悩んでいる
本来の良さを認識した企業で取り組んでいる企業も
アメリカ:これからだという機運
日本も諦める時期ではない
AIは世界を変える?
・AIとは
コンピューターにより、人間と相当もしくはそれ以上
AIじゃないAI
弱いAI
少し強いAI
強いAI
・AIじゃないAI
ファジー洗濯機:人間的な振る舞い
中身はプログラム:ルールベースプログラム
弱いAI
多くのパターンを学習、多少の推論
人間が特徴量を与えれば、自己学習可能
将棋
少し強いAI
特徴量抽出を自動で出来る
→ここまで
特徴量って何
人間の顔を認識するのには何が必要か
目が2つ、真ん中に鼻・・・
ここをみれば、人間と認識できると思われる部分
→弱いAIは、ここを見ろと教える
少し強いAIは、どこを見ればいいかまで勝手に学習する
Deep Learning
強いAI
あらゆる分野で人間と同等、あるいはそれ以上
IBMのワトソンくん
ちがうものを寄せ集めている。
これらを実現するのが、機械学習
コンピューターが人間と同じように、認識、分類、判断を行う
一連のプログラム
認識、分類、判断のためのアルゴリズムを自ら学習する
主要な学習アルゴリズム
教師有り学習
教師なし学習
教科学習
・教師有り学習
答えがあるデータを用いて学習し、答えがないデーやを予測する
画像認識、音声認識、分類問題、予測
主要な機械学習手法
回帰・重回帰・ロジスティック回帰・決定木
・教師なし学習
答えがない状態で、分類・予測などを行う
クラスタリング、データマイニング、特徴量抽出
主要な機械学習手法
クラスタリング、主成分分析、因子分析
・強化学習
なんらかの行動→報酬→学習
自動運転
主要な機械学習手法
TD学習、Q学習
シンギュラリティ:技術的特移転
人間の知能をこえて、AIがさらに頭のいいAIをつくる
シンギュラリティ:ホーキング
DeepLearningとは
・機械学習手法の1つ
・ニューラルネットワーク
ニューラルネットの進化系
特徴量抽出が児童に出来る
・はじまり
2012年:(数学的理論はこれ以前にも)
ひんとんさん
画像認識コンクール
10年以上、あたまうちだった
DeepLearningで10%ぐらいあがった
・AIベンチャーの乱立
AIビジネスの3段階
・第一段階
Google Facebook
少数のインターネット企業の河川
・第二段階
技術者がベンチャー立ち上げ
→今この段階
・大段段階
既存企業がビジネス参入
自動運転学習の例(Prefeered Network)の自動運転デモ
行動の自動獲得
スキルの共有
センサーデータの統合
・レーシングカーの動作を学習
教科学習
障害物を避ける
やさしい環境から
分散学習:他人の学習を共有できる
事例
The Next Rembrandt
医療IBM
経営判断のAI 日立
AIビジネスの現状
勢い 進化
ビジネスも作中
一般企業の可能性?アイデアたくさん
運輸:自動運転、ドローン、倉庫の自動制御
金融:コールセンター、倒産・貸し倒れリスク、株価予測
事務:帳簿付け
画像認識でレジ
→利用法は簡単、アイデアはたくさん
・初期投資と準備期間
【質疑応答】
・将棋の話
悪手:うっている人も分からない
→人工知能は乱戦にめちゃくちゃ強い
・囲碁の話
文脈依存しないとディープラーニング強い
定石を否定するような・・
・ビッグデータのサーチが減っている
ビジネスは?
声のかかる回数は減った(水面下はあるかも)
10年くらいかかる
メカニズムが分からないでもOKな段階
テンソルフローが洗練されて・・・
・ルールと学習の違い
ルールベース:ルールの更新が不可能
機械学習;ルール追加可能
強いAI:特徴量
・間違えるAI
集中と過疎
・統計学
フィッシャー・ネイマン・ピアソン:だれでも統計できるように
→p値だけみればOK
機械学習:数学よりわけわかんなくなる。
・ディープラーニング
たくさんのデータでないと出来ない:少数のデータなら従来手法
自然言語認識に弱い:
・アンケート調査の場合
理由をしりたい:従来の統計学
結果重視:AI
・ベイズ統計
学習がそもそもベイズ。機械学習の背景ベイズ
→確率:情報が確率を更新する
・結局、どの統計解析をするの?
精度が大事→それでサンプルサイズが決まる
めちゃくちゃでかいサンプル数にすれば、小さい差でも差になる
・初級統計学講座(土曜・水曜)
続初級(土曜・月曜)
ベイズ統計
・専門家を引っ張ってきて、やっちゃうのがはやい
データ分析チーム
・IoT:たまり放題
・マッチング系に数学
Amazonのレコメンドと同じ:親和度計算、距離が近いやつ
AIっていってるけど。。。
・センサーデータ:NICU 24時間監視