ビッグデータビジネス、声のかかる機会は以前より減っている？

2016-08-24 10:11:25 | AI・BigData

８月２３日、
「中小企業も無視できない、統計学・人工知能の知識」
をきいてきたので、その内容をメモメモ
（時間を間違えて、はじめのほう、聞けなかった）

■これからの企業経営と統計科学
（途中から）
従来の統計学：全体的な傾向は見れる
　はずれ値処理
　→ビッグデータになると、孤立データがクラスタになる
　　　→ニッチ層にもとどけられる
　　即時的：ベロシティ
　　　時間的、位置的情報の反映
　　　→ベイズ統計学

ビッグデータ利用の実例
　東京ゲートブリッジ：点検が必要な箇所を割り出す
　　→東京都、ＮＴＴデータ　大量、バラエティ、スピード
　タクシー需要予測配車（開圏システム）
　お薬手帳の電子化

ビッグデータ利用の現状
　ブームで飛びついた企業は悩んでいる
　　本来の良さを認識した企業で取り組んでいる企業も
　アメリカ：これからだという機運
　　日本も諦める時期ではない

ＡＩは世界を変える？
・ＡＩとは
　コンピューターにより、人間と相当もしくはそれ以上
　　ＡＩじゃないＡＩ
　　弱いＡＩ
　　少し強いＡＩ
　　強いＡＩ

・ＡＩじゃないＡＩ
　ファジー洗濯機：人間的な振る舞い
　　中身はプログラム：ルールベースプログラム

　弱いＡＩ
　　多くのパターンを学習、多少の推論
　　人間が特徴量を与えれば、自己学習可能
　　　将棋

　少し強いＡＩ
　　特徴量抽出を自動で出来る
　　→ここまで

特徴量って何
　人間の顔を認識するのには何が必要か
　　目が２つ、真ん中に鼻・・・
　ここをみれば、人間と認識できると思われる部分
　→弱いＡＩは、ここを見ろと教える
　　少し強いＡＩは、どこを見ればいいかまで勝手に学習する
　　　Ｄｅｅｐ　Ｌｅａｒｎｉｎｇ

　強いＡＩ
　あらゆる分野で人間と同等、あるいはそれ以上

ＩＢＭのワトソンくん
　ちがうものを寄せ集めている。

これらを実現するのが、機械学習
　コンピューターが人間と同じように、認識、分類、判断を行う
　一連のプログラム
　認識、分類、判断のためのアルゴリズムを自ら学習する

主要な学習アルゴリズム
　　教師有り学習
　　教師なし学習
　　教科学習

・教師有り学習
　　答えがあるデータを用いて学習し、答えがないデーやを予測する
　　　画像認識、音声認識、分類問題、予測
　　主要な機械学習手法
　　　回帰・重回帰・ロジスティック回帰・決定木

・教師なし学習
　答えがない状態で、分類・予測などを行う
　　　クラスタリング、データマイニング、特徴量抽出
　主要な機械学習手法
　　　クラスタリング、主成分分析、因子分析

・強化学習
　なんらかの行動→報酬→学習
　　自動運転
　主要な機械学習手法
　　ＴＤ学習、Ｑ学習

シンギュラリティ：技術的特移転
　人間の知能をこえて、ＡＩがさらに頭のいいＡＩをつくる
　シンギュラリティ：ホーキング

ＤｅｅｐＬｅａｒｎｉｎｇとは
・機械学習手法の１つ
・ニューラルネットワーク
　　ニューラルネットの進化系
　特徴量抽出が児童に出来る
・はじまり
　２０１２年：（数学的理論はこれ以前にも）
　　ひんとんさん
　　画像認識コンクール
　　　１０年以上、あたまうちだった
　　　DeepLearningで１０％ぐらいあがった
・ＡＩベンチャーの乱立

ＡＩビジネスの３段階
・第一段階
　Ｇｏｏｇｌｅ　Ｆａｃｅｂｏｏｋ
　　少数のインターネット企業の河川

・第二段階
　技術者がベンチャー立ち上げ
　　→今この段階

・大段段階
　既存企業がビジネス参入
　
自動運転学習の例(Prefeered Network）の自動運転デモ
　　行動の自動獲得
　　スキルの共有
　　センサーデータの統合
・レーシングカーの動作を学習
　　教科学習
　障害物を避ける
　やさしい環境から
　　分散学習：他人の学習を共有できる

事例
　Ｔｈｅ　Ｎｅｘｔ　Ｒｅｍｂｒａｎｄｔ
　医療ＩＢＭ
　経営判断のＡＩ　日立

ＡＩビジネスの現状
　勢い　進化
　ビジネスも作中
　一般企業の可能性？アイデアたくさん
　　運輸：自動運転、ドローン、倉庫の自動制御
　　金融：コールセンター、倒産・貸し倒れリスク、株価予測
　　事務：帳簿付け
　　画像認識でレジ
　→利用法は簡単、アイデアはたくさん

・初期投資と準備期間

【質疑応答】
・将棋の話
　悪手：うっている人も分からない
　→人工知能は乱戦にめちゃくちゃ強い
・囲碁の話
　文脈依存しないとディープラーニング強い
　定石を否定するような・・
・ビッグデータのサーチが減っている
　ビジネスは？
　　声のかかる回数は減った（水面下はあるかも）
　　１０年くらいかかる
　　　メカニズムが分からないでもＯＫな段階
　　　テンソルフローが洗練されて・・・
・ルールと学習の違い
　　ルールベース：ルールの更新が不可能
　　機械学習；ルール追加可能
　　強いＡＩ：特徴量
・間違えるＡＩ
　　集中と過疎
・統計学
　フィッシャー・ネイマン・ピアソン：だれでも統計できるように
　　→ｐ値だけみればＯＫ
　機械学習：数学よりわけわかんなくなる。
・ディープラーニング
　　たくさんのデータでないと出来ない：少数のデータなら従来手法
　　自然言語認識に弱い：
・アンケート調査の場合
　　理由をしりたい：従来の統計学
　　結果重視：ＡＩ
・ベイズ統計
　　学習がそもそもベイズ。機械学習の背景ベイズ
　　→確率：情報が確率を更新する
・結局、どの統計解析をするの？
　精度が大事→それでサンプルサイズが決まる
　めちゃくちゃでかいサンプル数にすれば、小さい差でも差になる
・初級統計学講座（土曜・水曜）
　続初級（土曜・月曜）
　ベイズ統計
・専門家を引っ張ってきて、やっちゃうのがはやい
　　データ分析チーム
・ＩｏＴ：たまり放題
・マッチング系に数学
　　Ａｍａｚｏｎのレコメンドと同じ：親和度計算、距離が近いやつ
　　ＡＩっていってるけど。。。
・センサーデータ：ＮＩＣＵ　２４時間監視

ランキングに参加中。クリックして応援お願いします！

日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

アクセス
閲覧	1,416	PV
訪問者	715	IP
トータル
閲覧	34,613,363	PV
訪問者	8,572,176	IP
ランキング
日別	548	位
週別	556	位

	【gooブロガー・先着】dアカウント連携でdポイント2,000pt
	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）