ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

ビッグデータビジネス、声のかかる機会は以前より減っている?

2016-08-24 10:11:25 | AI・BigData
8月23日、
「中小企業も無視できない、統計学・人工知能の知識」
をきいてきたので、その内容をメモメモ
(時間を間違えて、はじめのほう、聞けなかった)




■これからの企業経営と統計科学
(途中から)
従来の統計学:全体的な傾向は見れる
 はずれ値処理
 →ビッグデータになると、孤立データがクラスタになる
   →ニッチ層にもとどけられる
  即時的:ベロシティ
   時間的、位置的情報の反映
   →ベイズ統計学

ビッグデータ利用の実例
 東京ゲートブリッジ:点検が必要な箇所を割り出す
  →東京都、NTTデータ 大量、バラエティ、スピード
 タクシー需要予測配車(開圏システム)
 お薬手帳の電子化

ビッグデータ利用の現状
 ブームで飛びついた企業は悩んでいる
  本来の良さを認識した企業で取り組んでいる企業も
 アメリカ:これからだという機運
  日本も諦める時期ではない


AIは世界を変える?
・AIとは
 コンピューターにより、人間と相当もしくはそれ以上
  AIじゃないAI
  弱いAI
  少し強いAI
  強いAI

・AIじゃないAI
 ファジー洗濯機:人間的な振る舞い
  中身はプログラム:ルールベースプログラム

 弱いAI
  多くのパターンを学習、多少の推論
  人間が特徴量を与えれば、自己学習可能
   将棋

 少し強いAI
  特徴量抽出を自動で出来る
  →ここまで

特徴量って何
 人間の顔を認識するのには何が必要か
  目が2つ、真ん中に鼻・・・
 ここをみれば、人間と認識できると思われる部分
 →弱いAIは、ここを見ろと教える
  少し強いAIは、どこを見ればいいかまで勝手に学習する
   Deep Learning

 強いAI
 あらゆる分野で人間と同等、あるいはそれ以上

IBMのワトソンくん
 ちがうものを寄せ集めている。

これらを実現するのが、機械学習
 コンピューターが人間と同じように、認識、分類、判断を行う
 一連のプログラム
 認識、分類、判断のためのアルゴリズムを自ら学習する

主要な学習アルゴリズム
  教師有り学習
  教師なし学習
  教科学習

・教師有り学習
  答えがあるデータを用いて学習し、答えがないデーやを予測する
   画像認識、音声認識、分類問題、予測
  主要な機械学習手法
   回帰・重回帰・ロジスティック回帰・決定木

・教師なし学習
 答えがない状態で、分類・予測などを行う
   クラスタリング、データマイニング、特徴量抽出
 主要な機械学習手法
   クラスタリング、主成分分析、因子分析

・強化学習
 なんらかの行動→報酬→学習
  自動運転
 主要な機械学習手法
  TD学習、Q学習

シンギュラリティ:技術的特移転
 人間の知能をこえて、AIがさらに頭のいいAIをつくる
 シンギュラリティ:ホーキング

DeepLearningとは
・機械学習手法の1つ
・ニューラルネットワーク
  ニューラルネットの進化系
 特徴量抽出が児童に出来る
・はじまり
 2012年:(数学的理論はこれ以前にも)
  ひんとんさん
  画像認識コンクール
   10年以上、あたまうちだった
   DeepLearningで10%ぐらいあがった
・AIベンチャーの乱立

AIビジネスの3段階
・第一段階
 Google Facebook
  少数のインターネット企業の河川

・第二段階
 技術者がベンチャー立ち上げ
  →今この段階

・大段段階
 既存企業がビジネス参入
 
自動運転学習の例(Prefeered Network)の自動運転デモ
  行動の自動獲得
  スキルの共有
  センサーデータの統合
・レーシングカーの動作を学習
  教科学習
 障害物を避ける
 やさしい環境から
  分散学習:他人の学習を共有できる

事例
 The Next Rembrandt
 医療IBM
 経営判断のAI 日立

AIビジネスの現状
 勢い 進化
 ビジネスも作中
 一般企業の可能性?アイデアたくさん
  運輸:自動運転、ドローン、倉庫の自動制御
  金融:コールセンター、倒産・貸し倒れリスク、株価予測
  事務:帳簿付け
  画像認識でレジ
 →利用法は簡単、アイデアはたくさん

・初期投資と準備期間

【質疑応答】
・将棋の話
 悪手:うっている人も分からない
 →人工知能は乱戦にめちゃくちゃ強い
・囲碁の話
 文脈依存しないとディープラーニング強い
 定石を否定するような・・
・ビッグデータのサーチが減っている
 ビジネスは?
  声のかかる回数は減った(水面下はあるかも)
  10年くらいかかる
   メカニズムが分からないでもOKな段階
   テンソルフローが洗練されて・・・
・ルールと学習の違い
  ルールベース:ルールの更新が不可能
  機械学習;ルール追加可能
  強いAI:特徴量
・間違えるAI
  集中と過疎
・統計学
 フィッシャー・ネイマン・ピアソン:だれでも統計できるように
  →p値だけみればOK
 機械学習:数学よりわけわかんなくなる。
・ディープラーニング
  たくさんのデータでないと出来ない:少数のデータなら従来手法
  自然言語認識に弱い:
・アンケート調査の場合
  理由をしりたい:従来の統計学
  結果重視:AI
・ベイズ統計
  学習がそもそもベイズ。機械学習の背景ベイズ
  →確率:情報が確率を更新する
・結局、どの統計解析をするの?
 精度が大事→それでサンプルサイズが決まる
 めちゃくちゃでかいサンプル数にすれば、小さい差でも差になる
・初級統計学講座(土曜・水曜)
 続初級(土曜・月曜)
 ベイズ統計
・専門家を引っ張ってきて、やっちゃうのがはやい
  データ分析チーム
・IoT:たまり放題
・マッチング系に数学
  Amazonのレコメンドと同じ:親和度計算、距離が近いやつ
  AIっていってるけど。。。
・センサーデータ:NICU 24時間監視
この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« IoTとIndustry4.0の違い | トップ | Raspberry PiでRCAが動作しな... »
最新の画像もっと見る

AI・BigData」カテゴリの最新記事