7月10日
WorksApplications
AI-Data Scienceチーム事例紹介
に行ってきた!ので内容メモメモ
■会社紹介など
・本日のアジェンダ
・会社説明
・to the future HUE
世界の働くを変える
■「AIすだちくん」の内部ロジック
・自己紹介
・AIすだちくんとは
すだちくんをつかったWebコンテンツ
職業と生存率を予測
NLP研究所の開所式に向け作成
・AIすだちくんのフロー
質問表示(3たく)
ユーザー回答
質問(自由記述)
職業と生存率
結果を入れる
・事前データ
質問文:必要に応じて
職業
・職業宛の目標とアプローチ
目標:少ない質問
アプローチ:決定木
・決定木学習
回帰、分類モデル
分類ルールを木構造で保持
分類ルールの生成
質問したら、より偏りが出る質問をする
偏り→エントロピー
回答
学習方法:エントロピーを減少させる質問がなくなった時点で質問終了
・バンディッド問題
同じ学習木を使うと同じ質問ばかりでる
→ランダムに
・職業生存確率の計算
マイケルオズボーン先生の論文+自由記述のネガポジ(TF-IDF)
・実装
Python WebフレームワークDjango
Radisで回答傾向を保持
・苦労した点
ランダムな質問の扱い:決定木を複数
負荷テスト:研修生800人による一斉アクセス(すぐだうん)
・体験者の回答傾向
正答率
アクセス数:おちている→PR必要
決定木
どんな人が遊んでいる?:SE,営業、PG
職業別正答率
・まとめ
初期データ:違うサイトで集めたデータを使ったが、はじめ正答率が低かった
■「社内おトイレIoT」に本気(?)で取り組んでみた話
・おトイレIoT戦国時代
・なにをしたか
データインべすてぃげーしょん
モデリング
パラメータフィッティング
結果
・受け取ったデータ
3がつ4がつの2日間
・滞在時間が長い人がいる→使い方が変な人
可視化したら・・・
・モデル
待ち行列モデル
ポアソン分布と指数分布
待ち行列の種類(ケンドールの手法で)
・マルコフ連鎖の定常状態解析の例
Page rank
系統分子進化学
・定常状態解析
ポラチェック・ヒンキンの公式
到着率
カテゴリかる分布に従うとしてMCMC(PyStar)
・まとめ
今後は共変量
■ワークスアプリケーションズにおいて開発を進めるAI機能の紹介
・自己紹介
・AI技術の動向
2015年のハイプサイクル
機械学習は坂を転がり落ちる予定が、DLでとまったが
今落ち始めているところ
→大事なのは、クラウドコンピューティング(大規模リソース)
・ビッグデータからAI
データのライフサイクル:入力業務の省力化
→入力サジェスト
NLP:オープンソースを使いながらコントリビュート
・業務サポート
・分析
・ダッシュボード機能
・文書検索
いろんな検索
・コラボレーション機能
いい場所にスケジュールを設定しよう
ソーシャルグラフ 外せないミーティングを探す
・QA Botを搭載
HR Bot
・サジェスト
・タイムラインによる状況をかんがみたリマインド
・HUEによるAI
入力
処理
分析
検索・共有
再利用
WorksApplications
AI-Data Scienceチーム事例紹介
に行ってきた!ので内容メモメモ
■会社紹介など
・本日のアジェンダ
・会社説明
・to the future HUE
世界の働くを変える
■「AIすだちくん」の内部ロジック
・自己紹介
・AIすだちくんとは
すだちくんをつかったWebコンテンツ
職業と生存率を予測
NLP研究所の開所式に向け作成
・AIすだちくんのフロー
質問表示(3たく)
ユーザー回答
質問(自由記述)
職業と生存率
結果を入れる
・事前データ
質問文:必要に応じて
職業
・職業宛の目標とアプローチ
目標:少ない質問
アプローチ:決定木
・決定木学習
回帰、分類モデル
分類ルールを木構造で保持
分類ルールの生成
質問したら、より偏りが出る質問をする
偏り→エントロピー
回答
学習方法:エントロピーを減少させる質問がなくなった時点で質問終了
・バンディッド問題
同じ学習木を使うと同じ質問ばかりでる
→ランダムに
・職業生存確率の計算
マイケルオズボーン先生の論文+自由記述のネガポジ(TF-IDF)
・実装
Python WebフレームワークDjango
Radisで回答傾向を保持
・苦労した点
ランダムな質問の扱い:決定木を複数
負荷テスト:研修生800人による一斉アクセス(すぐだうん)
・体験者の回答傾向
正答率
アクセス数:おちている→PR必要
決定木
どんな人が遊んでいる?:SE,営業、PG
職業別正答率
・まとめ
初期データ:違うサイトで集めたデータを使ったが、はじめ正答率が低かった
■「社内おトイレIoT」に本気(?)で取り組んでみた話
・おトイレIoT戦国時代
・なにをしたか
データインべすてぃげーしょん
モデリング
パラメータフィッティング
結果
・受け取ったデータ
3がつ4がつの2日間
・滞在時間が長い人がいる→使い方が変な人
可視化したら・・・
・モデル
待ち行列モデル
ポアソン分布と指数分布
待ち行列の種類(ケンドールの手法で)
・マルコフ連鎖の定常状態解析の例
Page rank
系統分子進化学
・定常状態解析
ポラチェック・ヒンキンの公式
到着率
カテゴリかる分布に従うとしてMCMC(PyStar)
・まとめ
今後は共変量
■ワークスアプリケーションズにおいて開発を進めるAI機能の紹介
・自己紹介
・AI技術の動向
2015年のハイプサイクル
機械学習は坂を転がり落ちる予定が、DLでとまったが
今落ち始めているところ
→大事なのは、クラウドコンピューティング(大規模リソース)
・ビッグデータからAI
データのライフサイクル:入力業務の省力化
→入力サジェスト
NLP:オープンソースを使いながらコントリビュート
・業務サポート
・分析
・ダッシュボード機能
・文書検索
いろんな検索
・コラボレーション機能
いい場所にスケジュールを設定しよう
ソーシャルグラフ 外せないミーティングを探す
・QA Botを搭載
HR Bot
・サジェスト
・タイムラインによる状況をかんがみたリマインド
・HUEによるAI
入力
処理
分析
検索・共有
再利用