前に書き忘れたシリーズ?のつづき。
9月12日IBM Xcite 2014の
予測分析プロジェクトの成功と失敗の分岐点
~失敗しない為の7つのEssence~
の話をメモメモ
成否を分けるポイント
目的と手段
予測と誤差
部分と全体
ビルドタイムとランタイム
サイエンスとアート
理論と実践
投資と効果
【1.目的と手段】
X全社高度分析基盤を検証しています。どんなインフラが必要ですか?
統計・多変量解析(~1999)
データマイニング(1999~)
予測分析(2006~)
ビッグデータアナリティクス(2011年~)
AI、分散処理やクラウドなど、キーワードは変化する。
自社データで何ができるのかを見極めて、有効な領域に投資
投資価値のあるビジネス領域にデータを使って改善する
目的を明確に持ち、常にそこに立ち返る
目的
人 製造業
顧客化 品質改善
顧客育成 予知保全 Predictive mentenance
顧客維持 需要予測
リスク審査 営業生産性向上
不正検知 価格適正化
販促最適化(オムニチャネル)
業務でどう生かせるか
Predictive Maintenance Quality
モニター情報から保守
【2.予測と誤差】
X予測って、本当に当たるんですか?
あたりません
誤差が生じる前提で、業務視点から、これに折り合う誤差を小さくする
正誤行列と予測精度・・片方に寄せてしまうと正答性が上がるとき
判別効率グラフ:疑わしいのをとる
オオカミ少年と転ばぬ先の杖
だれがどれだけ得をする?
【3.部分と全体】
Xビッグデータ分析なんだから、サンプリングしたら意味ないですよね
正しくサンプリングすれば、全体事象に近似する
データがたくさんあることが、ビッグデータではない
1.情報のリアルタイム収集
2.分散データ処理
3.情報の連携
いろいろなデータを潔く捨てることも必要
【4.ビルドタイムとランタイム】
・業務実装後、勝手に学習しながらモデルが賢くなる技術はないんですか?
チャンピオン チャレンジャー モデル
テクノロジー上はできる
ビルドタイムとランタイム
式をつくる:ビルドタイム
実行する:ランタイム
モデルを作るときは、精度だけでなく、安定性も重要
collaboration & deployment services
CADS
【5.サイエンスとアート】
○現場のベテランの勘も不思議と当たるんですよね
ハイブリッドなやり方→仮説がある人
サイエンスとアート
KDD(勘と度胸と・・) ビジネスルール
これはやらないという企業のポリシー
経験と予測を融合させる:デシジョンリスト
【6.理論と実践】
X分析プロジェクトには、理系出身者が向いているんですか?
後から理論を学べばよい
アンサンブルモデル
【7.投資と効果】
・この予測分析PJで、なんぼ儲かるの?
スモールスタート
リスクの回避やコスト削減
■まとめ
目的と手段→目的に立ち返る
予測と誤差→誤差を織り込み利益を確保
部分と全体→正しく捨てる潔さが必要
ビルドタイムとランタイム→作ると運用するは違う
サイエンスとアート→経験と予測を調和させる
理論と実践→実践先行で、理論が追従
投資と効果→小さく初めて、大きく稼ぐ
9月12日IBM Xcite 2014の
予測分析プロジェクトの成功と失敗の分岐点
~失敗しない為の7つのEssence~
の話をメモメモ
成否を分けるポイント
目的と手段
予測と誤差
部分と全体
ビルドタイムとランタイム
サイエンスとアート
理論と実践
投資と効果
【1.目的と手段】
X全社高度分析基盤を検証しています。どんなインフラが必要ですか?
統計・多変量解析(~1999)
データマイニング(1999~)
予測分析(2006~)
ビッグデータアナリティクス(2011年~)
AI、分散処理やクラウドなど、キーワードは変化する。
自社データで何ができるのかを見極めて、有効な領域に投資
投資価値のあるビジネス領域にデータを使って改善する
目的を明確に持ち、常にそこに立ち返る
目的
人 製造業
顧客化 品質改善
顧客育成 予知保全 Predictive mentenance
顧客維持 需要予測
リスク審査 営業生産性向上
不正検知 価格適正化
販促最適化(オムニチャネル)
業務でどう生かせるか
Predictive Maintenance Quality
モニター情報から保守
【2.予測と誤差】
X予測って、本当に当たるんですか?
あたりません
誤差が生じる前提で、業務視点から、これに折り合う誤差を小さくする
正誤行列と予測精度・・片方に寄せてしまうと正答性が上がるとき
判別効率グラフ:疑わしいのをとる
オオカミ少年と転ばぬ先の杖
だれがどれだけ得をする?
【3.部分と全体】
Xビッグデータ分析なんだから、サンプリングしたら意味ないですよね
正しくサンプリングすれば、全体事象に近似する
データがたくさんあることが、ビッグデータではない
1.情報のリアルタイム収集
2.分散データ処理
3.情報の連携
いろいろなデータを潔く捨てることも必要
【4.ビルドタイムとランタイム】
・業務実装後、勝手に学習しながらモデルが賢くなる技術はないんですか?
チャンピオン チャレンジャー モデル
テクノロジー上はできる
ビルドタイムとランタイム
式をつくる:ビルドタイム
実行する:ランタイム
モデルを作るときは、精度だけでなく、安定性も重要
collaboration & deployment services
CADS
【5.サイエンスとアート】
○現場のベテランの勘も不思議と当たるんですよね
ハイブリッドなやり方→仮説がある人
サイエンスとアート
KDD(勘と度胸と・・) ビジネスルール
これはやらないという企業のポリシー
経験と予測を融合させる:デシジョンリスト
【6.理論と実践】
X分析プロジェクトには、理系出身者が向いているんですか?
後から理論を学べばよい
アンサンブルモデル
【7.投資と効果】
・この予測分析PJで、なんぼ儲かるの?
スモールスタート
リスクの回避やコスト削減
■まとめ
目的と手段→目的に立ち返る
予測と誤差→誤差を織り込み利益を確保
部分と全体→正しく捨てる潔さが必要
ビルドタイムとランタイム→作ると運用するは違う
サイエンスとアート→経験と予測を調和させる
理論と実践→実践先行で、理論が追従
投資と効果→小さく初めて、大きく稼ぐ