Smile Engineering blog ( スマイルエンジニアリング・ブログ )

ジェイエスピーからTipsや技術特集、プロジェクト物語を発信します

データ分析手法(アソシエーション分析

2018-10-30 09:15:00 | JSP-knowledge

アソシエーション分析

アソシエーション分析とは、膨大なデータから意味のある関連性(アソシエーションルール)を抽出する分析手法です。
ECサイトやPOSの取引データから「商品Aを買うと、商品Bも買う確率が高い」というようなルールを見つけ出す方法になります。

評価指標

アソシエーションの強さは以下の3つの値で評価します。
・支持度(Support)
・信頼度(Confidence)
・リフト値(Lift)

「架空の購入データ」

購入明細ID購入商品
1 弁当、バナナ、たばこ
2 パン、コーヒー、チョコレート
3 弁当、ビール、たばこ
4 雑誌、コーヒー、チョコレート
5 ビール、たばこ、コーヒー
 

⇒アソシエーションルールに変換

条件部(A) 結論部(B)支持度信頼度リフト値
弁当 たばこ 0.55 0.63 1.21
コーヒー チョコレート 0.50 0.55 1.32
ビール たばこ 0.49 0.50 1.45
         

A・Bを事象として「Aという条件の時にBが起こる」を、「A⇒B」と表します。
(Aを条件部、Bを結論部という)

1.支持度
支持度(A⇒B) = 条件部(A)と結論部(B)をともに含むデータ数 ÷ 全データ数

全データの中で、「商品Aを購入するときに、商品Bも一緒に購入する」というルールが出現する割合です。
この指標が高いほど、全体の中でそのルールが出現する割合が高くなります。

2.信頼度
信頼度(A⇒B) = 条件部(A)と結論部(B)をともに含むデータ数 ÷ 条件部(A)を含むデータ数

条件部(A)の項目が出現する割合の中で、条件部(A)と結論部(B)が同時に出現する割合です。
この指標が高いほど、AとBの商品は関連が強いということになります。

3.リフト値
リフト値 = 確信度(A⇒B) ÷ 結論部(B)を含むデータ数

条件部(A)と一緒に結論部(B)を購入した顧客の割合が、全データの中で結論部(B)を購入した顧客の割合よりどのくらい多いかを示したものです。
この指標が低いほど、Bの商品は単独でよく売れているということになります。

 

 moniswitch
  今お使いの離床センサーがそのまま使える!
  離床センサーのスイッチ入れ忘れ事故を防止するスマートスイッチ 

monipet
  動物病院の犬猫の見守りをサポート
  病院を離れる夜間でも安心

ASSE/CORPA
  センサー、IoT、ビッグデータを活用して新たな価値を創造
  「できたらいいな」を「できる」に

OSGi対応 ECHONET Lite ミドルウェア
  短納期HEMS開発をサポート!

GuruPlug
  カードサイズ スマートサーバ

株式会社ジェイエスピー
  横浜に拠点を置くソフトウェア開発・システム開発・
  製品開発(monipet)、それに農業も手がけるIT企業

ジャンル:
ウェブログ
コメント   この記事についてブログを書く
« Audactyで周波数分析 | トップ | 音声合成ライブラリ OpenJTal... »
最近の画像もっと見る

コメントを投稿

JSP-knowledge」カテゴリの最新記事