唐突・・・というわけでもなく、前から少しずつ考えていたんですが、
今回、もう少し深く考えてみようと思い、簡単にまとめてみようかと思います。
背景
仮説
手法
特徴
ちょっと疲れたのでここまで。手法、特徴はかなり雑なので、そのうちもう少し丁寧に書くかもしれません。
もう既に論文がありそうな感じですね。レコメンド系、協調フィルタリング系、リンクマイニング系・・・。
今回、もう少し深く考えてみようと思い、簡単にまとめてみようかと思います。
背景
Web上では購買品に対しレビューが書かれている。
レビュー情報としては、文章、点数など。
例.Amazonのレビュー
レビュー情報としては、文章、点数など。
例.Amazonのレビュー
仮説
商品Aに対して同じ評価をつけたユーザとして、ユーザ1、ユーザ2、ユーザ3が存在。
もし、商品Bに対してユーザ2、ユーザ3が高評価(文章:肯定表現が高頻度で出現、点数:平均より高い値)の場合、ユーザ1に対する商品Bのレコメンドが成立するのではないか?
もし、商品Bに対してユーザ2、ユーザ3が高評価(文章:肯定表現が高頻度で出現、点数:平均より高い値)の場合、ユーザ1に対する商品Bのレコメンドが成立するのではないか?
手法
現状では点数のみを考える
1.ユーザ1が商品Aに対して点数付け
2.商品Aに対しユーザ1と同じ点数付けを行ったユーザを集める
3.それらのユーザが、ユーザ1が他の商品につけた点数とどれだけ一致しているかを計算(差分の総和?) 小さいほどユーザ1に対する影響度は大きい
4.ユーザ1がレビューしてない かつ 他のユーザがレビューしている全商品で高い点数のものを集める(5段階評価 低1← →5高 で4以上など)
5.4.で集めたアイテムに対しレコメンド値を求め、レコメンド値の高い順にソート
(レコメンド値 = ユーザ2の影響度 × ユーザ2の点数 + ユーザ3の影響度 × ユーザ3の点数 + ・・・)
6.上位n個をユーザ1に対して提示 (n:10-20)
1.ユーザ1が商品Aに対して点数付け
2.商品Aに対しユーザ1と同じ点数付けを行ったユーザを集める
3.それらのユーザが、ユーザ1が他の商品につけた点数とどれだけ一致しているかを計算(差分の総和?) 小さいほどユーザ1に対する影響度は大きい
4.ユーザ1がレビューしてない かつ 他のユーザがレビューしている全商品で高い点数のものを集める(5段階評価 低1← →5高 で4以上など)
5.4.で集めたアイテムに対しレコメンド値を求め、レコメンド値の高い順にソート
(レコメンド値 = ユーザ2の影響度 × ユーザ2の点数 + ユーザ3の影響度 × ユーザ3の点数 + ・・・)
6.上位n個をユーザ1に対して提示 (n:10-20)
特徴
「点数付け」という行動に対してレコメンド
「商品Aを買った他の人は商品Bも買っています」では、本当にその人に商品Bが適切かどうかは分からない。「商品Aが全然良くなかった・・・」という評価の場合、単純に他の人も買っているからと商品Bを薦める価値は低いかもしれない。
「商品Aを買った他の人は商品Bも買っています」では、本当にその人に商品Bが適切かどうかは分からない。「商品Aが全然良くなかった・・・」という評価の場合、単純に他の人も買っているからと商品Bを薦める価値は低いかもしれない。
ちょっと疲れたのでここまで。手法、特徴はかなり雑なので、そのうちもう少し丁寧に書くかもしれません。
もう既に論文がありそうな感じですね。レコメンド系、協調フィルタリング系、リンクマイニング系・・・。