ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

重回帰分析の問題点

2013-04-13 23:25:58 | AI・BigData
今日の授業で聞いてきた話の備忘録。
メモメモ




■重回帰の変数の問題

たとえば、スマートハウスを考えよう
温度センサーが10箇所あって、エアコンが2つ、YとZがあったとする。
今、Yの温度が知りたい。
温度センサーのX2とX3の平均を取れば、わかるということが、わかった

Y=0.5X2+0.5X3

でも、この式、変じゃないか?
因果関係的に見れば、エアコンYが暖めている(=原因)によって、X2,X3の
温度が上がるのに、あたかも、X2とX3の観測値(=結果)で原因が決まる?

この場合、回帰式を立てたときと、予測しようとするときが、
同じ環境としてであれば、道具として使う分には、予測可能

でも、環境が変われば(たとえばZの温度を上げたら)
この予測式は、狂ってくるかもしれない(Yの温度は、予測式よりもっと上がる?下がるかも)




■変数の誤差

 6月だけ、7月だけ、8月だけを求めた回帰式の平均が
6月から8月まで測定したものをまとめた回帰式になるわけではない。

これは、説明変数の誤差が大きいときに起こる

 共分散構造分析にもっていくか、誤差に対して値の幅が大きく振れるものを使う




■平均的な値

 ビッグデータなどであるように、データを集めると、平均的なものになってしまう
 実は、平均的なものではない、例外が重要

 例:Hadoopを使って、商圏は、300m程度ということを求めるのが重要ではなく
 平均300mだが、1Kmになっているところ(例外)があったとしたら、
  なぜその店舗は1Kmの商圏を持っているのかを知ることのほうが重要
この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« メーカーが傾聴する3つの声... | トップ | 日本MS「WindowsXPは7の10倍... »
最新の画像もっと見る

AI・BigData」カテゴリの最新記事