ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

データ分析の基本まとめ

2013-06-01 09:20:30 | AI・BigData
 データ分析の授業で、ふむふむと思ったことのまとめ
 (データ分析の授業は、修士用、いつものマーケティングは博士用の授業なので、
  授業レベルが違う。こちらは、基本的な話)




データの調べ方

■1変数で見る
  ・代表値で考える
     平均値(メジアン、モード)、分散(標準偏差)、歪度、尖度
  ・図で考える
     ヒストグラム、箱ひげ

■2変数で見る
  ・質的データ
     クロス表
  ・量的データ
    ・代表値で考える
       相関係数(共分散)
    ・図で考える
       散布図




散布図を見ないで、相関を考えてしまうと危険なケース

・はずれ値
・線形でない(曲線)関係
・異質な集団の集まり
・選抜効果(合格者のみで見るなど)
・擬似相関 XYがZに関連
  →偏相関 Zの影響を引く




分類について
■教師データあり
   判別分析
   ロジスティック回帰
   ニューラルネット
■教師データなし
   クラスター分析
   自己組織化マップ
   潜在クラス分析


日本分類学会
http://www.bunrui.jp/





その他

スタージェスの公式はヒストグラムで、大雑把な分布を知るときに有効なのであり、細かな部分を見るのが目的ならば、当然、目的に応じて、階級を決める。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする