データ分析の授業で、ふむふむと思ったことのまとめ
(データ分析の授業は、修士用、いつものマーケティングは博士用の授業なので、
授業レベルが違う。こちらは、基本的な話)
データの調べ方
■1変数で見る
・代表値で考える
平均値(メジアン、モード)、分散(標準偏差)、歪度、尖度
・図で考える
ヒストグラム、箱ひげ
■2変数で見る
・質的データ
クロス表
・量的データ
・代表値で考える
相関係数(共分散)
・図で考える
散布図
散布図を見ないで、相関を考えてしまうと危険なケース
・はずれ値
・線形でない(曲線)関係
・異質な集団の集まり
・選抜効果(合格者のみで見るなど)
・擬似相関 XYがZに関連
→偏相関 Zの影響を引く
分類について
■教師データあり
判別分析
ロジスティック回帰
ニューラルネット
■教師データなし
クラスター分析
自己組織化マップ
潜在クラス分析
日本分類学会
http://www.bunrui.jp/
その他
・スタージェスの公式はヒストグラムで、大雑把な分布を知るときに有効なのであり、細かな部分を見るのが目的ならば、当然、目的に応じて、階級を決める。
(データ分析の授業は、修士用、いつものマーケティングは博士用の授業なので、
授業レベルが違う。こちらは、基本的な話)
データの調べ方
■1変数で見る
・代表値で考える
平均値(メジアン、モード)、分散(標準偏差)、歪度、尖度
・図で考える
ヒストグラム、箱ひげ
■2変数で見る
・質的データ
クロス表
・量的データ
・代表値で考える
相関係数(共分散)
・図で考える
散布図
散布図を見ないで、相関を考えてしまうと危険なケース
・はずれ値
・線形でない(曲線)関係
・異質な集団の集まり
・選抜効果(合格者のみで見るなど)
・擬似相関 XYがZに関連
→偏相関 Zの影響を引く
分類について
■教師データあり
判別分析
ロジスティック回帰
ニューラルネット
■教師データなし
クラスター分析
自己組織化マップ
潜在クラス分析
日本分類学会
http://www.bunrui.jp/
その他
・スタージェスの公式はヒストグラムで、大雑把な分布を知るときに有効なのであり、細かな部分を見るのが目的ならば、当然、目的に応じて、階級を決める。