統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。
重回帰分析などでのダミー変数について考えて見ましょう。重回帰型の多変量解析では独立変数(説明変数)が例えば、腫瘍タイプ「Squamous=0、Small=1、Adeno=2、Large=3」のとき、成書などによると次の様な3つのダミー変数を与えるとあります。
「1,0,1」、「0,1,0」、「0,0,1」、「0,0,0」
ところが、沢山の変数がすべて3つ以上であったなら、あなたはその煩雑さに戸惑ってしまうことでしょう。こんな時は、そのまま「0,1,2,3」で分析し、分析結果から有意な変数を抽出した後に有意な変数についてダミー変数を作り再分析する方が現実的で効果的です。沢山の変数を一つ一つダミー化して分析を複雑にするより、単純化して問題の本質に迫るべきではないでしょうか。商用の統計ソフトのなかにはダミー変数を自動で作ってくれるものも有りまが、やはりデータの吟味は手動によってのみ得られる情報があると思います。