統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(11)

2007-06-22 11:04:07 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

重回帰分析などでのダミー変数について考えて見ましょう。重回帰型の多変量解析では独立変数(説明変数)が例えば、腫瘍タイプ「Squamous=0、Small=1、Adeno=2、Large=3」のとき、成書などによると次の様な3つのダミー変数を与えるとあります。

「1,0,1」、「0,1,0」、「0,0,1」、「0,0,0」

ところが、沢山の変数がすべて3つ以上であったなら、あなたはその煩雑さに戸惑ってしまうことでしょう。こんな時は、そのまま「0,1,2,3」で分析し、分析結果から有意な変数を抽出した後に有意な変数についてダミー変数を作り再分析する方が現実的で効果的です。沢山の変数を一つ一つダミー化して分析を複雑にするより、単純化して問題の本質に迫るべきではないでしょうか。商用の統計ソフトのなかにはダミー変数を自動で作ってくれるものも有りまが、やはりデータの吟味は手動によってのみ得られる情報があると思います。