統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(63)

2011-06-13 18:12:35 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

テキストマイニング分析ソフトの使用経験(その1)

診療現場での医師と患者の自由文アンケートを要約したファイルを下記のURLからダウンロード出来ます。

  http://www3.ocn.ne.jp/~stat/dbase/dbase.html

画面の Down Loard ( 医師・患者アンケート ) をクリックしダウンロードすると、
「Enquate.xls (sheet名:医師自由文、患者自由文)」をみることが出来ます。ここでは、
このサンプル・ファイルのデータをフリーソフトの「KH Coder」を使って分析してみましょう。まずは、使用に当たって下記のURL にアクセスして下さい。

   http://khc.sourceforge.net/

そして、
「KH Coder の入手」から、Windows 版パッケージ 「 khcoder-2b25a-f.exe (2011 05/25) 」 をダウンロードして下さい。ダウンロードの後に、このファイルをダブルクリックすれば、自動的に下記のディレクトリー階層になると思います。

図1:KH Coder のディレクトリー階層

  Khcoderdirect

「KH Coder」は、ChaSen(茶筌)、MySQL( リレーショナル・データベース )、R (統計解析環境ソフト)、MS Excel  などをバックエンドとして利用していますので、これらの環境が必要かもしれません。多分、MS Excel  が使用出来る Windows OS  なら、大丈夫だと思います(保障は出来ません)。それでは、
図1 のディレクトリーにある使用説明書( khcoder_tutorial.pdf )を読み、使用方法を経験してみて下さい。

図2は次回に説明する Enquate.xls ( sheet名:医師自由文 )の一例です。

図2:医師アンケートで出現頻度の多い抽出語
Doctorfreq

次回に続く!