統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(64)

2011-06-16 10:48:07 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

テキストマイニング分析ソフトの使用経験(その2)

下記の図2 で示した「 KH Coder のディレクトリー階層 」の C:\khcode\tutorial  を開くと「 kokoro2.txt 」がありますので、メモ帳で開いて下さい。
  
図2:KH Coder のディレクトリー階層
Khcoderdirect2

<H1>----</H1> と <H2>----</H2> の様にタグで括られていることが分かります。KH Coder はこの様なタグで括られたテキストを対象としています。
したがって、
「 Enquate.xls ( sheet名:医師自由文 、患者自由文 ) 」 の分析も <H1> タグで括っておく必要があります。そこで、「 sheet名:医師自由文 」をメモ帳に ”コーピ&ペースト”  して、「 小規模病院、中規模病院、大規模病院 」ごとに <H1> タグで括ります。
今回、ここでは 「 sheet名:医師自由文 」だけを下記の URL から、ファイル名「 DoctorQuestion.txt 」 をダウンロードして下さい。
(ダウンロードは「左クリック」→「ファイル」→「名前を付けて保存」をして下さい。「右クリック→対象をファイルに保存」はダメ!

http://www3.ocn.ne.jp/~stat/dbase/dbase.html

「 DoctorQuestion.txt 」では <H1> 小規模病院 </H1> 、<H1> 中規模病院 </H1> 、<H1> 大規模病院 </H1> となっています。

この<H.>タグ は Web ページ ( インターネットホームページ ) を記述するためのマークアップ言語 ( HTML:HyperText Markup Language )です。だから、余談(横道)ですが、
メモ帳に次の様に記述し、

<html>
<body>

<h1>小規模病院</h1>
 <br>急な悪化に対応で出来なかった。
 <br>原因究明と薬剤効果の確認が必要だ。
 <br>ステロイドの使用では説明が必要だ。
 <br>症状の悪化に適切な対応が出来ていなかった。
 <br>全身症状の軽減が出来ていなかった。<p>

<h1>中規模病院</h1>
 <br>難治性疾患である。
 <br>漢方薬のみで標準的治療がなされていなかった。
 <br>患者は治療すればすぐに良くなると思い込んでいる。
 <br>患者は診断名の変更で不安になり来院した。
 <br>患者は初診時の説明不足で転院する事がよくある。

<h1>中規模病院</h1>
 <br>悪性リンパ腫であり進行中である。
 <br>診療所からの紹介患者です。
 <br>診療所からの紹介患者です。
 <br>背景に医療問題がある。
 <br>前医でのトラブルで当院に来院した。

</body)
</html>

そして、
例えば、「khcoder.htm」 のファイル名で保存すれば、” Internet Explorer ”  などで開くことが出来ます。

「注釈」
 <h1> タグを <h2>~<h6> に変えて見て下さい。

次回に続く!