情報統計研究所へのアクセスはここから.
テキストマイニング分析ソフトの使用経験(その2)
下記の図2 で示した「 KH Coder のディレクトリー階層 」の C:\khcode\tutorial を開くと「 kokoro2.txt 」がありますので、メモ帳で開いて下さい。
図2:KH Coder のディレクトリー階層
<H1>----</H1> と <H2>----</H2> の様にタグで括られていることが分かります。KH Coder はこの様なタグで括られたテキストを対象としています。
したがって、
「 Enquate.xls ( sheet名:医師自由文 、患者自由文 ) 」 の分析も <H1> タグで括っておく必要があります。そこで、「 sheet名:医師自由文 」をメモ帳に ”コーピ&ペースト” して、「 小規模病院、中規模病院、大規模病院 」ごとに <H1> タグで括ります。
今回、ここでは 「 sheet名:医師自由文 」だけを下記の URL から、ファイル名「 DoctorQuestion.txt 」 をダウンロードして下さい。
(ダウンロードは「左クリック」→「ファイル」→「名前を付けて保存」をして下さい。「右クリック→対象をファイルに保存」はダメ!
http://www3.ocn.ne.jp/~stat/dbase/dbase.html
「 DoctorQuestion.txt 」では <H1> 小規模病院 </H1> 、<H1> 中規模病院 </H1> 、<H1> 大規模病院 </H1> となっています。
この<H.>タグ は Web ページ ( インターネットホームページ ) を記述するためのマークアップ言語 ( HTML:HyperText Markup Language )です。だから、余談(横道)ですが、
メモ帳に次の様に記述し、
<html>
<body>
<h1>小規模病院</h1>
<br>急な悪化に対応で出来なかった。
<br>原因究明と薬剤効果の確認が必要だ。
<br>ステロイドの使用では説明が必要だ。
<br>症状の悪化に適切な対応が出来ていなかった。
<br>全身症状の軽減が出来ていなかった。<p>
<h1>中規模病院</h1>
<br>難治性疾患である。
<br>漢方薬のみで標準的治療がなされていなかった。
<br>患者は治療すればすぐに良くなると思い込んでいる。
<br>患者は診断名の変更で不安になり来院した。
<br>患者は初診時の説明不足で転院する事がよくある。
<h1>中規模病院</h1>
<br>悪性リンパ腫であり進行中である。
<br>診療所からの紹介患者です。
<br>診療所からの紹介患者です。
<br>背景に医療問題がある。
<br>前医でのトラブルで当院に来院した。
</body)
</html>
そして、
例えば、「khcoder.htm」 のファイル名で保存すれば、” Internet Explorer ” などで開くことが出来ます。
「注釈」
<h1> タグを <h2>~<h6> に変えて見て下さい。
次回に続く!