裏 RjpWiki

文字通り,RjpWiki の裏を行きます
R プログラム コンピュータ・サイエンス 統計学

fileEncoding

2013年03月01日 | ブログラミング

「中澤さんの【第283回】ベーコンライスの朝から」 の中の R コードについて

> Excelファイルを加工して作ったタブ区切りテキストデータはpref-e0-changes.txt(OSによっては都道府県名の2バイトコードを適当に変換しなくてはいけないかもしれない)

であるが,Windows で作成された日本語を含むファイルを他の OS で読む場合は

read.delim("pref-e0-changes.txt", fileEncoding="cp932")

のように,fileEncoding を指定すれば問題なく読み込めるようだ。

fileEncoding 引数は,昔からあった引数ではないそうなので,ベテランユーザほどご存じないようだ。是非お試しあれ。

ついでに,

http://minato.sip21c.org/msb/man/radarchart.html の中で,

axistype の説明に

中心軸と周辺軸のラベル表示方式。0~5の整数で指定。0はラベルなし,1と4は中心軸のみ,2は周辺軸のみ,3と5は両方を表示。1と3は%表示で,4と5は小数表示。デフォルトは0。

という日本語が残っている。

コメント

検定の多重性とは

2013年03月01日 | 統計学

「中澤さんの【第283回】ベーコンライスの朝から」 のなかで,先の記事(検定の多重性という指摘は当たらないように思われ...)についてのコメントがあったので

検定の多重性とは

検定が 2 回行われた場合に,2 つの結果を 1 つにまとめて陳述する「検定1は有意で,かつ,検定2は有意でない」ようなとき(2 つは同じ検定ファミリーに属する)に検定の多重性を考えなければならない。

結果を別々に述べる(検定ファミリーを構成しない)「検定1は有意(おしまい)。(べつのことだけど)検定2は有意でない(おしまい)。」の場合は,検定に多重性はない。

第7回 t検定による問題解決,Rで実践できますか?~データサイエンティストの統計学─倉橋一成からの問題」では,A:B の比較と A:C の比較は別々のもの。検定を行う状況として 「母平均が等しい場合」,「母平均が違う場合」の 2 種類の場合を考えている。 「A:B, A:C の比較で A が 2 回の比較で共通して出てくるから多重だ」という中澤さんの意見は私には理解できない。出題では同じ A が使われたが,A1 と A2 のように同じ母集団から 2 つの標本を抽出して,A1:B, A2:C の比較をしても結論は変わらない。そして,2つの検定(シミュレーション)には相互関連はない。

A, B, C があって A:B, A:C, B:C に差があるか 3 回の検定を行う,あるいは,B:C には興味がないから A:B, A:C の比較をしたというのならば検定の多重性を考える必要があるだろう。

コメント (2)