裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

na.omit を使おう

2014年03月21日 | ブログラミング

生物系の人が苦しめられるあのデータ形式をRで扱いやすいように変換する

data1 = read.table("clipboard", header=TRUE)
data2 = stack(data1)
data = subset(data2, !is.na(values))

を紹介しているが,subset を使うよりは na.omit が単純明快

data = na.omit(stack(read.table("clipboard", header=TRUE)))

おまけ

dplyr を使えば
data = read.table("clipboard", header = TRUE) %.% stack() %.% subset(!is.na(values))

のように中間変数が要らないと自慢(?)しているが,上のように関数の入れ子の方が分かりやすい。

コメント (1)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« どんな大発見なんだろうか | トップ | 単純に考える »
最新の画像もっと見る

1 コメント

コメント日が  古い順  |   新しい順
Unknown (S)
2014-03-31 14:15:19
dplyrよりも入れ子にした方が分かりやすいという人が他にもいてよかった。自分だけじゃなかった。
返信する

コメントを投稿

ブログラミング」カテゴリの最新記事