あなたにもできる!ハーバード留学!!~アラフォーからのボストン留学体験記

アラフォー研究者のボストン留学体験ブログ。
研究・生活・英語・ITを中心に留学ライフハックスをお教えします!

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

アラフォーからのハーバード留学IT編012:初心者がはまるcummeRbundの落とし穴

2013-10-18 12:26:53 | アラフォーからのハーバード留学IT編
 アラフォーからのハーバード留学研究編017:ネットブックで行うRNA-seqデーター解析(3)で得られたように、いくつかのRNA-seqデーターが手元に集まってきた。

次のステップはこれらのデーターをどう料理するかであるが、二階堂愛さんのRNA-seq Analysis With R/Bioconductorなどのページによると、統計処理に適したRという言語をいれて、そのうえでcummeRbundというRNA-seqデーター解析用のソフトを走らせて、その可視化を行うがよいということだ。

 まずRは元の職場で非常にわかりやすい講習会を受けたので、少しなじみがある。朝飯前だとこれに取り掛かったのだが思いのほか時間がかかった。

 初心者がはまりがちな落とし穴があるからである。

1)Rのパッケージインストールは管理者権限が必要である(やり方は下記参照)
2)cummeRbundを使うには、あらかじめRのグラフィック作成パッケージであるggplot2のインストールが必要である(デフォルトで入っていない)

 というのが教訓である。

詳しくは以下の失敗談を参照してほしい。



 Rは最新版(3.0.2)をこちらからダウンロード。

 これをwindowsにインストールし、デフォルト設定でディスクトップ上にあるアイコンをクリックして、Rを走らせる。
 
 Rコンソールがでてくるので、

ここでcummeRbund(http://bioconductor.orgから提供されている)をインストールする。

>source("http://bioconductor.org/biocLite.R")
とタイプ(おまじない(*))

Your Bioconductor is out-of-date, upgrade to version 2.13 by
following instructions at http://bioconductor.org/install.
Bioconductor version 2.12 (BiocInstaller 1.10.4), ?biocLite for help

とここまではよい。

次にcummeRbundのインストールは

>biocLite("cummeRbund")

とタイプすればよいのだが、

このあとのメッセージに
Warning message: > installed directory not writable, cannot update packages
‘foreign’, ‘mgcv’, ‘proto’

とでてきて、cummeRbundがうまくインストールできていなかった。

これについては,Rjpwikiの記事によると、windows8でRのパッケージをインストールする場合、管理者権限でRを動かす必要があるらしい。

Rを管理者権限で動かすには、Rを特殊なやり方で立ち上げなおす必要がある。といってもRをいったん閉じて、Rのアイコンを右クリックし、出てくるメニューで管理者として実行の部分を行うだけだ。詳しくはこちらのサイト(画像つきで詳しく説明)

そこで再度
>source("http://bioconductor.org/biocLite.R")
>biocLite("cummeRbund")
すると、今度は警告メッセージはでてこなくなる。


次にcummeRbundを実際にRに読み込んでこれを走らせる作業になるがここでもまた難関が待っていた。
実際には

> library("cummeRbund")

とタイプすればよいのだが、最後の方で

要求されたパッケージ RSQLite をロード中です
要求されたパッケージ DBI をロード中です
要求されたパッケージ ggplot2 をロード中です
Error in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
‘proto’ という名前のパッケージはありません
エラー: パッケージ ‘ggplot2’ をロードできませんでした

というエラーメッセージがでてくる。
これは重大なエラーでこれがでてくるとcummeRbundは機能しない。
たとえばその中でよく使う関数であるreadCufflinksを使おうとして

> readCufflinks()

とタイプしても

エラー: 関数 "readCufflinks" を見つけることができませんでした。

といわれる。

ここでドツボにはまってしまった(**)のだが、これはRのグラフィック作成用パッケージであるggplot2がインストールされていないことによるらしい。


ggplot2をインストールするには
install.packages("ggplot2", dependencies=TRUE)
とタイプすればよく(***)

ggplot2インストール後

> library(cummeRbund)

とタイプすると

要求されたパッケージ ggplot2 をロード中です
Find out what's changed in ggplot2 with
news(Version == "0.9.3.1", package = "ggplot2")
要求されたパッケージ reshape2 をロード中です
要求されたパッケージ fastcluster をロード中です

次のパッケージを付け加えます: ‘fastcluster’
以下のオブジェクトはマスクされています (from ‘package:stats’) :

hclust

要求されたパッケージ rtracklayer をロード中です
要求されたパッケージ GenomicRanges をロード中です
要求されたパッケージ IRanges をロード中です
要求されたパッケージ Gviz をロード中です
要求されたパッケージ grid をロード中です

次のパッケージを付け加えます: ‘cummeRbund’

以下のオブジェクトはマスクされています (from ‘package:GenomicRanges’) :

promoters

以下のオブジェクトはマスクされています (from ‘package:IRanges’) :

promoters

となって、うまくcummeRbundが読み込まれる。

ちなみにここで
> readCufflinks()

といれると

Creating database C:/Users/USERID/Documents/cuffData.db
Reading C:/Users/USERID/Documents/genes.fpkm_tracking
以下にエラー file(file, "rt") : コネクションを開くことができません
追加情報: 警告メッセージ:
In file(file, "rt") :
ファイル 'C:/Users/USERID/Documents/genes.fpkm_tracking' を開くこと

とうまくcummeRbundが動いていることがわかる。

初心者がはまりがちな落とし穴である。

再度教訓
1)Rのパッケージインストールは管理者権限が必要である(やり方は下記参照)
2)cummeRbundを使うには、あらかじめRのグラフィック作成パッケージであるggplot2のインストールが必要である(デフォルトで入っていない)

ふー、やれやれ!

₍*₎東京大学の門田先生のサイト、Rで塩基配列解析より。ちなみにすごい情報量です。
(**)原因究明に3日。。
₍***)Rのグラフィック作成パッケージ“ggplot2”についてよりコピペ
コメント   この記事についてブログを書く
« アラフォーからのハーバード... | トップ | アラフォーからのハーバード... »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

アラフォーからのハーバード留学IT編」カテゴリの最新記事