古いRのパイプラインを動かそうとしたら、エラーが発生してBioMartに繋がらなかった。元のアクセス方法はこんな感じ。
library(biomaRt)
mart <- useMart(biomart="ENSEMBL_MART_ENSEMBL",dataset="hsapiens_gene_ensembl",host="http://apr2018.archive.ensembl.org")
問題は2つあって、
- このコードでは明示されてないけど、アクセスしたいのはhg19のリソース
- このバージョン(ホスト)はもう削除されてる
現在利用可能なリソースの一覧は以下のように
listEnsemblArchives()で表示できる。

GRCh37(hg19)の場合は以下のようになる。
mart <- useEnsembl(biomart="Ensembl", dataset="hsapiens_gene_ensembl", version="GRCh37", host="https://grch37.ensembl.org")
現行バージョンでも関数呼び出し時にリファレンスゲノムのバージョンを明示する箇所がないのはいかがなものかと思うのだけど。指定する条件が少ないというのは使いやすいようでいて、厳密さを欠いているので後でそれを読んだ誰かが苦労する。