論文へのリンク
ポイント1 中国のNature論文の公表データを使用して de novo アセンブリを行った結果、GenBankに登録されたゲノム(Ver.3 29,802nt)は得られず、今回の最長は 28,459 であった。
ポイント2 得られたコンティグの中で、最多のもの50個と最長のもの50個をBlantnにかけて、マッチするものを検索したところ、同じソフトウェア(Megahit )を使用したにもかかわらず、中国のNature論文の解析結果と異なるものであった。
ポイント3 得られたコンティグが、ヒトのリボソームRNAと98.85%マッチした "Homo sapiens RNA, 45S pre-ribosomal N4 (RNA45SN4), ribosomal RNA" (GenBank: NR_146117.1, dated 04/07/2020). このリボソームRNAのデータがGenBankに登録されたのは、2020年4月7日であったことに注目。
ポイント4 リードの長さの分布にピークが2つある
150にあるピークのリードを除くと、ネイチャーの最初の論文のゲノムは得られないが、GenBankに登録されたゲノムのバージョン3のゲノムは得られる
バージョン1のゲノムを得るために、データが操作されたのではないかと懸念される
※コメント投稿者のブログIDはブログ作成者のみに通知されます