イスラエル・ハイテクベンチャーCEO兼CSの脱&非日本仲間日記

イスラエルの情報科学ハイテクベンチャー会社のCEO兼CSの脱日本&非日本仲間10名が発信する日本への警鐘!

「アンチ・小保方STAP細胞の匿名ブログ『kahoの日記:STAP細胞の非実在について』のエセ科学性」

2014年03月17日 | サイエンス&テクノロジーの殿堂に棲む奴ら

「アンチ・小保方STAP細胞の匿名ブログ『kahoの日記:STAP細胞の非実在について』のエセ科学性」


本稿では、「STAP細胞の存在」又は「ASTAP細胞の非存在」を云々する事ではなく、あるブログの中身のエセ科学性を論ずる事にある。

小保方氏のSTAP細胞に異議があるならは、その者は、証拠を持って反論の論文を書き、学会の公の討論の場で発表すべきであることは、研究者の常道である。

にも拘らず、ブログ上で匿名の"kaho"を名乗り、自分の素性を一切明らかにせず、「塩基配列を解析したところ、STAP細胞は存在しない」と称して、自分の「説」を証明する根拠の明確な提示をせず、即ち、「解析に使った」と称する塩基配列データーの真正性の証明も無く、しかも解析手法を一切明らかにする事無く、解析ではなくUCSCの"Genome Browser"というブラウザー(米国カリフォルニア大学サンタクルーズ校(UCSC)が開発・管理しているゲノムブラウザで、アノテーションが付加された遺伝子のゲノム上の位置やその周辺を表示するツール)の画面を、表示に使ったデーターの説明も無く、何らの解析手順の説明も無く、自分のブログに匿名で単に貼り付けただけのやり方で、「STAP細胞の非実在について」というタイトルで、「STAP細胞」の否定を唱えている。

(1) kahoの日記: STAP細胞の非実在について
http://slashdot.jp/journal/578529/STAP%E7%B4%B0%E8%83%9E%E3%81%AE%E9%9D%9E%E5%AE%9F%E5%9C%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6
(2) kahoの日記: STAP細胞の非実在について#2
http://slashdot.jp/journal/578550/STAP%E7%B4%B0%E8%83%9E%E3%81%AE%E9%9D%9E%E5%AE%9F%E5%9C%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%EF%BC%83%EF%BC%92
(3) kahoの日記: STAP細胞の非実在について#3
http://slashdot.jp/journal/578591/STAP%E7%B4%B0%E8%83%9E%E3%81%AE%E9%9D%9E%E5%AE%9F%E5%9C%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%EF%BC%83%EF%BC%93
(4) kahoの日記: STAP細胞の非実在について#4(kahoは、不正な内容を認め#4を取り消す)
http://slashdot.jp/journal/578623/STAP%E7%B4%B0%E8%83%9E%E3%81%AE%E9%9D%9E%E5%AE%9F%E5%9C%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%EF%BC%83%EF%BC%94
(5) kahoの日記: STAP細胞の非実在について#5
http://slashdot.jp/journal/578726/STAP%E7%B4%B0%E8%83%9E%E3%81%AE%E9%9D%9E%E5%AE%9F%E5%9C%A8%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%EF%BC%83%EF%BC%95

自分は「理研内部」の人間であると唱え、上記のやり口で、小保方氏を背中から斬りつけるという、おおよそ研究者にとって、あるまじき卑劣な行為を行った。NCBIに登録されたデーターを使い、塩基配列レベルの「遺伝子解析」により「STAP細胞の非実在」証明したと自称するこの男は、「科学」の名を借りたいかさまのエセ科学人間である。

以下、kahoなる者の愚劣なルール違反行為及び荒唐無稽にして笑止千万である主張の論理破綻を述べる。


1.NGS(次世代シーケンサー)塩基配列データー

STAP細胞関係では、NCBIデーターベースに以下の42個のNGS塩基配列データーが登録されている。それを以下に示す。合わせて約120GBのデーター量である。私の会社は(DNAによるコンピューターの研究をメインに新しいセンサーによる次々世代シーケンサー及び解析ソフトウェアを開発)、解析の為に既にダウンロードした。

Select item 653158
1.Trophoblast Stem Cells ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 38.3M spots, 1.9G bases, 1.2Gb downloads
Accession: SRX472668

Select item 653157
2.Trophoblast Stem Cells ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 33.1M spots, 2.1G bases, 1.2Gb downloads
Accession: SRX472667

Select item 653156
3.Trophoblast Stem Cells ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 41.3M spots, 2.1G bases, 1.3Gb downloads
Accession: SRX472666

Select item 653155
4.STAP-SC (STAP derived Stem Cells) ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 46.2M spots, 2.3G bases, 1.4Gb downloads
Accession: SRX472665

Select item 653154
5.STAP-SC (STAP derived Stem Cells) ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 36.7M spots, 2.3G bases, 1.4Gb downloads
Accession: SRX472664

Select item 653153
6.STAP-SC (STAP derived Stem Cells) ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 43.8M spots, 2.2G bases, 1.4Gb downloads
Accession: SRX472663

Select item 653152
7.Low pH treated CD45 positive Cells ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 38.9M spots, 1.9G bases, 1.1Gb downloads
Accession: SRX472662

Select item 653151
8.Low pH treated CD45 positive Cells ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 34.8M spots, 2.2G bases, 1.3Gb downloads
Accession: SRX472661

Select item 653150
9.Low pH treated CD45 positive Cells ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 49.6M spots, 2.5G bases, 1.6Gb downloads
Accession: SRX472660

Select item 653149
10.Embryonic Stem Cells ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 44.9M spots, 2.2G bases, 1.3Gb downloads
Accession: SRX472659

Select item 653148
11.Embryonic Stem Cells ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 35M spots, 2.2G bases, 1.2Gb downloads
Accession: SRX472658

Select item 653147
12.Embryonic Stem Cells ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 44.2M spots, 2.2G bases, 1.3Gb downloads
Accession: SRX472657

Select item 653146
13.FI-SC (Fgf Induced Stem Cells) ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 44.4M spots, 2.2G bases, 1.3Gb downloads
Accession: SRX472656

Select item 653145
14.FI-SC (Fgf Induced Stem Cells) ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 31.6M spots, 2G bases, 1.1Gb downloads
Accession: SRX472655

Select item 653144
15.FI-SC (Fgf Induced Stem Cells) ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 46.5M spots, 2.3G bases, 1.4Gb downloads
Accession: SRX472654

Select item 653143
16.CD45 positive Cells ; ChIPSeq_input
1 ILLUMINA (Illumina HiSeq 1500) run: 60.6M spots, 3G bases, 1.7Gb downloads
Accession: SRX472653

Select item 653142
17.CD45 positive Cells ; ChIPSeq_H3K27me3
1 ILLUMINA (Illumina HiSeq 1500) run: 31M spots, 2G bases, 1.1Gb downloads
Accession: SRX472652

Select item 653141
18.CD45 positive Cells ; ChIPSeq_H3K4me3
1 ILLUMINA (Illumina HiSeq 1500) run: 51.6M spots, 2.6G bases, 1.5Gb downloads
Accession: SRX472651

Select item 653140
19.CD45 positive Cells ; RNASeq_SMARTer_Rep2
1 ILLUMINA (Illumina HiSeq 1000) run: 39.1M spots, 7.9G bases, 4.6Gb downloads
Accession: SRX472650

Select item 653139
20.CD45 positive Cells ; RNASeq_SMARTer_Rep1
1 ILLUMINA (Illumina HiSeq 1000) run: 34.2M spots, 6.9G bases, 4.1Gb downloads
Accession: SRX472649

Select item 653138
21.Low pH treated CD45 positive Cells ; RNASeq_SMARTer_Rep2
1 ILLUMINA (Illumina HiSeq 1000) run: 38.4M spots, 7.8G bases, 4.5Gb downloads
Accession:  SRX472648

Select item 653137
22.Low pH treated CD45 positive Cells ; RNASeq_SMARTer_Rep1
1 ILLUMINA (Illumina HiSeq 1000) run: 33.4M spots, 6.8G bases, 3.9Gb downloads
Accession:  SRX472647

Select item 653136
23.Embryonic Stem Cells ; RNASeq_SMARTer_Rep2
1 ILLUMINA (Illumina HiSeq 1000) run: 41.4M spots, 8.4G bases, 4.8Gb downloads
Accession:  SRX472646

Select item 653135
24.Embryonic Stem Cells ; RNASeq_SMARTer_Rep1
1 ILLUMINA (Illumina HiSeq 1000) run: 36.6M spots, 7.4G bases, 4.3Gb downloads
Accession:  SRX472645

Select item 653134
25.Morula stage embryos ; RNASeq_SMARTer_Rep2
1 ILLUMINA (Illumina HiSeq 1000) run: 38.9M spots, 7.9G bases, 4.5Gb downloads
Accession:  SRX472644

Select item 653133
26.Morula stage embryos; RNASeq_SMARTer_Rep1
1 ILLUMINA (Illumina HiSeq 1000) run: 40.7M spots, 8.2G bases, 4.7Gb downloads
Accession:  SRX472643

Select item 653132
27.Blastocyst stage embryos; RNASeq_SMARTer_Rep2
1 ILLUMINA (Illumina HiSeq 1000) run: 40M spots, 8.1G bases, 4.7Gb downloads
Accession:  SRX472642

Select item 653131
28.Blastocyst stage embryos; RNASeq_SMARTer_Rep1
1 ILLUMINA (Illumina HiSeq 1000) run: 38.6M spots, 7.8G bases, 4.5Gb downloads
Accession:  SRX472641

Select item 653130
29.FI-SC (Fgf Induced Stem Cells) ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 17.3M spots, 4.4G bases, 2.7Gb downloads
Accession:  SRX472640

Select item 653129
30.FI-SC (Fgf Induced Stem Cells); RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 18.5M spots, 4.7G bases, 2.9Gb downloads
Accession:  SRX472639

Select item 653128
31.STAP-SC (STAP derived Stem Cells) ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 19.9M spots, 5G bases, 3.1Gb downloads
Accession:  SRX472638

Select item 653127
32.STAP-SC (STAP derived Stem Cells) ; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 20.1M spots, 5.1G bases, 3.1Gb downloads
Accession:  SRX472637

Select item 653126
33.Low pH treated CD45 positive Cells ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 16.6M spots, 4.2G bases, 2.6Gb downloads
Accession:  SRX472636

Select item 653125
34.Low pH treated CD45 postive Cells ; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 18.7M spots, 4.8G bases, 2.9Gb downloads
Accession:  SRX472635

Select item 653124
35.Trophoblast Stem Cells; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 17.7M spots, 4.5G bases, 2.8Gb downloads
Accession:  SRX472634

Select item 653123
36.Trophoblast Stem Cells; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 19M spots, 4.8G bases, 2.9Gb downloads
Accession:  SRX472633

Select item 653122
37.Embryonic Stem Cells ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 18M spots, 4.6G bases, 2.8Gb downloads
Accession:  SRX472632

Select item 653121
38.Embryonic Stem Cells ; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 16.3M spots, 4.2G bases, 2.5Gb downloads
Accession:  SRX472631

Select item 653120
39.Epi Stem Cells ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 18.3M spots, 4.6G bases, 2.8Gb downloads
Accession:  SRX472630

Select item 653119
40.Epi Stem Cells ; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 18.4M spots, 4.7G bases, 2.9Gb downloads
Accession:  SRX472629

Select item 65311841.
CD45 positive Cells ; RNASeq_Rep2
1 ILLUMINA (Illumina HiSeq 1500) run: 18.2M spots, 4.6G bases, 2.8Gb downloads
Accession:  SRX472628

Select item 65311742.
CD45 positive Cells ; RNASeq_Rep1
1 ILLUMINA (Illumina HiSeq 1500) run: 19.1M spots, 4.8G bases, 3Gb downloads
Accession:  SRX472627

わざわざ上記のデーターを標記したのは、kahoが、結論ありきの「解析」で、本当に、一切の加工無く、其の儘、これらの公開データーを使ったのか?ということを疑問提起する為である。


2.kaho がブログに貼り付けている UCSC ゲノム・ブラウザーの不可解な表示

「kahoの日記: STAP細胞の非実在について#2」にゲノム・ブラウザーのURLが3個あるが、TCR-beta: http://genome.ucsc.edu/cgi-bin/hgTracks?hgS_doOtherUser=submit&hgS_otherUserName=stopstap&hgS_otherUserSessionName=TCR%20beta%20rearrangement%20test , TCR-alpha: http://genome.ucsc.edu/cgi-bin/hgTracks?hgS_doOtherUser=submit&hgS_otherUserName=stopstap&hgS_otherUserSessionName=TCR%20alpha%20rearrangement%20test, chrX: http://genome.ucsc.edu/cgi-bin/hgTracks?hgS_doOtherUser=submit&hgS_otherUserName=stopstap&hgS_otherUserSessionName=Appendix 、UCSCがアセンブルしDB化した塩基配列ではなく、kahoのカスタム・トラックの表示に過ぎない事に注意する。通常はUCSCが解析し様々なアノテーション・修飾を行い検定された配列データーを用いるものであり(使えるまでには時間がかかる)、また使用に当たっては、データーのビンテージ、即ちアセンブル時期の選択(マウスの場合では、Aug. 2005 (NCBI35/mm7), Feb. 2006 (NCBI36/mm8), July 2007 (NCBI37/mm9), Dec. 2011 (NCBI38/mm10))に注意しながらブラウズしたい領域を指定し、サブミットし表示させる。が、kahoがブログに貼り付けたものは、kahoのカスタム・トラックであって、登録データーによるものではない。カスタムトラックの作り方はいろいろあるが、3月7日にNCBIへサブミットされたSTAP細胞関係のデーターが即UCSCブラウジング出来る筈も無いから次の手順が必要である。

UCSCゲノム・ブラウザーガイドには、"Display your own data as custom annotation tracks in the browser. Data must be formatted in BED, bigBed, bedGraph, GFF, GTF, WIG, bigWig, MAF, BAM, BED detail, Personal Genome SNP, VCF, broadPeak, narrowPeak, or PSL formats. To configure the display, set track and browser line attributes as described in the User's Guide. Data in the bigBed, bigWig, BAM and VCF formats must be provided via a URL embedded in a track line in the box below. Publicly available custom tracks are listed here. Examples are here. An annotation data file in one of the supported custom track formats may be uploaded by any of the following methods:
/(Preferred) Enter one or more URLs for custom tracks (one per line) in the data text box. The Genome Browser supports both the HTTP and FTP (passive-only) protocols.
/Click the "Browse" button directly above the URL/data text box, then choose a custom track file from your local computer, or type the pathname of the file into the "upload" text box adjacent to the"Browse" button. The custom track data may be compressed by any of the following programs: gzip (.gz), compress (.Z), or bzip2 (.bz2). Files containing compressed data must include the appropriate suffix in their names.
/Paste the custom annotation text directly into the URL/data text box.
/Data provided by a URL may need to be proceeded by a separate line defining type= required for some tracks, for example such as "track type=broadPeak".

とあって、自分のデーターを説明のhtmlファイルと共に、指定されたファイルフォーマット( BED, bigBed, bedGraph, GFF, GTF, WIG, bigWig, MAF, BAM, BED detail, Personal Genome SNP, VCF, broadPeak, narrowPeak, or PSL)により、アップロードせねばならない。皆が皆、そうやっているわけではないが、新実験でのデーターを標準形と比較したい場合には、そのデーターをアップロードして解析の一助とする。だが、それなりのスペックのPCやサーバーがLINUX環境で動けば、様々なNGSデーターを様々に解析するソフトウェアが充実している今日では、ブライザーの役割は違ってきている。インターネット上での解析共有によるディスカッションには大いに役に立つ。全員が同じようなシステム(次世代シーケンサーや解析システム)を持ってい
る訳ではないからだ。

が悪用は可能だ。「それは本当のデーターか?」悪意があれば何でも出来る。あらゆる世界でそうだ。とりわけインターネットでの悪意の実行は閾値が極めて低い。

ここが問題だ。

kahoの「カスタムデーター」をチェックすると、カスタム・トラックの標記は以下の様になっている。

CD45+ / ESC, Obokata 2014
DP thymus / fetal liver, Zhang 2012
Low pH treated CD45+ / ESC, Obokata 2014
STAP-SC / ESC, Obokata 2014

STAP細胞とは関係の無い赤の他人のデーターは二番目にある。何らかの意図の証拠だ。何故こんな他人のデーターが比較上必要なのか、何らの説明は無い。具体的な分布図の比較検討も一切無い。42個ある小保方氏のNGSデーターのうち、何故特定の3個しか使わなかったのか?選択の説明も何も無いのが、kahoのブログである。故に、kahoのカスタム・トラック・データー自体が、小保方氏の得たデーターそのものである証拠は無い。

赤の他人のデーターを除いて並べれば、
CD45+ / ESC, Obokata 2014
Low pH treated CD45+ / ESC, Obokata 2014
STAP-SC / ESC, Obokata 2014
であり、奇妙な標記が見られる。kahoのカスタム・トラックのデーターには、全てに"/ ESC"の付加がある。何故、小保方氏の標記を使わないのか?何故ESCと混乱させるような標記をワザワザ使っているのか。何らかの意図を窺わせるものである。「STAP細胞の非実在について」などと、「STAP細胞は存在せず」という結論ありきのブログであるからだ。奇妙な標記だ。何らかの意味を持たせているのだろう。


3.kahoの主張の相対的補完命題は、「kahoの UCSC Genome Browser のカスタム・トラックは捏造である」。

kahoは自分のブログで、次のような主張を行っている。

・「彼らが公開しているデータから彼らの捏造,少なくとも完全な誤りは証明できます.彼らはそうとは知らず,自分たちの捏造を世界に公開しているのです」-#1
・「CD45+s細胞はTCRの再構成がわずかに見られます.しかしSTAP細胞,そして低pH環境下においたCD45+細胞では再構成は観察されなかったのです」-#1
・「内部では実名でこのような活動をしており,隠れているつもりはありません.その目的は迅速な論文の撤回,・・・」-#2
・「CD45+細胞だけがOct4-GFPのトランスジェニックマウスで,それ以外は違う細胞を使っています.彼らは性別もDNAも違う細胞を使った」-#3
・「CD45+細胞はSTAP/STAP幹細胞/ES細胞とは由来が異なる」-#5
・「ES細胞とSTAP細胞はCNVに差がなく,ほぼ同一である」-#5

kahoによる「STAP細胞の全否定」である。ブログ上で匿名の"kaho"を名乗り、自分の素性を一切明らかにせず、「塩基配列を解析したところ、STAP細胞は存在しない」と称して、自分の「説」を証明する根拠の明確な提示をせず、即ち、「解析に使った」と称する塩基配列データーの真正性の証明も無く、しかも解析手法を一切明らかにする事無く、解析ではなくUCSCの"Genome Browser"というブラウザー(米国カリフォルニア大学サンタクルーズ校(UCSC)が開発・管理しているゲノムブラウザで、アノテーションが付加された遺伝子のゲノム上の位置やその周辺を表示するツール)の画面を、表示に使ったデーターの説明も無く、何らの解析手順の説明も無く、自分のブログに匿名で単に貼り付けただけのやり方で、「STAP細胞の非実在について」というタイトルで、「STAP細胞」を攻撃している。

小保方氏は、公の論文で自説を実験データーにより論じた。論文には論理的整合性がある。にもかかわらず、瑣末なことで凄まじいバッシングに晒されてた。

kahoよ、お前のやったことは、エセ科学である。STAP細胞に反論があれば、その根拠を明確に論文として書き、学会で発表し、議論すすべきである。それこそ、研究者の王道である。やり方には手順というものがある。相手の主張が気に食わないからといって、時流の便乗し、匿名のブログで後ろから切り付けるとは何事か!到底許せることではない。恥を知れ。


4.架空の「捏造」”CNV”を使った笑止千万な議論

先に挙げた「kahoの日記: STAP細胞の非実在について#5」には、今まで説明した事の無い解析方法(おおよそ説明にはなっていないどころかデタラメ)を示し、「CNV」のカウント比較を行い、「CD45+細胞はSTAP/STAP幹細胞/ES細胞とは由来が異なる」などと、インチキを結論付けている。

kaho曰く、「”input”の解析でまだここに書いていなかったものとして,CNV(copy number variation)解析を最後に書き留めます.
これはChIP-seqの”input”データという限られた配列でどこまでできるか自信がなかったので,様々な計算方法を試し,基準となりそうなデータを探したりその著者に問い合わせたりして時間がかかる作業でした.
CNVというのは,ゲノム中で生じるコピー数の変化のことで,単純な繰り返し配列が細胞分裂の際に伸びたり縮んだりする現象のことを言います.個体間の差を見る方法として,SNP (single nucleotide polymorphism)がよく知られていますが,それよりもはるかに変化しやすく,同じ個体の細胞でも違いがみられます.

「・染色体を50, 100, あるいは250塩基ごとのウィンドウに分割する.
・2つのゲノム間で,同じウィンドウ間のリード数を数える.
・ウィンドウ内のリード数をカウントし,性別が異なってもよいよう,各染色体ごとの総リード数を用いてオッズ比を算出する.また,性染色体は計算から除外する.
・オッズ比の95%信頼区間を計算する.
・オッズ比が1より大きい場合は信頼区間の下限値が2より大きいもの,オッズ比が1未満の場合は信頼区間の上限値が0.5未満のものを「CNVの差がある」区間としてカウントする.
・ただし近接している領域は結合させて1つと数える.
・このCNVの違いを2つの細胞の距離として評価する.

「この手法をSTAP論文のために公開されたデータに使います.この結果は以下の通りになりました.

              ESC    STAP-SC    STAP      FI-SC    TSC
CD45+    245        270        277       182        669
TSC        420        459        360        371
FI-SC        17            6         17
STAP          0             2
STAP-SC     6
ESC
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・」

kahoはそう言っているが、これはCNVではない。従って、kahoの結論は間違いである。kahoはCNVとは何かを全く分っていない。オッズ数の間違った適用や信頼区間の無知に見られるように、統計数学の基本知識も無い。既に述べてきた通り、kahoは恣意的な結論、即ち「STAP細胞は存在しない」という結論ありきの主張をエセ科学的に行ったのである。

CNVについて、初等的に説明する。例えば、ヒトゲノムは約30億の塩基対からなり、そこには約3万種の遺伝子が含まれ、各々の遺伝子の基本的な塩基配列は個人間で共通であるが、塩基配列の様々な箇所で一つの塩基が他の塩基に置き換わっていることが多く(「一塩基多型( SNPs)」と言う)、どの部位のどの塩基が置き換わるかは人種や個人によって様々で、それらのSNPは様々であるが、SNPsによっては遺伝子やタンパク質の機能に微妙な影響を与えるものが存在し、体質や特定の病気への罹患率などに影響することが知られて、要するに、SNPsは「遺伝子の個人差・多様性」をもたらす。他方、SNOs以外にも遺伝子の個人差をもたらす塩基配列が存在するということが分ってきた。2コピーずつもっているはずの遺伝子を(遺伝子は父親と母親から半分ずる受け継ぐため、通常は、誰でも、訳3万種の遺伝子を2コピーずつ持っている)、Aという人は1コピーしか持っていなかったり、Bという人は3コピー持っているというような事実が、予想をはるかに超える頻度で起きている事が分ってきた。そして、そのような遺伝子の個人差を「コピー数多型(Copy Number Variation:CNV)」と呼称している。特に、数千塩基対から数百万塩基対という長い配列について、そのコピー数が個人によって異なる場合をCNVとする。

CNV領域には遺伝子が含まれる場合も含まれない場合もあり、形態は様々である。ゲノム中では、短い塩基配列については、同じ配列が繰り返しあらわれる現象がよく観察されるが、以前に知られていた繰り返し配列は、数塩基対単位のマイクロサテライトや数十塩基対単位のVNTR(縦列反復配列多型)、あるいはミニサテライトなどで、千塩基対を超える繰り返し配列については最近になって解明されるようになった。日本人を含むアジア系、アフリカ系、ヨーロッパ系それぞれ90人、計270人のゲノムサンプルを解析した結果、270人全体集合で(一人当たりではない)CNVが約1400箇所発見され、合算すると約360メガ塩基対、予想を遥かに超えて、全ヒトゲノムの12%以上に及ぶことが判明した。それは270人の集合値であるから、任意のA,B2人の間の差異は20~30個であり、全ゲノムの0.1~0.2%の相当する。
(参照:http://www.nature.com/nature/journal/v444/n7118/full/nature05329.html
http://www.jst.go.jp/pr/info/info361/index.html )

DNAの塩基配列総数約30億個の人間で、2個体間CNVは20~30である。では、マウスの場合はどうか?塩基総数は約25億個であり、人間と大差は無く、比率的に17~25個である。kahoの言うところの数百個から600個を越える架空の"CNV"とは全く違うものである。kahoは本当のCNVとは何の関係も無い架空のパラメータを作り出して、恣意的な結論に結び付けようとしたのである。

愚劣を通り越している。しかも自分の無知を棚に上げての作為的な操作でだ。

その正体は以下の通りである。

次世代シーケンサー、Illumina HiSeq 2000の場合、読取りリード数およびデータ量が多いため、リシーケンスによる変異解析、定量性が求められる遺伝子発現解析などに用いられ、メイトペアシーケンス法、マルチプレックスシーケンス可能。解析例としては、リード長50 bp:small RNA解析・mRNA解析 (発現)、リード長100 bp: ゲノム解析・mRNA解析 (発現・配列決定)。読取リード長: 50 bp/100 bpであり、従って、100 bpペアエンドの場合の最大能力は、取得リード数: 約30億リードペア、取得データ量:~600 Gb。100 bpシングルの場合の最大能力は、取得リード数:約30億リード、取得データ量: ~300 Gbである。

kahoのやったことは、異なる2個の塩基配列を比較するのに、夫々を、50 bp又はその倍数で配列を分割し、夫々のセグメントに関して、リード数を比較するといっているが、リード長を50bpとし、kahoがウインドウと称するセグメント・サイズを50bpを例に取れば、シーケンサーの検出エラーを無視して、各ウインドウの読み出し数(リード数)は(セグメント・サイズ/リード長)=50/50=1固定に決まっている。ウインドウと称するセグメント・サイズが100bpならば、100/50=2固定に決まっている。250bpならば、250/50=5固定に決まっている。そんなものを二個の塩基配列間で比較しても全くおなじであって、二個の塩基鎖間の最異の程度を検定する事は不可能である。何を考えているのか?リード本数を持ち出して云々などナンセンスも甚だしい。


5.科学の王道:

STAP細胞があろうがなかろうが、立てた仮説を実証しようと研究者は励む。その結果を詳細に学会その他の公の場で発表し、甲論乙駁・切磋琢磨の議論を行う。反論者は自分のデーターで反論を展開する。更に仮説者は更なる研究活動によって新たなる知見を積み重ね、議論を行う。その過程を経て、結論が出る。「STAP細胞は存在する」、「スタップ細胞は存在しない」のいずれかである。勿論、夫々に条件付であり、新たなる知見の集積により、次なるテーマが生まれ、進歩してゆく。これが科学の王道というものだ。

kahoよ。お前はそれを無視した。STAP細胞に関する結論が何であれ、お前の方法論はエセ科学である。


geno_computing

『社会』 ジャンルのランキング
この記事についてブログを書く
この記事をはてなブックマークに追加
« 「劇場型バッシングによって... | トップ | 小保方STAP細胞に対する... »