Wei Wu, Eric P Xing, Connie Myers, I Saira Mian and Mina J Bissell
Evaluation of normalization methods for cDNA microarray data by k-NN classification
BMC Bioinformatics 6: 191 (2005)
[
PDFダウンロード][
Webサイト]
・数あるデータの正規化法を片っ端から比較・評価した。
・正規化法
1.Location normalization : 10種(spacial effectまたはintensity effectを相手にするかで、更に2グループに分かれる)
2.Scale normalization : 3種
これらを組み合わせることにより、計41の方法を試した
・評価法
1.k-NN LOOCV classification error rates
2.IMPROVEMENT : 独自に設定した評価尺度
・cDNAマイクロアレイデータ(Web公開)
1.LIVER CANCER[Chen,2002]
2.LYMPHOMA[Alizadeh,2000]
3.RENAL CELL CARCINOMA[Higgins,2003]
4.GASTRIC CARCINOMA[Chen,2003]
5.LUNG CANCER[Garver,1998]
・問題点「
However, to date there have been few published systematic evaluation of these techniques for removing variations arising from dye biases in the context of downstream, higher-order analytical tasks such as classification.」
・結果「
We found that k-NN classifiers are sensitive to dye biases in the data.」
・結果「
We also found that the investigated scale normalization mathods do not reduce LOOCV classification error.」
・「
Global normalization techniques adjust the center (e.g., mean or median) of the distribution of the log ratio M values on each microarray to a constant.」
・結果「
Empirically, however, we found that the LOOCV errors we obtained from various round of classification are quite stable, therefore we believe that our estimation is in practice reliable and suitable for ranking.」
・一応、試した41のうちの3つの成績がよい、という結論ですが、その差は微妙なところ。結局場合によって使い分け、のオチ。あんまりゴチャゴチャと前処理しすぎるのもデータの原型をとどめなくなりそうで気持ち悪い感じがある。
《チェック論文》
S.Dudoit, Y.H.Yang, T.P.Speed, and M.J.Callow (2002). Statistical methods for identifying differentially expressed genes in replicated cDNA microarray experiments. Statistica Sinica, Vol.12, No.1, p.111-139. [
PDFダウンロード]