QT Lab.品質・技術研究室

技術者のための品質工学、品質管理、統計学、機械設計、信号処理を
解説します。

回帰の寄与率(決定係数)とは

2014-07-07 21:56:42 | 品質工学

x と y という一対のデータが複数組存在する場合、両者の因果関係を調査する目的で単回帰分析という統計手法が用いられます。

単回帰分析は入力;x と出力;y について一次の線形関係を調べ、単回帰式(方程式 y=ax+b)に関するふたつの回帰係数 a(傾き)とb(y切片)を求めることが第一の目的です。なお、統計学では一般的に傾きをb1y切片をb0としています。

x での実際の y の値と、その方程式により求めた y の推定値との差を『残差』 といいます。残差の2乗の総和が最小になるようにb1とb0を推定します。

また、求めた単回帰式が現実のデータ群にたいしてどれくらいあてはまりがよいか?を調べることも目的のひとつになります。あてはまりのよさをあらわす指標が、寄与率 (経済学では決定係数)と呼ばれる指標であり、R2で表示します。

Microsoft社のExcelでは、グラフウィザードを使い散布図を描いて、その散布図に単回帰直線を自動で引くことができます。さらに、オプション機能を使うことでグラフエリア内に、単回帰直線の方程式と寄与率;R2を記入することもできるので、すでに使いこなされている方も多いものと思います。

yb1x+b0という単回帰式を求めたとき、R2は必ず01の間の値をとります。そして、1に近いほど求めた単回帰式がデータに対してうまくあてはまっていることになります。

私が提唱している 回帰寄与率型SN はこのR2が重要な役割をはたしています。

また、回帰分析には 『ゼロ点回帰分析』 という方法もあります。これは、入出力関係が原理的に原点(00)を通る場合、y切片のある単回帰式ではなく y=b1 x という式にあてはめたい、という考えに基づき考案された回帰分析の一手法です。

本来、原理的に(00)を通る特性であっても、単回帰分析をおこなうと計測誤差などの影響で(00)を通らず、y切片があらわれる場合がほとんどです。当然、このとき残差の2乗の総和は最小になっています。しかし、y切片を無理やりゼロにするのがゼロ点回帰分析ですから、回帰式のあてはまりのよさは、単回帰分析よりもゼロ点回帰分析のほうが必ず悪くなります。

さらに不思議なことにy=-axbのような関係をもつデータ群にゼロ点回帰分析をおこない、あてはまりのよさの指標であるR2を求めると、なんと、R2 0 となることがあります。

R2は相関係数の2乗であるからマイナスになるわけはない!マイナスになるのはけしからん!と考える人もいますし、0(単回帰にまったくあてはまっていない状態)よりもR2が小さくなってしまうほど、あてはまりがひどいんだ、とR20をすなおにうけいれる人もいます。

Excel2007以前のバージョンは、散布図でのオプション機能もLINEST()という回帰分析を実行する関数もR2がマイナスになる計算をしていました。ところが、Excel2007以降、散布図のオプションはR2がマイナスになる計算をしているのに、関数LINEST() は絶対にマイナスにならない計算方法を採用し始めているようです。当然、両者のR2の結果は異なります。

そして、ゼロ点回帰分析で、R2 0にならないような関係のデータ群について求めたR2 の計算結果も両者で異なるという、大変由々しき問題が発生してしまいました。

先日の品質工学研究発表大会で交流がはじまった静岡品質工学研究会の方にこのことを教えていただき、いろいろとメールでディスカッションしました。 

私は、ゼロ点回帰式のあてはまりが悪い場合、R2 0 となってもまったく問題がない、という立場をとっています。それはつぎの事例から説明できます。

(x,y) の関係で 11) (22.2) (33.1 というデータ群にたいして、単回帰分析をおこなうと、b11.05 b00 つまり、y=1.05+0となります。そして、R2 0.993 になります。

一方、このデータ群に対してゼロ点回帰分析をおこなうと、b11.05 つまり、y=1.05xというゼロ点回帰式が求まります。そして、R2 0.993 になります。

つまり、R2 0 が存在する計算方法を採用した場合、このデータ群にたいして単回帰分析をおこなった場合とゼロ点回帰分析をおこなった場合の結果は一致します。しかし、R2 が必ずプラスになるゼロ点回帰分析の計算方法の場合、R2 0.999となり、単回帰のR2 と一致しないばかりか、その値よりも良好なあてはまりをしめしてしまいます。

私としては、この現象はR2 0になることよりも重大なあやまりであると思うからです。

ところで、先日 『BABY METAL』 がガガさんの全米ツアーの前座をつとめることをお知らせしましたが、昨日、なんとガガさんの日本ライブの前座をももクロちゃんが務めるという発表がありました。ガガさんの要請だそうです。びっくりです。

日産スタジアム2Daysまで、あと3週間をきりました。体調を整え、体力をつけておきます。

なお、BABYMETALの英国でのライブは、大成功だったようです。よかった、よかった!