最小2乗法(Least Square Method)とは、データ解析の基本的な手法です。通常、統計学のテキストで最小2乗法を最初に学ぶのは、回帰分析です。しかし、統計学の基本概念である平均値は、最小2乗法によって導かれるものです。よって、回帰分析を学ぶ前に、最小2乗法を概観しましょう。
[0]最小2乗法とは?・身近な例で考える
いま、東京、横浜、名古屋、大阪、博多に住んでいる5人の旧友が、久しぶりに飲み会をすることにしました。ところが、5人全員が、自分が住む都市で飲み会を開きたいといって譲りません。でも、それでは、旧交を温めることができません。まさに本末転倒です。ホント、困ったことになったなあと、全員が思いました。まあ、本当にそう考えるなら、自分の主張を譲ればいいのです。が、他人を利するような譲歩ってのは、大人になったところで、できるようになるものでもありません。すると、昔から悪知恵が働く、名古屋に住む一人が、このような解決策を提案しました
「全員の移動量の合計が最小になる場所で、飲み会をしよう」
「全員の移動量が最小になる」とは、移動量が多い人も、少ない人もいるけど、5人全体の移動量から考えば、移動に要する労力が最も小さくなる場所のことです。他の4人は、この提案に対して、ちょっと腑に落ちない感じがしました。なんとなく、全員の中間地点である名古屋の近くで飲み会をすることになる感じがするからです。でも、他によい案もないし、ケチもつけにくい感じもします。結局、名古屋の人の提案を満たす場所で飲み会をすることにしました。では、飲み会の場所は、どの様に決めたらよいのでしょうか。勘と経験で、「うりゃぁーーー」と決めてしまう方法や、念力に頼る方法もあるとは思います。しかし、このブログの目的は、僕が数学的な意思決定を学ぶことにあります。ということで、飲み会をどこで開くべきかを、数学的に決めることを考えようと思います。
ただし、最小2乗法を用いて意思決定するという決断は、たんなる自分の好みによっているということは、肝に銘じておかなくてはなりません。突き詰めれば、本当に中立的な評価など、論理的に成り立ち得ないと思いますので。
[1]最小2乗法の一般的な解き方
さて、一般的にaを求める方法について考えましょう。
よって、飲み会をすべき場所は、東京から
(0 + 29 + 366 + 553 + 1176)/5 = 424.8
の地点です。なお、東名高速東京ICから名神高速八日町ICまでが432kmです。よって、飲み会は、滋賀県の八日町あたりで開催されることになるでしょう。