何かというと、タイトルにあるとおりで、柱状グラフから平均を求める方法がある、ということ。
うーん、我ながらこの本読んでいて数学のことを考えるとは、ちょっと病的かも。
そもそも何でこんなことを考えたのかというと、『電波男』の29ページにあった図で、それはまぁ本田透さんが推測する“年間セックス回数平均46回”の内幕の図なんだけれども、横軸には回数、縦軸には人数がとられていて、0回と100回の辺りが極大、50回の辺りが極小になっているわけです。
んで、こうなっているから本当はそんな人はあまりいないのに年間46回というのが平均として出てくる、と。
それで、この図をパッと見たときに「平均」と聞いて自分が最初にイメージしたのはこの図をならして平らにすることだったわけですよ。
言葉だと分かりにくいかもしれないから式で言うと、
y=f(x) (y:人数、x:回数)
となっていて、
∫f(x)dx=∫kdx (kは定数)
となるようなkを求めようとしたわけです。
普通の棒グラフから平均を求める方法というのは、全体の合計を足して個数で割る、すなわち上の式のようなことをやればいいので、ついそれに従って考えてしまったわけです。
けれど、よくよく考えるとそれでは平均は出てこない。なぜって上で求められるkというのは人数であり、各回数における平均の人数というのを出すのに過ぎない。んで、そんな人数の平均を出したって何の意味も無いわけです。
ここではじめて気がつくのが、今出そうとしている平均というものが縦軸のものでなく、横軸のものである、ということ。
だから、普通の棒グラフのときの方法ではダメで、別の方法を考えなければならないわけです。
けれど、「ならす」というのは横軸の場合は使えないですし(具体的にどうやるのかが出てこない)、横軸を縦軸にしたってダメだし(つまり横軸に人数、縦軸に回数をとってならしてもそれは平均になっていない)、かといって棒グラフを各人ごとに書いていってならす、というのでは手間がかかります。
せっかくだから元のグラフからパッと分かるようにしたいわけです。
ちなみに横軸に値(や値の範囲)、縦軸に人数(や個数)をとるグラフを柱状グラフというわけですが、これはテストの点数や体力測定の結果を表示するのによく使われているわけです。
で、テストの点の分布の図とかを思い浮かべて欲しいわけですが、グラフを見れば感覚的に、ここら辺が平均だよなぁ、というのはなんとなく分かるわけです。けれど、根拠は?、と言われるとそれを示すのはなかなか難しい。
実際、一番最初の本田さん図の例で、0回と100回が同じくらいの人数がいるのであれば平均は大体50回くらいだと思える(で、実際に正しい)わけですが、これが少し複雑化すると――例えば、“0回と75回の人しかいなくて、平均が50回になっているとき、0回の人数が50人だとしたら75回の人は何人いるの?”とかいう状態になると、ちょっと考えただけでは答えが分からないわけです。
(ちなみに正解は100人。というのも、75回の人二人が50回になれば、浮いた分の25回×2の50回が0回の人一人にいき50回になる。つまり、0回:75回=1:2という関係がある)
それじゃあ、どうやれば簡単に柱状グラフにおける平均を出せるのかなぁ、となるわけです。
実は、一般論を出すためにとりあえず計算してみるのが正解です。
平均というのは(数量の合計)÷(個数)ですから、それぞれを出しましょう。
数量の合計というのは、x回の人はf(x)人いるわけですから、Σxf(x)回、個数というのは人数の合計ですから、Σf(x)です。
xが整数値だけをとる場合は上でいいのですが、せっかくだから実数値をとってもいいようにすれば、それぞれ∫xf(x)dx、∫f(x)dxとなります。
したがって、回数の平均は
(∫xf(x)dx)/(∫f(x)dx)
となります。
これだけでは、何をしてるのやら、という感じですが、ここでそれぞれが何を意味しているのかを考えてやると、すごいスッキリした結論が導けます。
とりあえず、y=f(x)とx軸とで囲まれた部分をダンボールとかで形作ってやったとしましょう。
すると、このダンボールの重さは∫f(x)dxで表せます。(本当は定数kが必要だけれど、結局消えるので無視)
また、このとき∫xf(x)dxが何を意味するのかと考えると、f(x)が原点から距離xのところのダンボールの重さなわけですから、距離×重さ、すなわちこれは原点周りのモーメントになっています。
そして、このとき(∫xf(x)dx)/(∫f(x)dx)の意味する物といえば、(原点周りのモーメント)÷(重さの合計)、すなわち重心の原点からの距離に他なりません。
だから実は、柱状グラフにおける平均とは、グラフにおける重心のx座標なわけです。
上の事実は結構使えます。
というのも、元のグラフがあれば、そのグラフの形を何かで切り抜いてやりさえすれば重心は簡単に求まる(紐で2回つればいい)ので、めんどうな計算をすることなく平均が求まってしまうわけです。
なんとなく、の平均の出し方にしても、このグラフの重心を見つければいいんだな、という方針がしっかりするので、間違えることも少なくなります。
(実際、さっきの問題でも、中心(50回)からの距離が0回は50、75回は25、すなわち2:1であるので、重さ(人数)は逆比の1:2になるとすぐに分かる)
ちなみに小学校で出てくる柱状グラフというのは値でなく範囲であることが多いのですが、範囲の中心の値を代表の値として平均をとる、という考え方をするのであれば、やはり同様の方法で平均が得られます。
すでに知っている人には何を今更な事なのかもしれないけれど、平均を求める式が重心の式と同じ形をしているのに気付いて、おぉ、とちょっと感動してしまった自分がいたりw