裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

「折れ線グラフに原点不要」って,いつから一般常識になったの?

2014年08月15日 | 統計学

以下の図は,1983年から1989年までの日経平均株価のグラフである。

「折れ線グラフは,変化を表すものだから,縦軸の原点は不要」というのは,いささか乱暴(目的によるのだろうが)ではないか。ちなみに,日経平均株価は間隔尺度では無く比尺度(ただし,0ということはあり得るので,純粋の比尺度では無いだろうが,株価0というのはあり得ない(あったらこわい)値なので)。

縦軸の目盛りがちゃんと描かれていれば,初期から終期までどれくらいの変化があったのかは,暗算すれば分かる(まあ,4倍くらいになったと言うことだが)。

だからといって,以下に示す2つのグラフが同じといえる訳ではないのは明らか。下の図は,「暗算しなくても目分量で4倍くらいかな」とわかる。逆に言えば,上の図は,うっかり見ていると(そんな奴はいないだろ!という突っ込みはなしで)とても4倍の上昇とは見えないかも知れない(4倍以上の上昇と見せるための悪意があるだろう)ということ。

原点がもっと下にあるようなデータなら,両者の違いが甚だしくなるのは,火を見るより明らか。

原点よりはるか上で,ほんの少しの振れ幅の傾向を見たいということ自体,意味がないことのように思える(±数パーセントの変化が±数兆円の変化になるのなら別だが)。

本質は,「変化を見る」ということは,「時間との相関を見る」ということ,単純な関数関係になることは少ないだろうが,もっとも単純な場合は,「時間に比例するか」ということ。そういうことならば,どこにあろうが,相関係数は同じなので何の問題もない。

しかし,多くの場合は相関関係(相関係数)ではなく線形関係(切片と傾きを伴う予測式)ではないか?この場合には,切片をどうするかは本質的なもの。つまり,上の図のように切片を(ほぼ)0としてしまうか,下の図のように0ではないとするか。

データが直線関係にない場合には更に複雑になるだろう。

 

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 3 次元空間の単位ベクトルを... | トップ | 二軸グラフはいつでもダメな... »
最新の画像もっと見る

コメントを投稿

統計学」カテゴリの最新記事