goo blog サービス終了のお知らせ 

ALPHA TALK by Ω-トライアスリート

病気がちな’たかぼん’の何気ない日常(備忘録)

NISSAN CUP

2006年09月08日 | 統計学
トライアスロン宮古島大会は、α-トライアスリートご用達ですごすぎるんで、僕が6月に出たホントの市民レベルの大会の結果を報告。

第20回NISSAN CUP神奈川トライアスロン大会
場所:横須賀
日時:2006年6月11日
距離:スイム1.5km、
   バイク40km(実際は38kmくらいでした)
   ラン10km(これも実際は9.5kmくらいのよう)
完走者:203人(女性13人)

それぞれの種目データから。ヒストグラム見てわかるとおり、宮古島と違って制限時間もゆるく、参加者のレベルもばらばらなんで、ものすごく遅いタイムの人たちがどの種目にも10人くらいいる。で、それらの人は統計データからオミットすることにした。縦バーでカットラインを示した。自分の記録は↑で。



○スイム:45分でカット。()の中はカットなしの全人数の場合 
人数:195(203)
平均:33分22秒
中央値:33分04秒
最上位:22分01秒
最下位:44分31秒(54分40秒)
標準偏差:4分30秒

個人成績:38分19秒
偏差値:39.1

→実力どおりの結果。

○バイク:1時間37分でカット。()の中はカットなしの全人数の場合 
人数:193(203)
平均:1時間16分48秒
中央値:1時間15分50秒
最上位:1時間01分34秒
最下位:1時間36分18秒(2時間09分07秒)
標準偏差:7分34秒

個人成績:1時間12分39秒
偏差値:55.5

→途中で(小)タイムで2分くらいロスしてる。ロスなければ1時間10分くらいでいけてたと思うんですが・・・

○ラン:1時間05分でカット。()の中はカットなしの全人数の場合  
人数:193(203)
平均:48分29秒
中央値:47分56秒
最上位:36分43秒
最下位:1時間04分01秒(1時間25分48秒)
標準偏差:6分36秒

個人成績:54分33秒
偏差値:40.8

→途中で(大)タイムで5分くらいロスしてる。ロスなければ50分くらいでいけてたと思うんですが・・・



○総合:3時間15分でカット。()の中はカットなしの全人数の場合  
人数:190(203)
平均:2時間38分35秒
中央値:2時間36分36秒
最上位:2時間05分56秒
最下位:3時間15分56秒(3時間41分46秒)
標準偏差:15分58秒

個人成績:2時間45分31秒
偏差値:46.6

全体を通して、宮古島とは違ってみんなマイペースな感じ。海は汚いけど来年も出ようかな。

トライアスロン宮古島大会の過酷さを統計学的に→バイクを150kmにすべき

2006年09月05日 | 統計学
今日の記事は長くなっちゃいます。興味のある方むけで。

湘南オープンウォータースイミングで興にのって、まだ出てもいない宮古島大会の2005年記録について統計学的な処理をしてみた。前提としてお知らせしておくこと。

SWIM:3km
BIKE:155km
RUN:42.195km

各種目ごとにも関門がある。また、全体としての制限時間が14時間。これ以上かかった人のデータはなし。

出走者
全体:1,295
男性:1,121
女性:174

完走者
全体:1,211 (棄権:84(6.5%))
男性:1,057(棄権:64(5.7%))
女性:154 (棄権:20(11.5%))

まずは各種目の成績を。

SWIM
総合平均:1時間1分12秒
男性平均:1時間0分57秒
女性平均:1時間2分35秒

きれいな正規分布で男女の差ほとんどなし。これは湘南オープンウォータースイミングのデータと一致。市民スイマーには男女差がないようです。



BIKE
総合平均:5時間56分38秒(平均時速26.08km/h)
男性平均:5時間53分10秒(平均時速26.33km/h)
女性平均:6時間20分46秒(平均時速24.42km/h)

3種目の中で、唯一明確な男女差がある種目。箱ひげ図に明確に示されている。チャリンコの大会に出てる感じでは、この男女差はトライアスリート特有ではないと思う。こんど純粋な自転車の大会で検証します。
原因は女性の機械アレルギー? 自転車ってチェーンはずれたりパンクしたりと、機械が苦手だとメンテナンスできない。それとも筋肉のつき方でしょうか。今持ってるデータだけからははっきりしない。グラフに二つの男女の山、書いておいた。



RUN
総合平均:4時間53分20秒
男性平均:4時間52分26秒
女性平均:4時間59分42秒

ほんの少しだけ男性が速い(ほとんど差なしだけど)。純粋な市民マラソン大会でこの男女差については検証する必要がある。なにはともあれ平均でフルマラソン5時間きってきてる。みんなすごい!



いよいよ過酷さをあらわすデータを。

総合成績
総合平均:11時間51分11秒
男性平均:11時間46分34秒
女性平均:12時間23分02秒

スイムの2分くらいの差、バイクの27分、ランの7分が累積して、36分くらの男女差。そしてなんと、本来なら正規分布になるべきヒストグラムが、変に切れている。そして14時間のところに高いピークが。

そう、制限タイムがなければ実力的には14時間以上かかるべき人が、14時間を目指してダッシュしている様子がこのグラフから見て取れる。これは棄権率にも現れてて、男性5.7%に対して女性は11.5%が棄権(全体で6.5%)。おそらく本来なら全体で10%程度の人が完走できないところ、たぶん30人くらいの人たちががんばってゴールしてるようだ(赤丸でかこった人たち)。うーん、14時間走ってさらに限界を超えてダッシュする、かなりきつくない?

そしてそのきつさは女性にとってより過酷。女性のこと考えたら、バイクをきりよく150kmにしてあげればだいぶ楽になると思うよ(女性の場合、5km、12分くらいかかるもん)。主催者の方々、聞いてる!




今朝はバイク30km、ダッシュ1km。

メジャーリーグの数理科学

2006年09月04日 | 統計学
楽しい本! 翻訳のまずさ、数多い誤記、わかりにくい説明など、本としては問題あるけど、中身は最高。マネーボールはセイバーメトリクスについての消紹介本みたいだったけど、こちらは立派な統計の本。万人向けということで詳しい説明は省いてるけど、裏側にある理論を自分は知ってるのでストレスなく読めた。

サッカーやラグビーのようなプレーが連続的なゲームでも数値分析をやるけど、勝利(得点)に結びつくプレーとの因果関係を探すのは大変。想像してもらえればわかるけど、終始押してて玉の支配率が高いチームが負けることって、これらのゲームではよくある。でも野球の場合、プレーが離散的(一つ一つのプレーが切れ切れだってこと)であり、しかも得点を挙げたチームが時計的には勝つことがわかってる。しかも得点するには塁に出ることが必須。どのようなプレーが得点に結びつくかを徹底的に分析してる。面白いです!



この本の中でよく登場するのが下の「箱ひげ図」。真ん中の箱の中の棒が中央値、箱の両端が第1四分位数と第3四分位数を示してる。箱の両側についてる’ヒゲ’のようなものは最上位値と最下位値を。これで数値の散らばり具合が一目でわかる。前回書いた9月1日ヒストグラム、散布図、そしてこの箱ひげ図の三つがあれば、おおよその統計の説明ができる。
湘南オープンウォーターの女性と男性の記録の「箱ひげ図」です。3時間でカットしてるとはいえ、趣味のスイムの世界では女性と男性でほとんど記録に差がないですね。



なんとか5時におきて、チャリ30km、ジョグ3km。昨晩焼肉食べてからだが重い。バイクはそうでもないけどランはちょっとでも重いと走れない・・・

湘南OW(6kmスイム)の数理科学

2006年09月01日 | 統計学
基礎データがほとんどないので何もできないけど・・・

図1は、タイムごとの頻度を示したヒストグラム(時間は秒で)。平均タイムの2時間13分32秒を青い矢印で。平均値(メディアン)が最頻値(モード)とほぼ重なっているきれいな正規分布。自分の記録(2時間58分54秒)は赤矢印。当然だけどもっともはずれたところ。

図2は、年齢とタイムの散布図。このふたつの相関係数は0.392。弱いですが相関あり。回帰直線(タイム=年齢×3.962+6432.118)も重ねている。自分の年齢では、2時間14分20秒くらいで泳がないといけないらしい。45分も短縮しなきゃ・・・