裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

ダメ出し: 幾何平均の求め方

2022年05月26日 | ブログラミング

情けないことに,幾何平均を求めるときに定義式どおりにやっているページがほとんどである。しかも,cumprod して max を取るなんてヘボなことをしているのも多いのだが,どこかから孫引きでもしてきたのか?

分布の中心 - 幾何平均
https://stats.biopapyrus.jp/stats/average.html
「R では、データ同士の累積 prod を計算してから、データの個数 length の逆数の累乗を求めることで、幾何平均を計算できる。」
prod(x)^(1/length(x))


【算術平均・幾何平均・調和平均】Rで算出してみよう
https://datacoach.me/data/data-edu/r-mean/
gmean <- max(cumprod(yr)^(1/length(yr)))


Rで解析:中心値に関するコマンド。算術、中央、幾何、調和平均。そして、いつか分散へ・・・

https://www.karada-good.net/analyticsr/r-274/
max(cumprod(GeoMData))^(1/length(GeoMData))

 

コメント (1)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

雨の多い曜日(2)

2022年05月20日 | 統計学

雨の多い曜日は月(季節)によっても変わる。

以下は,雨量が 0 でない(少しでも雨の降った)日の割合である(東京)。。

6月の日曜は雨降りの確率が50%!!

      df$w
df$month   月   火   水   木   金   土   日
      1  23.7 15.3 16.3 13.3 12.4 15.5 14.4
      2  19.1 22.5 23.6 22.7 21.3 21.3 21.3
      3  37.1 34.0 26.8 30.6 30.6 28.6 33.0
      4  35.8 41.5 43.6 39.4 27.7 31.9 29.5
      5  32.0 40.8 45.9 44.9 30.9 27.8 35.1
      6  38.3 39.4 47.9 44.7 44.2 41.1 50.0
      7  34.7 39.8 39.2 46.4 45.4 37.1 34.7
      8  39.2 42.3 28.6 26.5 28.6 29.9 25.8
      9  45.7 46.8 44.7 40.4 27.7 36.8 42.1
      10 43.9 41.8 37.8 34.0 36.1 43.3 39.2
      11 45.7 34.0 22.3 27.4 20.0 25.5 27.7
      12 20.4 21.6 19.6 20.6 20.6 19.4 17.3

ついでに,晴れの特異日ならぬ,雨の特異日を抽出してみた。

確率が 0.5 より大きいものをピックアップしたところ,6/30 が確率 0.7276/11, 10/01 がともに確率 0.682 で雨。

 301  304  306  411  510  611  612  616  621
63.6 54.5 54.5 59.1 54.5 68.2 54.5 59.1 54.5

 623  630  701  703  704  705  706  812  831
59.1 72.7 63.6 54.5 72.7 54.5 54.5 59.1 54.5

 904  906  911  916  922  924  930 1001 1006

59.1 59.1 54.5 59.1 54.5 59.1 54.5 68.2 54.5 

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「雨の多い曜日」はあるのか?

2022年05月19日 | 統計学

奥村先生が,「雨の多い曜日」ということで記事を書いておられる。
https://oku.edu.mie-u.ac.jp/~okumura/stat/220517.html

oneway.test() の結果では,曜日ごとの降水量の平均値には差があるとはいえないということだ。
でも,それは「雨の多い曜日」を検討したことになっていないのではないかとちょっと疑問。

降水量が 0 かそうでないかで集計したら以下のようになった。

    a
w    FALSE TRUE
  月   750  398
  火   746  402
  水   769  379
  木   774  374
  金   817  331
  土   805  343
  日   794  354

ちなみに,該当期間では曜日はいずれも 1148 日ずつということだが,%で表示すると
    
    a
w       FALSE     TRUE
  月 65.33101 34.66899
  火 64.98258 35.01742
  水 66.98606 33.01394
  木 67.42160 32.57840
  金 71.16725 28.83275
  土 70.12195 29.87805
  日 69.16376 30.83624

である。月,火,水が多いように見える。

chisq.test() で見てみると,

 Pearson's Chi-squared test

data:  table(df$V2, df$rain)
X-squared = 17.577, df = 6, p-value = 0.00738

有意ですね。

また,降水量の検定を kraskal.test() でやってみても,

 Kruskal-Wallis rank sum test

data:  df$V3 by df$V2
Kruskal-Wallis chi-squared = 14.202, df = 6, p-value = 0.02746

有意でした。

まあ,サンプルサイズがべらぼうに多いから有意になりがちかもしれない。

にしても,だったら oneway.test() はどうだったんだということにはなる。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

BrownForsytheTest よ,お前もか...

2022年05月15日 | Julia

Julia の `OneWayANOVATest`, `LeveneTest`, `FlignerKilleenTest` は,全滅!!!
https://blog.goo.ne.jp/r-de-r/e/1ac3d7b9f0049944e10f7babd90979cf

BrownForsytheTest も,以下のように定義されているので,当然誤った答えを出す。なんてこったい。

BrownForsytheTest(groups::AbstractVector{<:Real}...) = LeveneTest(groups...; statistic=median)

 

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Julia の `OneWayANOVATest`, `LeveneTest`, `FlignerKilleenTest` は,全滅!!!

2022年05月14日 | Julia

`OneWayANOVATest`, `LeveneTest`, `FlignerKilleenTest`   が使っている anova() 関数にバグがある。

全体の平均値を求めるときに,各群の平均値の平均を求めてしまっている。

    Z̄ = mean(Z̄ᵢ)

これでは,各群のサンプルサイズが等しくない場合には正しい答えにならないのは自明である。

    Z̄ = sum(Z̄ᵢ .* Nᵢ) / sum(Nᵢ).

としなければならない。

したがって `anova()` を使う関数 `OneWayANOVATest()`, `LeveneTest()`, `FlignerKilleenTest()` は,すべて誤った答えを出してしまう。

`OneWayANOVATest()` については,少なくとも 2021/08/02 にバグの指摘があったようだが,作者には伝わっっていないようである。

今回の指摘は,伝わるだろうか?一応 GitHub ではコメントしたのだけど。

# Julia 伝道師を気取っていたが,このようなことが度重なると,ちょっと困るなあ。
# Julia の熱心な使用者が少ないのが根本原因だろうなあ。
# 使用者が多ければ,おかしいと気づく人もそれなりに出てくるだろうから。
# 見逃されているというのは,見ている人が少ないからだけだろう。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

一応,技術文書だと思うのに

2022年05月04日 | 雑感

「〜していきます」
「〜となります」
「〜になります」
「〜みたいです」
「〜することができます」
「〜らしいです」
「〜かと思います」
「〜てみました」
「〜表せられる」
「〜できることになります」

一つの記事に2回も3回もでてくるとうんざりする。

 

 

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

title などで,テキストと LaTeX 表記を同時に表記する

2022年05月01日 | Julia

The equation $y = 2x + 1$ のような文字列で,The equation は通常の書体で, $y = 2x + 1$ は LaTeX 表記で描きたい。

どうする?

using Plots, LaTeXStrings
pyplot()
x = 1:10
plot(x -> 2x^3 + 1, title=L"The equation $y = 2x^3 + 1$")

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PVアクセスランキング にほんブログ村

PVアクセスランキング にほんブログ村