裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

Julia: 多重クロス集計表から元のデータフレームを復元する

2022年01月25日 | ブログラミング

「R による統計解析」の 59ページにある「多重クロス集計表から元のデータフレームを復元する」を Julia で書いてみた。

julia> using DataFrames

julia> df = DataFrame(a = [1, 2, 3], b = ["a", "b", "c"], n = [2, 3, 4])
3×3 DataFrame
 Row │ a      b       n     
     │ Int64  String  Int64 
─────┼──────────────────────
   1 │     1  a           2
   2 │     2  b           3
   3 │     3  c           4

df の各行を df.n に書かれている数だけ水増しする(というのは聞こえが悪いので,元のデータセットを作ると言うかな)

空のデータフレームを作る。

julia> df2 = DataFrame()
0×0 DataFrame

作業本体

julia> for row in eachrow(df)
           for j in 1:row.n
               push!(df2, row)
           end
       end

できたかどうか見てみよう。

julia> df2
9×3 DataFrame
 Row │ a      b       n     
     │ Int64  String  Int64 
─────┼──────────────────────
   1 │     1  a           2
   2 │     1  a           2
   3 │     2  b           3
   4 │     2  b           3
   5 │     2  b           3
   6 │     3  c           4
   7 │     3  c           4
   8 │     3  c           4
   9 │     3  c           4

できてますね。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PVアクセスランキング にほんブログ村

PVアクセスランキング にほんブログ村