「R による統計解析」の 59ページにある「多重クロス集計表から元のデータフレームを復元する」を Julia で書いてみた。
julia> using DataFrames
julia> df = DataFrame(a = [1, 2, 3], b = ["a", "b", "c"], n = [2, 3, 4])
3×3 DataFrame
Row │ a b n
│ Int64 String Int64
─────┼──────────────────────
1 │ 1 a 2
2 │ 2 b 3
3 │ 3 c 4
df の各行を df.n に書かれている数だけ水増しする(というのは聞こえが悪いので,元のデータセットを作ると言うかな)
空のデータフレームを作る。
julia> df2 = DataFrame()
0×0 DataFrame
作業本体
julia> for row in eachrow(df)
for j in 1:row.n
push!(df2, row)
end
end
できたかどうか見てみよう。
julia> df2
9×3 DataFrame
Row │ a b n
│ Int64 String Int64
─────┼──────────────────────
1 │ 1 a 2
2 │ 1 a 2
3 │ 2 b 3
4 │ 2 b 3
5 │ 2 b 3
6 │ 3 c 4
7 │ 3 c 4
8 │ 3 c 4
9 │ 3 c 4
できてますね。