以下のようなデータを読むのに数十行費やしているプログラムがある。
======= begin
いろいろ注釈もあるんだろう
/ row column
2 3
c1 c2 c3
r1 1 5 2
r2 3 2 6
======= end
行名や列名も取り出したいということなんだけど以下の 4 行で済むし,行数列数もデータファイル中に書く必要はない(人間が数えて書くとエラーが生じる可能性すらある)。pd.read_csv にここに書いた以外にたくさんの引数があるのを把握している人も少ないかも知れない(大概のことは引数の指定でできるはずなので,help をチェックすべし)
import pandas as pd
dat = pd.read_csv("dummy.txt", delim_whitespace=True, skiprows=4)
columns = dat.columns
index = dat.index
pandas のデータフレームで不都合なら,numpy.array(dat) とすればよいだけ。
データ入力のようなよくある処理に,独自のプログラムを書くのは無駄な作業だ。
※コメント投稿者のブログIDはブログ作成者のみに通知されます