1995 年頃の話。文書処理にも使えるし,統計解析プログラムなども AWK を使って書いていた(AWK は今でも使う)。
例えば,
http://monitoring.tokyo-eiken.go.jp/mp_shinjuku_air_week_list.html
にある,
:
<tr>
<td>2013/01/06 23:01~24:00</td>
<td>0.0498</td>
<td>0.0420</td>
<td>0.0457</td>
</tr>
<tr>
<td>2013/01/06 22:01~23:00</td>
<td>0.0485</td>
:
のような HTML ファイルから,データを切り出すのに
/<td>20/ {
sub("^.*<td>", "", $0)
sub("</td>.*", "", $0) # 最後に ^M がついている!
sub("~", "-", $0)
split($0, date0, "[ /:-]")
getline; split($1, d, "[<>]"); d1 = d[3]
getline; split($1, d, "[<>]"); d2 = d[3]
getline; split($1, d, "[<>]"); d2 = d[3]
print date0[1], date0[2], date0[3], date0[4], date0[5], date0[6], date0[7], d1, d2, d3
}
のようなスクリプトを書く。
R のパッケージには汎用の関数もあるけど,決め打ちルールでスクリプトを書くのも,あまり苦にならない程度のものである。
統計計算も BASIC でプログラムを書くよりも論理構造がはっきりするので AWK で書くほうが好きだった。
ものによっては,JAVA や C などコンパイラ言語を使うのは面倒だが,R で書くより若干処理速度が速いこともあるのでいまでも AWK でプロトタイプを書いてから R や JAVA に翻訳することもある。