Huahin(ほあひん) FrameworkというHadoopをラップしたフレームワークをryu_kobayashiさんが公開されたので、早速WordCountを作ってみたw
2011年のHadoop Conference Japanのryu_kobayashiさんのLTで「Pig/HiveとAsakusaFWの中間のフレームワークが欲しい」(確かあの当時、新しいフレームワークか何かが出そうって話があって、それが望むものかどうか様子を見る)と言っていたような気がするけど、結局自分で作っちゃったんだなw すごい。
レコードを区切り文字で区切って各フィールドに名前を付けて値を取得する、という考え方はCascadingと似ている気がするけど、実際にコーディングしてみると、Cascadingよりずっとシンプル。
MapReduceの薄いラッパーなのでどう動作するかイメージしやすいし、CSVやTSVファイルを対象にした簡単なMapReduceをちょろっと作りたいようなときには、確かに便利そう。