Asakusaフレームワークでファイルを扱う場合、基本的にSequenceFileを対象としている。
テストで実行する場合は自動的にファイルを作ってくれるのでどんな種類のファイルでも構わないが、実際に使う際にテキストファイルを入力としたい場合は専用のInputFormatを作る必要がある。
ちなみに、HadoopのTextInputFormatはそのままでは使えない。
TextInputFormatはキーがLongWritableで値がTextとなる。AsakusaFWではキーは無視されるので何でもよいが、値はデータモデルである必要がある為。
という訳で、AsakusaFWでテキストファイルを読み込む為のInputFormatを作ってみた。