ヒント: ひどい HTML を TagSoup で修正する
http://www.ibm.com/jp/developerworks/xml/060602/j_x-tiptagsoup.shtml
TagSoup home page
http://mercury.ccil.org/~cowan/XML/tagsoup/
tagsoup-1.0rc4.jar
java -jar tagsoup-1.0rc3.jar --html < 入力ファイル名 > 出力ファイル名
tagsoup カスタム版
http://homepage.mac.com/yuji_okamura/DotMac/t/archives/2005/12/entry_75.html
tagsoup-1.0rc3-OKAMURA.tar.gz
http://www.ibm.com/jp/developerworks/xml/060602/j_x-tiptagsoup.shtml
TagSoup home page
http://mercury.ccil.org/~cowan/XML/tagsoup/
tagsoup-1.0rc4.jar
java -jar tagsoup-1.0rc3.jar --html < 入力ファイル名 > 出力ファイル名
tagsoup カスタム版
http://homepage.mac.com/yuji_okamura/DotMac/t/archives/2005/12/entry_75.html
tagsoup-1.0rc3-OKAMURA.tar.gz