松庵

シナリオライター
&絵コンテマンな
松浦の軌跡。

テキスト抽出に失敗

2011-01-06 16:16:00 | なんでもない日々
自炊した書籍のPDFからワード文書への変換でつまずきました。

まずは素直にファイル丸ごと変換にかけてみました。
結果、イラストがちりばめられた謎の暗号に。これでは読書どころではありません。
気を取り直してPDFからテキストを選択して変換をもくろむも、今度は文字化けの嵐でさんざんな目に。

やはりスキャナ付属のOCRではだめか……。


スキャナとの相性でいえば、オーガナイザーを利用するのが一番手軽かつ操作性もいいのですが。でも、実用に耐えないのであれば仕方ないです。
少し値段の高いOCRソフトを買えば、読めるレベルになるのかな。

ここまでは自力でやってきましたが、そろそろハウツー本にも目を通してみようかな。
本を電子化するに当たって、本屋さんに新しい本を買いに行くという、よく考えなくても不可思議な行動です。

でもなぁ。
どうせ、ちまたの本に載っているケースは、最終的にモバイルPCか、ipadみたいなもので読みましょう。という結論なんだろうな。
それならなにも本なんか読まなくても自分でできるというものです。
もっとニッチなところに住んでるんです。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする