言語空間+備忘録

メモ (備忘録) をつけながら、私なりの言論を形成すること (言語空間) を目指しています。

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

OCRで重要なのは原稿の「向き」

2012-10-03 | 日記
 このブログは引用を元に考える、というスタイルをとっているので、必然的に引用が多くなります。



 これまで、引用は主として手入力で行っていました。OCR ( Optical Character Reader, 光学式文字読取装置 ) の性能を信用していないからです。

 英語はともかく、すくなくとも日本語入力に関しては、手入力のほうが確実で速いでしょう。

 かなり前ですが、出版社ですら、(性能に問題があるので)OCRソフトを使わず、アルバイトの手入力に頼っている、という話もありました。



 そろそろOCRソフトも進化しているかもしれないと思い、今日、試してみました。

 同じ原稿なのに、なぜか読み取れたり読み取れなかったりで、試行錯誤を繰り返した結果、ついに一定の傾向をみつけました。

 問題は原稿の「向き」です。

 原稿を(私の感覚では)不自然な向きにセットすると、(それなりに)文字が読み取れることがわかりました。

 もちろん入力チェックと、手入力での訂正は必要ですが、入力が(それなりに)速くなります。

 このブログの更新も確実に増えると思います。



 みなさんもOCRを使う必要が生じたときには、「向き」を変えて試してみてくださいね。

 なお、参考までに記しておきますが、私が試した原稿は、すべて、「縦書き」です。
ジャンル:
ウェブログ
コメント   この記事についてブログを書く
この記事をはてなブックマークに追加
« 自炊は疲れる | トップ | 「日米同盟:未来のための変... »

コメントを投稿


コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。

あわせて読む

トラックバック

この記事のトラックバック  Ping-URL
  • 送信元の記事内容が半角英数のみのトラックバックは受け取らないよう設定されております。
  • このブログへのリンクがない記事からのトラックバックは受け取らないよう設定されております。
  • ※ブログ管理者のみ、編集画面で設定の変更が可能です。