何度かOCRについての記事書いています。
今回は「OCRの文字認識」についてのレポートを書きます。
OCRの文字認識とは、「イメージ(画像)で取得して文字にする」ことです。
スキャナーを持っているのですが、取り込むのにものすごく時間がかかります。
A4サイズのスキャナーなので、雑誌を取り込みときに位置がずれたりして手間がかかります。
そこでデジカメで撮影して文字認識がどれだけできるかという方法で試してみました。
作業は夜の室内で行います。会社から帰ってきたあとに行いますので、どうしてもその時間帯になります。
この時間帯は写真撮影の条件が悪く、照明は電灯の明かりです。
その環境で撮影手法を変えて行います。
その結果、「ストロボを使わないで接写モードで撮影」が認識率が高いという結果になりました。
ストロボを使わないことで、連続撮影が可能(最新のデジカメはストロボを使っても連写できるのでしょうか?)になり、複数枚の雑誌記事でも短時間に撮影が可能になります。
スキャナーの撮影に比べると、大幅な時間短縮です。(もちろん画質はスキャナーの方が良くなりますので、画質重視の場合はスキャナーです)
雑誌記事を撮影して文字の認識を行いましたが、ほとんど誤認識がなくそのまま使えるというレベルです。
文字の背景が暗いと誤認識が出てくるかもしれません。(未実施)
こういう作業は手間がかからないということが最重要です。
さらにきつい作業(たくさんの認識を行わせる)を行ったらレポートします。
今回は「OCRの文字認識」についてのレポートを書きます。
OCRの文字認識とは、「イメージ(画像)で取得して文字にする」ことです。
スキャナーを持っているのですが、取り込むのにものすごく時間がかかります。
A4サイズのスキャナーなので、雑誌を取り込みときに位置がずれたりして手間がかかります。
そこでデジカメで撮影して文字認識がどれだけできるかという方法で試してみました。
作業は夜の室内で行います。会社から帰ってきたあとに行いますので、どうしてもその時間帯になります。
この時間帯は写真撮影の条件が悪く、照明は電灯の明かりです。
その環境で撮影手法を変えて行います。
その結果、「ストロボを使わないで接写モードで撮影」が認識率が高いという結果になりました。
ストロボを使わないことで、連続撮影が可能(最新のデジカメはストロボを使っても連写できるのでしょうか?)になり、複数枚の雑誌記事でも短時間に撮影が可能になります。
スキャナーの撮影に比べると、大幅な時間短縮です。(もちろん画質はスキャナーの方が良くなりますので、画質重視の場合はスキャナーです)
雑誌記事を撮影して文字の認識を行いましたが、ほとんど誤認識がなくそのまま使えるというレベルです。
文字の背景が暗いと誤認識が出てくるかもしれません。(未実施)
こういう作業は手間がかからないということが最重要です。
さらにきつい作業(たくさんの認識を行わせる)を行ったらレポートします。