レトロでハードな物語

レトロなゲーム機・マイコン・中古デバイスなどをArduinoやAVRで再活用する方法を模索しています。

EasyOCRで雑誌のプログラムリストを読み取る(その3)

2023年04月22日 | 自作プログラム

それではProgramListOCRやGoogleのOCRのテストで使用したBASICリストを読み取ってみます。easyocr_reader.pywのラジオボタンは"英語"と"カナなし"を選択しています。

                  ↓

イコールが誤変換されていたりカンマが欠落したりしています。でも数字は1をI(アイ)に誤変換したくらいでほぼ正確に読み取っていますね。ProgramListOCRやGoogleのOCRと比較すると文字の認識率は少し低い感じです。

以前に配布したDumpFormater.exeで余分なスペースを排除することができます。(OCRエンジンの項目はGoogleにする)

続いてこちらのBASICリストを読み取ります。

                  ↓

DumpFormater.exe使用後

このフォントの場合=(イコール)は必ず-(マイナス)になりますね。やはり文字認識はGoogleOCRに敵いません。フォントの異なる色々なBASICリストを読み込ませてみましたが、誤変換する文字は異なっても結果は上記と似たような感じでした。
EasyOCRはデフォルトのままではBASICリストの読み取りに向いてなさそうです。ProgramListOCRのように独自に学習させればもっと使い物になるのかも。ソースコードに学習サンプルがあるようなのですが、いまのところ見ても良くわかりません。

したがって、現時点でBASICリストの読み取りはProgramListOCRとGoogleのOCRをうまく使い分けていくのがベストの様です。

次回はEasyOCRでマシン語ダンプリストを読み取ってProgramListOCRやGoogleのOCRと比較してみましょう。

 


最新の画像もっと見る

コメントを投稿