それではProgramListOCRやGoogleのOCRのテストで使用したBASICリストを読み取ってみます。easyocr_reader.pywのラジオボタンは"英語"と"カナなし"を選択しています。
↓
イコールが誤変換されていたりカンマが欠落したりしています。でも数字は1をI(アイ)に誤変換したくらいでほぼ正確に読み取っていますね。ProgramListOCRやGoogleのOCRと比較すると文字の認識率は少し低い感じです。
以前に配布したDumpFormater.exeで余分なスペースを排除することができます。(OCRエンジンの項目はGoogleにする)
続いてこちらのBASICリストを読み取ります。
↓
DumpFormater.exe使用後
このフォントの場合=(イコール)は必ず-(マイナス)になりますね。やはり文字認識はGoogleOCRに敵いません。フォントの異なる色々なBASICリストを読み込ませてみましたが、誤変換する文字は異なっても結果は上記と似たような感じでした。
EasyOCRはデフォルトのままではBASICリストの読み取りに向いてなさそうです。ProgramListOCRのように独自に学習させればもっと使い物になるのかも。ソースコードに学習サンプルがあるようなのですが、いまのところ見ても良くわかりません。
したがって、現時点でBASICリストの読み取りはProgramListOCRとGoogleのOCRをうまく使い分けていくのがベストの様です。
次回はEasyOCRでマシン語ダンプリストを読み取ってProgramListOCRやGoogleのOCRと比較してみましょう。
※コメント投稿者のブログIDはブログ作成者のみに通知されます