それではダンプリストを読み取らせてみましょう。easyocr_reader.pywのラジオボタンは"マシン語"を選択します。
I/Oタイプ
↓
レイアウトがかなり崩れています。EasyOCRがどんなふうに文字を切り出したのか見ると、
なんだか中央部分の切り出しがぐちゃぐちゃです。EasyOCRにはバウンディングボックスを統合するオプ . . . 本文を読む
それではProgramListOCRやGoogleのOCRのテストで使用したBASICリストを読み取ってみます。easyocr_reader.pywのラジオボタンは"英語"と"カナなし"を選択しています。
↓
イコールが誤変換されていたりカンマが欠落したりしています。でも数字は1をI(アイ)に誤変換したくらいでほぼ正確に読み取っていますね。 . . . 本文を読む
前回、EasyOCRを利用できる環境を作ったので今度はマイコン雑誌のリストを読み取るプログラムを作成します。プログラムにはPythonを使います。EasyOCRをPythonから利用するのは数行のプログラムで書けるので簡単ですが、ネットによくあるコマンドラインからの利用では使い勝手が悪いので、tkinterを使ったGUIプログラムにしようと思います。また、以前OCR検証に使ったWindows標準の . . . 本文を読む
せっかくなので前回に引き続き、EasyOCRを使ってマイコン雑誌のプログラムリストを読み取ってみることにしました。
EasyOCRはPyTorchというPythonベースのディープラーニング・ライブラリを利用しています。そのためEasyOCRを動作させるためにはPythonをインストールする必要があります。また、NVIDIAのGPUを使った並列演算処理を行うためのCUDAも利用します。したがって . . . 本文を読む
DumpFormater.exeのマシン語ダンプリスト修正機能について説明します。
マシン語ダンプリストを修正するときは右側の項目の"I/O"~"ASCII"を選択します。それぞれ前回説明のダンプリストタイプに対応しています。「OCRエンジン選択」の項目はProgramListOCRなら"Tesseract"を、GoogleドライブのOCRなら"Google"を選択します。次に「OPEN」ボ . . . 本文を読む