レトロでハードな物語

レトロなゲーム機・マイコン・中古デバイスなどをArduinoやAVRで再活用する方法を模索しています。

EasyOCRで雑誌のプログラムリストを読み取る(その3)

2023年04月22日 | 自作プログラム
それではProgramListOCRやGoogleのOCRのテストで使用したBASICリストを読み取ってみます。easyocr_reader.pywのラジオボタンは"英語"と"カナなし"を選択しています。                   ↓ イコールが誤変換されていたりカンマが欠落したりしています。でも数字は1をI(アイ)に誤変換したくらいでほぼ正確に読み取っていますね。 . . . 本文を読む

EasyOCRで雑誌のプログラムリストを読み取る(その2)

2023年04月17日 | 自作プログラム
前回、EasyOCRを利用できる環境を作ったので今度はマイコン雑誌のリストを読み取るプログラムを作成します。プログラムにはPythonを使います。EasyOCRをPythonから利用するのは数行のプログラムで書けるので簡単ですが、ネットによくあるコマンドラインからの利用では使い勝手が悪いので、tkinterを使ったGUIプログラムにしようと思います。また、以前OCR検証に使ったWindows標準の . . . 本文を読む

EasyOCRで雑誌のプログラムリストを読み取る(その1)

2023年04月12日 | 自作プログラム
せっかくなので前回に引き続き、EasyOCRを使ってマイコン雑誌のプログラムリストを読み取ってみることにしました。 EasyOCRはPyTorchというPythonベースのディープラーニング・ライブラリを利用しています。そのためEasyOCRを動作させるためにはPythonをインストールする必要があります。また、NVIDIAのGPUを使った並列演算処理を行うためのCUDAも利用します。したがって . . . 本文を読む

雑誌のプログラムリストのOCR読み取りについて検証してみた(その5)

2023年04月06日 | 自作プログラム
DumpFormater.exeのマシン語ダンプリスト修正機能について説明します。 マシン語ダンプリストを修正するときは右側の項目の"I/O"~"ASCII"を選択します。それぞれ前回説明のダンプリストタイプに対応しています。「OCRエンジン選択」の項目はProgramListOCRなら"Tesseract"を、GoogleドライブのOCRなら"Google"を選択します。次に「OPEN」ボ . . . 本文を読む

雑誌のプログラムリストのOCR読み取りについて検証してみた(その4)

2023年04月01日 | 自作プログラム
今度はマシン語ダンプリストの読み取りについてテストしてみます。 マシン語のダンプリストには幾つかフォーマットがあります。前回説明したDumpFormater.exeは次の4種類のフォーマットに対応しています。 1.I/O 工学社の月刊I/Oでよく使われていた形式で、縦・横16バイトと256バイトのチェックサムがついているタイプです。 DumpListEditorでチェックするときは「横 . . . 本文を読む