5月14日
ようやく客先落ち着いてきた感じがする。
夜の8時半まではいなくていいようだ。
家でベンガル語のOCRを使っているのだけれど、認識させた文字の間違いを修正した結果が
再登録できるほどは精度はよくないみたい。
せっかくの結果だから、なにか手立て無いかなぁ。
※使っているのは バングラデシュのBRAC大学で公開されている BanglaOCRというもの。
ベンガル語以外が混じっている文書を読み込むと動作がおかしい。
中身はGoogleで公開されている 「Tesseract」をカスタマイズしたものです。
BanglaOCR version 0.6
Center for Research on Bangla Language Processing
http://crblp.bracu.ac.bd/index.php
最新版はVersion 0.7で、段組なんかに対応してます。が、公開されているデータに不備があり、
Version 0.6のファイルで上書きしないと動きません。
それでも市場にはベンガル語OCRはまだ無い様なので、ずいぶんよいですよね。
同じベンガル語を話すお隣インドの西ベンガル州には無いのかな?
調べられていないだけで、実はあったりして・・・。
コルコタなんかコンピュータ技術はバングラデシュより進んでいるわけだし。
お昼もお弁当。
←記事が面白かったらクリック!
ようやく客先落ち着いてきた感じがする。
夜の8時半まではいなくていいようだ。
家でベンガル語のOCRを使っているのだけれど、認識させた文字の間違いを修正した結果が
再登録できるほどは精度はよくないみたい。
せっかくの結果だから、なにか手立て無いかなぁ。
※使っているのは バングラデシュのBRAC大学で公開されている BanglaOCRというもの。
ベンガル語以外が混じっている文書を読み込むと動作がおかしい。
中身はGoogleで公開されている 「Tesseract」をカスタマイズしたものです。
BanglaOCR version 0.6
Center for Research on Bangla Language Processing
http://crblp.bracu.ac.bd/index.php
最新版はVersion 0.7で、段組なんかに対応してます。が、公開されているデータに不備があり、
Version 0.6のファイルで上書きしないと動きません。
それでも市場にはベンガル語OCRはまだ無い様なので、ずいぶんよいですよね。
同じベンガル語を話すお隣インドの西ベンガル州には無いのかな?
調べられていないだけで、実はあったりして・・・。
コルコタなんかコンピュータ技術はバングラデシュより進んでいるわけだし。
お昼もお弁当。
←記事が面白かったらクリック!
※コメント投稿者のブログIDはブログ作成者のみに通知されます