弁当日記

ADACHIの行動記録です。 
青年海外協力隊で2006年4月からバングラデシュに2年間住んでました。

ベンガル語OCR BanglaOCR

2009年05月14日 | 協力隊帰国後
5月14日

ようやく客先落ち着いてきた感じがする。
夜の8時半まではいなくていいようだ。

家でベンガル語のOCRを使っているのだけれど、認識させた文字の間違いを修正した結果が
再登録できるほどは精度はよくないみたい。
せっかくの結果だから、なにか手立て無いかなぁ。

※使っているのは バングラデシュのBRAC大学で公開されている BanglaOCRというもの。
 ベンガル語以外が混じっている文書を読み込むと動作がおかしい。
 中身はGoogleで公開されている 「Tesseract」をカスタマイズしたものです。

 BanglaOCR version 0.6
 Center for Research on Bangla Language Processing
 http://crblp.bracu.ac.bd/index.php

 最新版はVersion 0.7で、段組なんかに対応してます。が、公開されているデータに不備があり、
 Version 0.6のファイルで上書きしないと動きません。

それでも市場にはベンガル語OCRはまだ無い様なので、ずいぶんよいですよね。
同じベンガル語を話すお隣インドの西ベンガル州には無いのかな?
調べられていないだけで、実はあったりして・・・。
コルコタなんかコンピュータ技術はバングラデシュより進んでいるわけだし。

お昼もお弁当。

にほんブログ村 海外生活ブログへ←記事が面白かったらクリック!

アクセス解析

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 好みで2品チョイス | トップ | 播磨屋本店 »
最新の画像もっと見る

コメントを投稿

協力隊帰国後」カテゴリの最新記事