東京都立川市のシステム開発会社 株式会社コンフィック ブログ

お客様の業務効率化や教育環境を整備するシステムを開発・運用しています。

縦書き文書の電子化

2015年02月01日 07時53分43秒 | データ変換
株式会社コンフィック


当社ブログにアクセスいただき,
誠にありがとうございます。

株式会社コンフィックでは,様々な文書のデータベース化やデータ作成業務を行った経験があります。
日本語の場合,古い紙文書はほとんどが縦書きで書かれています。それらをデータ化する際には,日本語の認識が優れているOCRソフトを用いてテキスト化を行います。
縦書きには横書きには無い,全角2文字分の繰り返し記号や傍線があることもあり,テキスト化する際には注意が必要です。
また,古い書籍や人名地名が多く出てくるものをテキスト化する際には,文字種が無い場合もあり,どのような代換文字を用いるか,画像で表示するのかなどをルール化しておく必要があります。


スキャニングするだけではなく,テキスト化までを行うことで多くの用途に活用できるデータになります。
テキスト化されたデータを再度縦書きに組版することや,ブラウザにて縦書き表示することも可能です。
データベース構築,データ作成,活用方法などお気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「電子化」をテーマにしたブログ一覧



システム開発・運用に関してのご相談,ご用命は,
多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





最新の画像もっと見る