東京都立川市のシステム開発会社 株式会社コンフィック ブログ

お客様の業務効率化や教育環境を整備するシステムを開発・運用しています。

OCRとXML

2020年09月29日 23時15分01秒 | XML

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース化のサービスを行っています。

紙媒体で保管されている情報を電子データ化する際,スキャンしたPDFとするだけではなく,OCRを行い,XMLまで処理を行うことで,よりデータを活用することが可能です。
株式会社コンフィックでは,数万ファイルのOCR処理を経験したスタッフが,お客様のデータ化のコンサルティングから実作業まで対応します。
OCRを行う際,認識率を向上するために,紙媒体の年代によるOCR認識辞書の作成や,旧字体の置き換え,などその後の用途に応じたご提案をいたします。
さらにテキスト化だけではなく,文書に応じたマークアップをすることにより,より汎用性の高いデータになります。
紙媒体だけではなく,マイクロフィルムからのOCRなども経験したスタッフの経験から,最適なデータ作成フローのご提案をいたします。

データ作成をご検討中の方は,サンプルを送付いただければ,ご提案いたします。
株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「コンサルティング」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





正確なデータの作成

2020年06月28日 23時48分09秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成,データベース構築のサービスを行っております。

書籍や,文書のデータ化は,その文書構造定義はもちろん,テキスト化の内容や仕様についてもお客様と相談の上行います。
作成したデータをどのように用いるのか,データポリシーの策定からお手伝いいたします。
古い文書の場合,その字体やフォントにより,同じ文字でも異なる表示をする必要があるものや,文字を代替する必要があるものが出てきたりします。
できる限り正確な文字を選択し,データ化することは,データ化のルールや作業者の経験も必要です。

さらに文書には,参照情報や,手書きによるコメントが入っているものなどもあり,それが重要な場合もあります。
どの範囲までデータ化するのか,それはどのように表現するものなのかを含め,お客様と検討をいたします。
永続的に利用可能なデータとするためには,最初の仕様検討がとても重要です。

株式会社コンフィックでは,多くのデータ化実績から,最適なご提案をいたします。
お気軽に株式会社コンフィックまでご相談ください。
なお,現在テレワークを実施しているため,お電話に出ることができない場合があります。
お問合せフォームよりご連絡いただければ,担当者より折り返しのご連絡をいたします。


【関連記事】株式会社コンフィックの「データ作成」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





ブラウザで表示できない外字を画像化

2019年11月30日 23時04分47秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース構築のサービスを行っております。

古い書籍などの電子データ化は,その当時の字体をブラウザでテキスト表示することが困難な場合があります。
外字と呼ばれるそれらの旧漢字などは,検索のために代替え文字にすることが多いと思います。
ですが,原本性が重要視される書籍や,人名や地名など,代替え文字を利用すると支障の出るものについては,インライン画像にて対応をすることが多くあります。
そのような場合には,テキストではないため,検索にヒットさせるためには工夫が必要です。
代替え文字と画像を切り替える方法や,画像の属性に代替え文字を入れておくなど,内容に応じて対応する必要があります。

株式会社コンフィックでは,多くのデータ処理の経験から,対象となる書籍や文書など,最適なデータ化のご提案をいたします。
テキスト化だけではなく,マークアップを行い,より活用可能なデータを構築いたします。

データ化やデータベース化をご検討中の方は,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「データ化」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





検索時の入力キーワードの補助

2019年11月23日 23時52分59秒 | システム開発

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,Webシステムを中心にシステム開発を行っております。

Webシステムで必須の機能である検索機能は,その検索キーワードからユーザが求める結果がヒットすることが重要です。
多くの方が利用するシステムでは,どのような入力があるか,その入力をどれだけ補助できるかもシステムの利便性を向上させるためには必要です。
例えば数字を入力する必要がある項目には,全角でも半角でも,さらには必要に応じて漢字で入力されても,同じように検索可能とすることが必要な場合もあります。
また,データは旧漢字や機種依存文字の場合には,新字体でキーワード入力された場合もヒットするように工夫することもあります。

どれだけ利用者を想定してシステム機能を実装するのかを時間をかけて検討し,さらに運用により利用者からの要望で対応を進めることも重要です。

株式会社コンフィックでは,お客様のご要件や利用用途を細かくお伺いし,最適なシステム開発をいたします。
自然言語の技術やAI技術を用いることもご要件に応じて対応いたします。
お気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「検索」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





古書のテキスト化

2019年06月15日 23時02分11秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,紙媒体からのテキスト化,マークアップ,データベース化のサービスを行っております。

古書などをテキスト化する際には,旧字体をどのように処理するのかをお客様とともにルール化することが重要です。
直近の用途だけではなく,将来的にそのデータをどのように利活用するのかを検討し,データ化する必要があります。
できる限り情報が欠落することなく,原本に忠実にテキスト化することも重要です。

テキスト化だけではなく,その後多くの用途でデータ活用できるように,その文書に応じたマークアップをしておくことをお勧めしています。
古書は,その文書構造が確立していないものも多くあります。
それらをどのようにマークアップするのかは,経験が必要です。

株式会社コンフィックでは,多種,大量データのマークアップやデータベース化の経験があります。
作業対象の古書の特性を活かしたデータ作成をご提案いたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「マークアップ」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





フォントと文字種

2018年09月06日 23時27分27秒 | XML

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築の作業を行っております。

紙媒体からの電子データ作成は,その印刷時のフォントにより,文字種が異なるものが多くあります。
データ作成時にどれだけ異字体に対応をするのか,紙媒体原本のままにするのか,それとも統一するのか等,データ作成前にお打合せの上,データ化する必要があります。
人名や地名等,その文字種であることが重要な場合も多くあるため,事前のルール決めがとても大切です。

データは,再利用されることを想定して作成する必要もあるため,汎用的に作成することも必要です。

株式会社コンフィックでは,多くのデータ作成・データベース構築の経験があり,文書種類に応じたデータ構築のご提案をいたします。
データベース構築をご検討中の方は,お気軽に株式会社コンフィックまでご連絡ください。


【関連記事】株式会社コンフィックの「文字」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





テキスト化の文字仕様

2018年03月08日 15時25分44秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース構築の作業を行っております。

古い書籍などをテキストデータ化する際には,その用途により,文字コードや文字種の仕様を事前に決めておく必要があります。
印刷時の文字には,フォントの種類などによる異字体も存在します。
それらをどのようにテキストデータ化するのかを事前に決めておく必要があり,また文字を置き換えた場合には,置き換えた旨の情報を付与しておく必要があるかどうかも含めて検討をします。
特に,地名や人名などは,Webサイト上では表現できない文字を使用している場合も多いため,注意が必要です。

株式会社コンフィックでは,多くのデータを取り扱った経験から,お客様にとって最適なデータ環境をご提案いたします。
データ作成,データベース構築をご検討中の方は,お気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「字体」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





外字の画像化や置き換え

2017年08月19日 09時46分22秒 | クラウドクラス

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築を行っております。

古い書籍などをデータ化する際,いつも課題となるのは,入力ができない外字や異字体です。
できるだけ原本(底本)に忠実にデータ化しておきたいといったご要望が多くある中,外字や異字体についての処理については,データ化前に仕様を明確化しておく必要があります。
Webを通じて広く多くの人に参照してもらいたいといった場合には,利用者の環境により表示できない文字も存在します。

データの用途により,画像化した文字を用いることや,文字の置き換えなどが必要です。
検索にヒットする,しないなども考慮しなくてはいけません。
文字を置き換えた場合には,その文字が置き換わっているという情報も付与しておくことも重要です。

株式会社コンフィックでは,多くのデータを取り扱った経験があり,お客様のご要件に沿ったデータ作成についてご提案いたします。
データ構築やデータベース構築でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「外字」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





文字コードの使用ルール化

2017年05月19日 23時01分28秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築を行っております。
データ化の際には,そのデータ仕様を事前に決める必要があり,その仕様を決めておかないと統一したデータになりません。
例えば,旧字体をどのように取り扱うか,地名や人名等の表現できない特殊な文字をどのように代替するか,縦書き表示時に問題ない文字であるかなどを検討する必要があります。

データをできるだけ汎用的に作成することが重要ですが,それによりデータの用途を妨げることにならないよう,仕様を検討する際には,バランスが重要です。
株式会社コンフィックでは,多くのデータ化の経験から最適なデータ化仕様の策定をいたします。
新規でデータ作成する場合はもちろん,既存データを整備することも対応可能ですので,データに関する事項でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「字体」をテーマにしたブログ一覧





システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





外字の取り扱い

2017年05月13日 23時08分42秒 | データ変換
タイトル:


システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成,データベース構築の作業を行っております。

古い書籍や人名・地名を取り扱う際には,外字や異字の取り扱いを事前に決めておく必要があります。
新字体に置き換える,画像にする,〓などの文字を入れておく等がありますが,そのデータをどのように利用するのかにより,詳細に検討をしておかなくてはなりません。
Webでの用途が主となる場合には,新字体に置き換え,どのような環境でデータを参照しても表示可能とすることが重要です。
紙媒体や音声出力など様々な用途に応じてデータを利用できるよう,汎用的なデータを作成しておくことも方法の一つです。

株式会社コンフィックでは,紙媒体やマイクロフィルムからの電子データ化,XML化の経験があります。
大量データ化,データ処理,データ設計など,最適なデータ構築をいたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「データ」をテーマにしたブログ一覧





システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。