東京都立川市のシステム開発会社 株式会社コンフィック ブログ

お客様の業務効率化や教育環境を整備するシステムを開発・運用しています。

ブラウザで表示できない外字を画像化

2019年11月30日 23時04分47秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース構築のサービスを行っております。

古い書籍などの電子データ化は,その当時の字体をブラウザでテキスト表示することが困難な場合があります。
外字と呼ばれるそれらの旧漢字などは,検索のために代替え文字にすることが多いと思います。
ですが,原本性が重要視される書籍や,人名や地名など,代替え文字を利用すると支障の出るものについては,インライン画像にて対応をすることが多くあります。
そのような場合には,テキストではないため,検索にヒットさせるためには工夫が必要です。
代替え文字と画像を切り替える方法や,画像の属性に代替え文字を入れておくなど,内容に応じて対応する必要があります。

株式会社コンフィックでは,多くのデータ処理の経験から,対象となる書籍や文書など,最適なデータ化のご提案をいたします。
テキスト化だけではなく,マークアップを行い,より活用可能なデータを構築いたします。

データ化やデータベース化をご検討中の方は,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「データ化」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





データ作成のこだわり

2019年03月30日 16時45分54秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築のサービスを行っております。

データ化の際には,そのデータをどのように用いるのかにより,最適なデータ設計をする必要があります。
データ形式(テキスト,HTML,XML)といったものだけではなく,そのデータ内容についても細かく定義する必要があります。
Web用途のため,文字コードや外字の対応なども検討が必要です。
さらに,文字種やフォントも考慮する必要があります。

原本性(見た目)を重視するのか,データ活用を重視するのかによっても,データの作成方法は異なります。
文書データだけではなく,数値データの場合にも同様に検討が必要です。

株式会社コンフィックでは,紙媒体からのデータ化はもちろん,テキストデータを加工し,データベースや再組版なども対応しております。
データ化に関してお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「データ化」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





外字や異体字のテキスト化

2018年11月08日 23時14分12秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース構築のサービスを行っております。

古い書籍や人名・地名の多い書類の紙媒体からデータ化を行う際には,外字や異体字の取り扱いを事前に検討する必要があります。
代替文字にするのか,「〓」にしておくのか,「〓(字の説明)」にするのか,画像にするのかなど,方法はいくつかありますが,その後のデータの利用方法や原本性の確保に重点を置くのかによって異なります。

文字を置き換えてしまうと,本来の意味が通じなくなるような場合もありますので,データ化の際には,その仕様検討が重要です。
データをオープンデータとして公開するような場合には,利用者の利便性も考慮する必要もあります。

株式会社コンフィックでは,多くのデータ作成経験から最適なご提案をいたします。
データ作成でお困りのことがございましたら,お気軽に株式会社コンフィックまでご連絡ください。


【関連記事】株式会社コンフィックの「外字」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





外字の画像化や置き換え

2017年08月19日 09時46分22秒 | クラウドクラス

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築を行っております。

古い書籍などをデータ化する際,いつも課題となるのは,入力ができない外字や異字体です。
できるだけ原本(底本)に忠実にデータ化しておきたいといったご要望が多くある中,外字や異字体についての処理については,データ化前に仕様を明確化しておく必要があります。
Webを通じて広く多くの人に参照してもらいたいといった場合には,利用者の環境により表示できない文字も存在します。

データの用途により,画像化した文字を用いることや,文字の置き換えなどが必要です。
検索にヒットする,しないなども考慮しなくてはいけません。
文字を置き換えた場合には,その文字が置き換わっているという情報も付与しておくことも重要です。

株式会社コンフィックでは,多くのデータを取り扱った経験があり,お客様のご要件に沿ったデータ作成についてご提案いたします。
データ構築やデータベース構築でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「外字」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





データ作成の際のルール定義

2017年05月14日 23時29分41秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築の作業を行っております。

データを作成する際には,そのデータ用途を主に考えることが多くなりますが,データそのものをどのように仕様定義するのかがとても重要です。

文字コードや文字種の範囲はもちろん,外字が出た際の対応方法や,組版時の考慮も必要です。

ルールがないデータ作成をしてしまうと,全半角の不統一だけではなく,文字種も不統一になる可能性があります。
記号類などは,同じように見えて異なる文字コードが多く存在しますので,それらも含めてルール化をすることが必要です。

株式会社コンフィックでは,データの統一化・画一化・標準化に向けて,お客様のデータを拝見し,最適なご提案・データ設計をいたします。
データベース構築,データの活用をお考えの方は,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「文字コード」をテーマにしたブログ一覧





システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





外字の取り扱い

2017年05月13日 23時08分42秒 | データ変換
タイトル:


システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成,データベース構築の作業を行っております。

古い書籍や人名・地名を取り扱う際には,外字や異字の取り扱いを事前に決めておく必要があります。
新字体に置き換える,画像にする,〓などの文字を入れておく等がありますが,そのデータをどのように利用するのかにより,詳細に検討をしておかなくてはなりません。
Webでの用途が主となる場合には,新字体に置き換え,どのような環境でデータを参照しても表示可能とすることが重要です。
紙媒体や音声出力など様々な用途に応じてデータを利用できるよう,汎用的なデータを作成しておくことも方法の一つです。

株式会社コンフィックでは,紙媒体やマイクロフィルムからの電子データ化,XML化の経験があります。
大量データ化,データ処理,データ設計など,最適なデータ構築をいたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「データ」をテーマにしたブログ一覧





システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





文字種の置き換えと再現

2016年11月22日 09時42分52秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成,データベースの構築を行っております。

古い書籍の電子化の場合,現在では入力が困難な文字や,ブラウザ等で表示ができない文字(外字)がある場合があります。
そのような文字については,代替え文字で入力を行いますが,その文字が置き換えられた文字であることのマークを付しておくことが必要です。
入力のできない文字を画像で準備することや,専用のソフトウェアのコードを入力しておくなどの対応も方法の一つです。

原本に忠実な電子データを作成するためには,その利用用途に応じたデータ作成が必要です。
将来的にそのデータをどのように活用するのかを事前に検討し,データ仕様を決定する必要があります。

株式会社コンフィックでは,多くの文書種類,紙媒体やマイクロフィルムなどからの電子データ化,データベース化の経験があります。
電子データ作成やデータベース構築を検討中の方は,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「電子化」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





電子書籍データの作成

2016年02月22日 08時10分43秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成の作業を行っております。

スマートフォンやタブレットで書籍を読む機会が増えてきていると思います。
株式会社コンフィックでは,従来の紙媒体の書籍を数多く電子化(テキスト化・XML化)した実績を有します。
大手出版社の書籍電子化や,著作権がきれた書籍の電子化と公開などの業務経験があり,電子化の際のOCRに対するノウハウや,文字処理(外字やルビなど)のプログラム開発や,データ整備を行っています。

古い書籍の電子化については,処理方法に対する事前お打ち合わせを綿密に行い,その電子データの正確性についてや,汎用的なデータ加工についてもご提案いたします。

データ形式は,テキストやXML,ePubなどご要件に応じたデータ変換,作成をいたします。
大量の紙媒体やマイクロフィルムなどの形式からWebに活用できるデータ形式への変更も多くご相談いただいております。

データ変換,データベース構築の作業をご検討の方は,お気軽に株式会社コンフィックまでご連絡ください。


【関連記事】株式会社コンフィックの「電子書籍」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





ブラウザで表示できない文字

2015年06月23日 10時49分22秒 | クラウドクラス

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,紙媒体からの電子データ作成,マークアップ言語へのデータ変換,データベース構築の作業を行っています。
古い書籍などの電子化にあたっては,外字と呼ばれる文字が存在します。地名や人名によくある外字ですが,ブラウザで表示する際に,文字化けしてしまったり,違う文字に置き換わってしまったりすることがあります。
ブラウザで表示するためには,Shift-JISやUTFといった文字コードに準拠した文字を用いる必要があるのですが,外字にはその文字コードが無いものもあります。
そのようなときには,画像で表示することや,代わりの文字に置き換える,字体の説明をするといったことを行います。
SMAPの「草なぎ剛」さんの「なぎ」の字などは,環境により表示できない場合が多いため,
新聞やWebニュースでは,「草なぎ」(注:なぎは「弓へんに前+刀」)などと表現しているようです。

どのような用途で電子データを用いるのかにより,外字の取扱い方法について最適なご提案をいたします。
多くの電子データ化の経験のある,株式会社コンフィックまでお気軽にご相談ください。


【関連記事】株式会社コンフィックの「外字」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,
多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





旧字体の処理

2015年02月09日 09時54分21秒 | データ変換



当社ブログにアクセスいただき,
誠にありがとうございます。

古い文献や書籍を電子化する際には,文字コードの無い外字(旧字体)をどのように処理するのかを事前にルールを決めておく必要があります。
電子化したデータをどのように用いるのかにより,代換文字を使う,画像として処理をする,独自のコードを用いるなどの方法があります。
有名な外字フォントソフトウェアとしては,紀伊国屋書店の今昔文字鏡があります。
株式会社コンフィックでも外字の対応でよく利用するソフトウェアで,システムに組み込むことも可能です。
紙媒体の電子化やXML化,データベース化について大量文書処理の経験豊富な株式会社コンフィックにお気軽にご連絡ください。

【関連記事】株式会社コンフィックの「電子化」をテーマにしたブログ一覧



システム開発・運用に関してのご相談,ご用命は,
多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。