東京都立川市のシステム開発会社 株式会社コンフィック ブログ

お客様の業務効率化や教育環境を整備するシステムを開発・運用しています。

テキスト抽出と整形

2021年03月26日 23時44分59秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ作成・データベース構築のサービスを行っております。

ワープロソフトのデータやPDFファイルなど様々な形式の電子データをDB化する際に,XMLなどのマークアップを行うことをお勧めしています。
マークアップされたデータは,その後再度ワープロソフトやPDFとしてデータ変換可能なだけではなく,文章の再利用なども容易になります。
マークアップ前には,それぞれのデータを整形する必要があり,いくつか方法はありますが,テキスト抽出後に整形し,その後定義されたタグでマークアップします。

テキストの整形は,不要な改行や余分なスペースの除去など,その後活用しやすい形式のデータに加工します。
コンフィックのサイトにもテキスト整形ツールを無償公開しておりますので,お試しください。

テキスト整形ツール

電子データを業務に活用し,効率化につながるご提案をいたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「整形」をテーマにしたブログ一覧






システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





テキスト整形ツール公開版

2020年07月30日 14時08分13秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ処理やデータベース構築のサービスを行っております。

データを整形する際,全半角の統一や,不要なスペースの除去などの処理を行いますが,簡単にテキストを整形(置換)できるツールをコンフィックのWebサイトから利用することが可能です。

テキスト変換Tool

PDFやWordなどから文章をコピーし,容易に整形することが可能ですので,お試しください。
このような仕組みを文章執筆環境に構築することも可能です。

株式会社コンフィックでは,文書作成を支援するさまざまなツールを用意しております。
文書作成でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「ツール」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





データチェックツール

2019年12月03日 07時17分54秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ整形,データベース構築のサービスを行っております。

データを作成した際には,そのデータが仕様通りであるか,データ内部に不要な情報が入っていないか,文字コードは正しいものが用いられているかなどのチェックをする必要があります。
そのチェックを人が目視で確認した場合には,確認もれがどうしても出てしまいます。
データをチェックするための専用ツールをデータ形式や仕様に合わせて作成し,データ作成時の作業フローに組み込むことで,正確なデータを作成することができます。

データといっても,様々な形式があるため,専用のツールが必要ですが,そのツールの機能をシステムにも適用することが可能です。
初期登録時には,PCで動作するチェックツールとして利用し,データベース構築後は,登録時のチェック機能として実装しておきます。
データベースへのデータ登録時にさらに追加のチェック項目を設けることも可能です。

株式会社コンフィックでは,多くのデータ処理経験からお客様のデータに合わせたツールやシステムを開発いたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「チェック」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





多言語OCRと文字コード

2019年09月19日 23時34分00秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ変換,データベース構築のサービスを行っております。

紙媒体からの電子データ変換は,OCRを用いて画像認識後に校正する方法が一般的です。
日本語だけではなく,多言語のOCR処理もOCRソフトウェアの精度が上がり,多種のデータを作成できるようになりました。
テキスト化では,その認識後の整形ルールや代替文字のルールを事前に決めておく必要がありますが,それは日本語だけではなく,多言語の場合も同様です。
多言語のテキストデータを作成する際には,その文字コードにも注意が必要です。
文字コードにより,文字の表示が変わってしまう場合も多くあります。
テキスト化したそのデータをどのようにその後利用するのかにより,最適な文字コードを選択することが重要です。

株式会社コンフィックでは,将来的な用途や拡張性を考慮し,テキスト化だけではなく,そのテキストのデータベース化やマークアップのサービスも行っております。
紙媒体をデータ化し,情報公開や業務に活用可能してみませんか。
お客様のご要望に応じたデータ活用方法のご提案をいたします。
お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「OCR」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





全角と半角

2019年07月28日 23時32分20秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ処理,ツール開発を行っております。

文書作成時のルールで,算用数字は1桁の数字は全角1文字,2桁以上の数字は,半角2文字といったルールで文書を作成されている場合があります。
DTPの場合には良いのですが,検索やデータ処理を行う場合には,全角・半角の統一を行った方が良い場合もあります。

株式会社コンフィックのサイトでは,無償のテキスト変換ツールを公開しています。
全角・半角の置き換えや,データアライメントの機能も実装しています。
無償で利用可能ですので,ご自由にご利用ください。

公開しているテキスト整形ツールでさらに機能要望等ございましたら,お気軽に株式会社コンフィックまでご連絡ください。

株式会社コンフィックテキスト変換ツール



【関連記事】株式会社コンフィックの「変換ツール」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





テキスト整形

2019年07月27日 23時27分28秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ変換,データベース構築のサービスを行っております。

OCRにて認識されたテキストデータや,PDFから抽出したテキストデータは,不要な改行や空白が入っている場合が多くあります。
空白や改行があると,機械処理を行う場合に不都合が生じる場合もあるため,活用可能なデータとするためには,テキスト整形する必要があります。
テキストデータを整形することにより,その後のマークアップやデータベース格納時のデータとして活用しやすくなります。

さらにテキストデータは,その文字コードにも配慮が必要です。
文字コードにより,文字種が変わる場合もあります。
テキストデータは,人が認識(読める)データですが,機械は文字コードにて認識しています。
文字コードの選択により,その後の検索にヒットしなかったり,利用時に文字化けしてしまったりといった事が生じます。

株式会社コンフィックでは,テキスト整形時には,その後の用途や将来の利用予定を考慮し,データ仕様のご提案をいたします。
既存データの規格を統一化しておくことは,とても有効で重要な作業です。
データの活用やデータベース化でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。
変換等の作業にあたっては,数ファイルのサンプルをご提供いただければ,より良いご提案を行うことが可能です。


【関連記事】株式会社コンフィックの「整形」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





変換ツールで作業を効率化

2019年05月04日 23時04分31秒 | システム開発

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,データ処理やツール開発のサービスを行っております。

定型的なデータや文書を取り扱う場合,そのデータを一定の形式に整形したり,スタイルを適用したりといった作業を多く行っていると思います。
そのような際には,そのデータや文書に応じた変換ツールを用いることで,大幅に作業を効率化することが可能です。
作業を効率化することで,よりデータ内容や文書内容の精査に時間をかけることが可能となり,より良いデータや文書を作成することができます。

変換は,データを整形するだけではなく,マークアップや属性を付与することも可能です。

多くのデータ処理の経験から,お客様のデータや文書を利活用するご提案をいたします。
株式会社コンフィックまでお気軽にご相談ください。


【関連記事】株式会社コンフィックの「変換ツール」をテーマにしたブログ一覧





システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





コンフィックの無償のツール

2018年04月12日 23時22分05秒 | 会社案内

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,無償のWebツールを公開しています。
テキストデータを整形(置換)する,「テキスト整形ツール」や,総務省にて公開している法令XMLデータをHTML変換するツールを公開しています。
これらは,株式会社コンフィックの社内で業務を行う中で,作業時に作成したツールを広く皆様にも利用してもらいたいとの考えから公開しているものです。

今後もこのようなツールを随時公開していく予定です。
これらのツールをお客様のシステムに組み込むことも可能ですので,テキスト処理でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「ツール」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック https://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





テキスト処理とデータ変換

2017年08月11日 08時37分13秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ変換のサービスを行っております。
ワープロソフトのデータ形式からXML形式のデータや,XMLからPDF,PDFからテキストなど用途に応じたデータ変換を行います。

データ変換や整形を行う際のテキスト整形ツールは,株式会社コンフィックの無償ツールとして公開しています。
全角半角の統一や,スペース,改行の調整など簡単に処理することができます。
テキストを貼り付けて,変換条件を設定して,ボタンを押すだけで,テキスト処理が行われます。
ぜひお試しください。

テキスト変換ツール

このようなテキスト変換ツールを各システムに組み込むことも可能です。
データ作成,文書作成でお困りのことがございましたら,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「テキスト」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。





全角半角の統一

2017年05月31日 23時16分01秒 | データ変換

システム開発,XML処理のエキスパート集団 株式会社コンフィック




株式会社コンフィックのブログにアクセスいただき,誠にありがとうございます。

株式会社コンフィックでは,各種データ作成・データベース構築を行っております。

データ作成時には,その作成ルールを事前に決め,作成をいたしますが,データベース構築後のデータ更新においても,そのルールを適用し,作成・更新する必要があります。
データベース構築後にお客様が入力・更新いただいたデータは,その入力ルールに沿っているか,チェックが必要な場合があります。
例えば,数字や記号の全角・半角の不統一を防ぐためのチェックや,機種依存文字を利用していないか,さらに送り仮名の用法が間違っていないかなどもチェックすることができます。

いくらルールを決めたからといっても,複数人でデータ更新をする際には,チェックが不可欠です。
簡単なデータ整形のツールは,株式会社コンフィックのHPにテキスト変換ツールを公開していますので,自由にご利用ください。
入力した文字種の統一などを簡単に行うことが可能です。

このようなツール類を既存システムに組み込むことも可能ですので,お気軽に株式会社コンフィックまでご相談ください。


【関連記事】株式会社コンフィックの「チェック」をテーマにしたブログ一覧




システム開発・運用に関してのご相談,ご用命は,多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。




株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。