MsknGooBlog

IT技術を活用した効率化、Security対策や快適なLifeStyleのためのNewsのClipや実践メモを綴ります。

RSSデータを活用したソリューション(RSSニュース他)

2005-05-24 19:59:06 | デジタルアーカイブ
サイトにRSSデータを置くことにより、ロボットのクローリングでも無駄なアクセスをさせずに、有用な情報をインデキシングさせるソリューションです。今や有用な情報の収集は、ロボットでリンクをたどるのではなく、ホームページの開設者の意思によって設置されたRSSを利用してそのURLで直接収集することが効果的。
適用例2:RSSデータを活用したソリューション(RSSニュース他) | データマイニングへの適用 | 構造計画研究所 XMLエージェントプラットフォーム
RSSデータは、更新情報をいち早く配信することに重点が置かれており、Webサイトのトップページなど利用者がアクセスしやすいページに配置されます。これまでもニュースサイトをマイニングするソリューションは存在しましたが、サイト全体をクローリングしてデータ収集するなど、サイトにかかる処理負荷が問題とされることがありました。ここに示すソリューションのように、RSSデータを介してニュース本文にアクセスする方法であれば、サイトに無駄な負荷をかけずにデータにアクセスできます。
多くのサイトでは、一定期間を過ぎるとサイトからRSSデータは消去されます。データマイニングの多くの場合には、長期に渡るデータを対象としますが、RSSデータを扱う際には手元に保存する仕組みが必要となります。XMLエージェントプラットフォームにより、定期的にRSSデータを収集することができます。
RSSデータの関連技術は、近年普及がはじまった新しい技術ですが、個人や企業に応じて必要となるデータをWeb上から抽出する技術として注目されています。XMLエージェントプラットフォームを適用して、RSSデータを利用したソリューションの構築が実現できます。

最新の画像もっと見る