◆シソーラス
類語辞典の一種といえるが、一般的な類語辞典は五十音順に項目立てがされているのに対し、シソーラスは語彙の持つ意味から、大分類-中分類と下っていき、目的の単語に達することができるようになっている。
Wikipedia
◆コーパス
コンピュータによる検索が可能になっている大量の言語データのこと。日本語や英語のような特定の言語、あるいは複数の言語での、テキストデータ・音声データの集まり。
Wikipedia
◆オントロジー
それぞれの文書の内容を説明する意味情報(メタデータ)を各文書に付加し、メタデータを記述する用語を定義する構造を構築する。この構造がオントロジーとなる。
オントロジーを導入することにより、検索対象となる文書が単なる単語の集まりとしてではなく、文書全体で大きな意味を持ったデータとして扱われ、各文書について統一的な付加情報をもたせることができる。これにより、本当に必要な情報を的確に検索することが可能となる。
このように、メタデータとオントロジーの技術を用い、文書の意味に即した処理を計算機が行うことが出来るウェブをセマンティックウェブと呼び、次世代の検索技術が実現されることなどで期待されている。
Wikipedia