Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

ICWSM2009とOR09不参加記

2009年05月13日 | 会議参加記
来週 ICWSM2009(3rd Int'l AAAI Conference on Weblogs and Social Media)とOR09(Open Repositories Conference 2009)に参加予定でしたが、昨今の新型インフルエンザの影響でキャンセルしました。
両方とも発表があったので普通に行くつもりだったのですが、NIIでは感染国にいったら5日間自宅待機だそうで、もうこれ以上プレッシャに耐えていくのもなんなんで、やめることにしました。生命的リスクというよりは社会的リスクが怖い状況になっちゃいましたからね。
どちらも内容的にぜひ行きたかった会議なので残念。もっとも会議日程が同一だったので両会議出席という弾丸スケジュールだったんですけどね。:-)

総合学術辞典フォーラム

2009年05月10日 | 会議参加記
総合学術辞典フォーラムなるものに参加してきました。

このフォーラムの主題は学術オントロジーの構築です。いわばそのPRのためのフォーラムといったものです。今回はオントロジー構築そのものの話はあまりなく、その周辺に関する諸問題に関する話でした。

プログラム
13:00~13:40「学は何処より来たりて何処へ向かうのか?」原島 博(元東大)
13:40~14:10「オントロジーに基づく学術辞典の設計」橋田 浩一(産総研)
14:10~14:40「百科事典・専門辞典を基点とする情報アクセス」高野 明彦(NII)
14:40~15:10「Web時代の学術情報流通の方向性を考える」武田 英明(NII)
15:10~15:40「大学の知を教育現場が使える形で発信する試み」三宅 なほみ(東大)
15:50~17:00 総合討論

というプログラムです。

面白かったのは原島先生の話でした。
原島先生は東大時代に接点はほとんどありませんでしたが、お話を伺うととても印象的でした。僕は「顔学」でしか知らなかったのですが、情報理論の大家だったんですね(うーん、いまさらながら恥ずかし)。
科学の方向性に関する話なんですが、実体験をもとに話をされて説得力がありました。
ポイントは科学のモード1、モード2というものです。
モード1は科学者自らの好奇心に基づいておこなう自己充足的な研究で、モード2は国、産業界などからの要請を受けておこなうプロジェクト型の研究です。で、モード3はあるのかと。
モード3とは開放型、ロングテール型なのか?
モード3とは発信型、ビジョン型なのか?

この間、私が参加したニコニコ動画分析研究会なんかはプロの研究者というよりは自然にやりたい人が集まった研究会でした。これはモード3なのかそれともモード1への先祖返りなのか。でも重要なところです(終了後、この件は原島先生とも話をしました)。



私の話はかなり混乱気味でした。(三宅先生には「これでもかこれでもかと出てきましたね」と笑われてしまいました :-) :-) )
私の発表資料です。
半分はまあ私の持論である情報流通モデルの話+学術情報流通の課題で、後半はNIIのサービス紹介とオントロジーの関連を語るというものでした。
立場もセマンティックWeb研究者と情報サービス提供者という二つの立場が混在していました。私としてはこれを統一したい、まあそれが今年の目標でもあります。
実際、オントロジーサービスをぜひ開発運用したいと思っています。

フォーラム自身もまだまだ未成熟で焦点がしぼりきれていない感があります。
これから認知科学会、情報処理学会全国大会でも続きをやるようですので、乞うご期待といったところでしょうか。

Webにおけるアイデンティティとセマンティックスの表現と利用 (草稿) (その5)

2009年05月02日 | 解説記事
7.まとめ
本稿ではWeb上のアイデンティティをどう表現して、どう利用するかという問題について、システムレベルの取り扱いから具体的な事例まで幅広く紹介した。
Webにはグローバルかつ分散的にidentifierのユニーク性を保証するURIという強力な仕組みがある。一方で分散的であるがゆえに容易にアイデンティティの重複や不整合が起こりうる環境でもある。現状はその間で個別の解決法を探している状態である。
Linked Dataの試みは将来エンティティのアイデンティティが多数作られリンクされる世界がくることが予感させる。ただ、そのためは技術的チャレンジがまだあり、その解決がこれからの課題である。

◇参考文献◇

[Hayes06] P. Hayes, H. Halpin, and H. S. Thompson (eds), WWW2006 Workshop on Identity, Reference, and the Web (IRW2006), Edinburgh, Scotland, May 23rd, 2006. http://www.ibiblio.org/hhalpin/irw2006/
[Bouquet07] P. Bouquet, H. Stoermer, G. Tummarello, and H. Halpin (eds), WWW2007 Workshop i3: Identity, Identifiers, Identification, Banff, Canada, May 8, 2007. (CEUR Workshop Proceedings No-249) http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-249/
[Bouquet08] P. Bouquet, H. Halpin, H. Stoermer, and G. Tummarello (eds), Proceedings of the 1st IRSW2008 International Workshop on Identity and Reference on the Semantic Web (IRSW2008), Tenerife, Spain, June 2, 2008 (CEUR Workshop Proceedings No-422)
http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-422/
[Halpin06] H. Halpin, Identity, Reference, and Meaning on the Web, IRW2006, 2006.
[Booth06] D. Booth, URIs and the Myth of Identity, IRW2006, 2006.
[Booth08] D.Booth, Why URI Declarations? A Comparison of Architectural Approaches, IRSW2008, 2008.
[Halpin08] H. Halpin, The Principle of Self-Description: Identity Through Linking, IRSW2008, 2008.
[URI01] URI Planning Interest Group, W3C/IETF, URIs, URLs, and URNs: Clarifications and Recommendations 1.0, Report from the joint W3C/IETF URI Planning Interest Group, W3C Note 21 September 2001, http://www.w3.org/TR/uri-clarification/
[Ayers08] D. Ayers, M. Völkel, Cool URIs for the Semantic Web, W3C Working Draft 17 December 2007, http://www.w3.org/TR/cooluris/
[Manola04] F. Manola, and E. Miller, RDF Primer, http://www.w3.org/TR/rdf-primer/, 10 February 2004
[Brickly04] D. Brickley, and R.V. Guha, RDF Vocabulary Description Language 1.0: RDF Schema, http://www.w3.org/TR/rdf-schema/, 10 February 2004
[Smith04] M. K., Smith, C. Welty, and D. L. McGuinness, "OWL Web Ontology Language Guide". W3C. Retrieved on 2008-07-15. http://www.w3.org/TR/owl-guide/
[市瀬07] 市瀬龍太郎, 情報の意味的な統合とオントロジー写像, 人工知能学会誌, Vol. 22, No. 6, pp 818-825, 2007
[McIlraith01] S. McIlraith, T.C. Son, and H. Zeng, Semantic Web services ,. IEEE Intelligent Systems. Special Issue on the Semantic Web. 16(2):46-53, March/April, 2001.
[Bernes-Lee06] Linked Data – Design Issues, Tim Berners-Lee, http://www.w3.org/DesignIssues/LinkedData.html
[Shakya08] Aman Shakya, Report on LinkedData Planat Conference, 第18回セマンティックWebとオントロジー研究会, A801-07, 2008
[Carroll04] J.J. Carroll, C. Bizer, P. Hayes, and P. Stickler, Named Graphs, Provenance and Trust, Technical Report HTP-2004-57, Hewlett Packard Labs, 2004.
[蔵川08] 蔵川圭,武田英明,高久雅生,相澤彰子, 研究者リゾルバーαのコンセプト, 第36回ディジタル図書館ワークショップ, 2008
[Kurakawa 09] K. Kurakawa, H. Takeda, M. Takaku, and A. Aizawa, Researcher Name Resolver: A framework for researcher identification in Japan, The 4th annual international Open Repositories Conference (OR09), 2009 (to appear).

(おしまい)

Webにおけるアイデンティティとセマンティックスの表現と利用 (草稿) (その4)

2009年05月02日 | 解説記事
アイデンティティ統合の一例:研究者リゾルバー
RDFSやOWLで記述されたサイトであれば前章で述べたようにLinked Dataの方法で比較的容易に複数のアイデンティティを横断的に使ったサービスを実装できる。しかし、現実のWebではRDFSやOWLで作られたLinked Dataで満たされているわけではなく、通常のWebサイトが多い。とはいってもアイデンティティを提供しているサイトは数多くあり、それを横断するようなサービスが求められている。閉じた世界のみでアイデンティティを持った情報を表現・利用させるこれまでのサービスと異なり、Web上のサービスでは他のサービスと同時に利用するのは自然であり、一つのアイデンティティに複数のアイデンティティがあれば統合したいというのも自然の要求である。
以下ではこのような複数アイデンティティを統合するサービスの実装例として筆者の所属する国立情報学研究所で試行サービスを行っている「研究者リゾルバー」を紹介する。
「研究者リゾルバー」試行版 [蔵川08][Kurakawa 09]では、異なるサービスで公開されている同一の研究者の情報のページをリンクづけるサービスである。サービスとしてはIDで統合できたリンク(各大学の研究者総覧やJST ReaD)および名前や所属の検索によるリンク(Google Scholarなど)の両方を提示し、ワンクリックでそれらの該当ページにいけるようになっている。
このサービスは単にユーザがみて各研究者の情報が集約して閲覧するサービスだけではなく、外部システムがこのサービスを通じて異なるサイトにおけるアイデンティティを横断的に利用できるサービスとして利用されることを意図している。
このケースにおけるアイデンティティ問題とはどんな特徴があるだろうか。このケースでは先の2つのエンティティの曖昧性(「明けの明星」「宵の明星」問題、前章における「GeoNamesとWikipediaのTokyo」問題)は存在しない。それは対象が人物であるからではなくて、研究者という役割がアイデンティティを規定しているからである。一般に大学等の研究者においては、研究という場では自己の活動が自分に帰することが本人からみても周囲からみても当然とされている。この点においてアイデンティティに曖昧性がない。同じ人物を対象としても、著作者一般にするとペンネームの問題、グループ著作の問題など、曖昧性が発生する。したがってケースでは比較的単純なアイデンティティ統合問題として解くことができる。
このサービスにおけるアイデンティティ統合のデザインは次のようになっている。
(1) 基本ID集合の設定
このサービスでは国立情報学研究所が公開している科学研究費補助金採択課題・成果概要データベース に登録されている報告書における研究代表者および研究分担者を研究者の基本データベースとして利用している。このデータベースの研究者情報には文部科学省が付与する科学研究費補助金申請時に必要となる研究者番号が含まれている。この番号は原則として一人の研究者に一つの番号が割り振られる 。この番号を手がかりに研究者を同定する。このため同姓同名である人物も別のエンティティとして認識される。約15万人の研究者が同定されている。
(2) 他のID集合との関連づけ
大学や各種研究組織では研究者総覧としてその所属研究者の情報をデータベース化して公開していることが多い。個別の研究者総覧においては研究者のアイデンティティは保証されているが、これと(1)のID集合とのマッチングをどうとるかが問題となる。
研究者リゾルバーのID集合と他のID集合とのマッチングのために,氏名表記だけでは同定のための必要十分条件ではない.ここでは,以下のように2つのルールに基づいて同定を試みている.
1. 漢字氏名の一致 ∧ 所属の一致 ∧ 所属内でユニーク名であること
2. 科研費研究者番号の一致
科学研究費補助金のデータベースから,科研費研究者番号に紐づけられた最終報告書時の所属機関名が取得できる.所属機関の中でユニークな氏名であれば同一人物として判定する .研究者総覧には,科学研究費補助金研究者番号をデータとして持っているものがある.番号が一致した場合,氏名表記は所属に関する情報とは関係なく,完全に同一人物であると判定する.現在は47大学の研究者総覧を対象として同定を試み,22,311人,全体の約15パーセントの研究者ページにリンクが張られている。
現在は基本的に研究者リゾルバーから研究者総覧へのリンクであるが、一部の大学ではすでに研究者総覧から研究者リゾルバーへのリンクも張られるようになっている。
今回の実装では、ID同定はある時点でのデータに対して一括処理として行った。しかし、リンク元のデータベース(研究者リゾルバー)もリンク先のデータベース(各大学の研究者総覧)も時間とともに変化する。今後はシステム同士でID登録情報を交換することで、変化に対応できる仕組みを用意する予定である。

(続く)


Webにおけるアイデンティティとセマンティックスの表現と利用 (草稿) (その3)

2009年05月02日 | 解説記事
5.RDFが作るLinked Dataの世界
前章でみてきたようにURIを中心にエンティティのアイデンティティをWebの世界で表現できる。とくに説明情報をコンピュータ可読の情報とすることでコンピュータが処理可能な世界を作ることができる。その記述方法としてRDF(Resource Description Framework) [Manola04] [Brickly04]およびOWL(Web Ontology Language) [Smith04]を用いることが増えている。
RDF(およびOWL)でエンティティの記述を表現するとは、オントロジー上の概念(これもまたエンティティである)や他の個体(individual)を示すエンティティとの関係でそのエンティティの記述を行うことである。特に他の個体のエンティティとの関係を記述することは、HTMLページで他のHTMLページに対するリンクを作ることに相当する。通常のHTMLページがつくるWebがWeb of Documentsであるならば、RDF記述がつくるWebはWeb of Dataであるといえる。
このようなRDFがつくる情報のネットワークをLinked Dataと呼び、近年Webで急速に普及している。
なお、Linked Dataは基本的に個体に関する情報を取り扱う。個体でなくオントロジー上の概念間に関連づけはオントロジーマッピングという形で研究されている。この問題には今回は触れないので、興味のある方は[市瀬07]を参照されたい。
また動的なデータに関してはセマンティックWebサービス[McIlraith01]の枠組みを使うことも考えられるが、まだきちんと考察されている例は少ない。ここでは静的なデータのみを考える。
5.1 Linked Dataの現状
Webの創始者であり、現在World Wide Web Consortium (W3C)のdirectorであるTim Berners-LeeはLinked Dataを次のように定義している[Berners-Lee06]。
(1) 事柄の名前にURIを使うこと
すべてのモノ,コトにURIを!
(2) 名前の参照がHTTP URIでできること
URNとか独自のプロトコルは使わないように
(3) URIを参照したときに関連情報が手に入るように
理解可能なデータを提供するように
(4) 外部へのリンクも含めよう
Webのようにリンクでつながるデータを作ろう

現在,Linked Dataがどんな状況であるかを図2に示す.この中でDBpedia (http://dbpedia.org/)というのはWikipediaの情報のうち,infoboxの情報を中心に機械的に抜き出し,RDFのデータとして書きだしたものである.現在,約1.1億RDF文が公開されている.またこの中の地名に関してはGeoNamesというデータの相互にリンクがある.GeoNames自体は約7千万文ある.この関係は図中で相互リンクとして書かれている.
この例でもわかるようにLinked Dataは名前の通り相互にリンクしあうからこそ価値がある.そのためにデータはオープンであることが望ましい(必須ではないが).そこでオープンなLinked Dataを普及しようというプロジェクトLinking Open Data Project (http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData)がW3Cのメンバーらで行われている.
このようにRDFデータが相互にリンクしあうことで巨大なデータ空間を作っている.そうするとこのデータを使うアプリケーションが可能になる.
例えば,SemaPlorer (http://btc.isweb.uni-koblenz.de/)はGoogle mapを中心にDBpedia, Geonames, flickrデータをマッシュアップして作られている.そこでは単にデータを結合して検索する以上のサービスを提供している.
またすでに”Linked Planet Data Conference”と呼ばれるビジネスカンファレンスシリーズ が開かれるようになっている [Shakya08].

5.2 アイデンティティ利用としてのLinked Dataの問題点
Linked DataはWebである以上、分散的である。このことはアイデンティティの表現と利用において二つの問題を提起している。これはWeb特有というより分散システムがアイデンティティを取り扱うときに生じる一般的な問題であると思われる。
(1) エンティティの同一化
分散的に管理されている以上、同一エンティティを二つの異なるサイトがアイデンティティを与えることがあり得ることである。このとき、Linked Dataではowl:sameAsという述語で二つのURIが同一であるということ指示する。こうすることでコンピュータが異なるサイトにあるRDFSやOWLで書かれた情報を統合して解釈して推論することができる。
しかしこれは様々な問題を引き起こす。「明けの明星」と「宵の明星」の同一性に例示される古典的なフレーゲのパズルに相当する。一度、同一化してしまうとこの先、区別がつかなくなる。例えば、GeoNamesにおけるTokyoとDBpedia (Wikipedia)におけるTokyoを同一化したとする。しかしGeoNamesにおけるTokyoは純粋に地理的な存在としてのTokyoであり、WikipediaのTokyoはより幅広い意味でのTokyoの記述である 。
異なるサイトのエンティティが厳密な意味で同一であることはまれであろう。しかし、実用的な意味では同一化したいケースが多い(でないとLinked Dataは存在し得ない)。単にowl:sameAsで結びつけるだけは解決できない。
(2) どの記述を採用すべきか
誰かがあるエンティティをURIとして公開したら、そのURIを他の人が使うことは許されている。むしろ積極的に使おうというのがLinked Dataの精神である。すなわち、様々な人がRDF等を用いてエンティティに関する記述をする。例えば、ソーシャルブックマーキングでは一つのエンティティの多数の人々が記述を追加している。
このときに間違った記述、矛盾する記述が含まれていたときにどうしたらよいであろうか。
まず考えられるのはそのエンティティ登録の持ち主の記述を信じるべきであろう。URIを参照(dereference)したときに得られる記述があれば、たぶん持ち主の記述であろう。持ち主の記述がない場合、信頼すべきサイトを優先すべきであろう。
しかし、現在のRDFSやOWLには記述の持ち主という概念がない。これはNamed Graph [Carroll04]など別の仕組みが必要である。またサイトの信頼性をはかるというのは現在でも難しい問題である。
通常のWebであれば人間が読んで判断することでこの問題を回避しているが、Linked Dataではコンピュータが処理するので、この問題は回避することができない。

(続く)

Webにおけるアイデンティティとセマンティックスの表現と利用 (草稿) (その2)

2009年05月02日 | 解説記事
3.Webにおける意味、参照、アイデンティティ
それではWebにおける、定義、参照、参照されるエンティティとはなんであろうか。
WebにおいてあるURIが何を指しているか?一見自明な質問である。そこにアクセスして得られるWebページが指している内容であるという訳である。
初期のWebでは正しい答えであるが、現在では必ずしもそうとはいえない。例えば、
http://mixi.jp/show_friend.pl?id=12345
というURIが仮にあったときにこれはそこに指しているWebページを指している訳ではない。むしろ、その先にあるサービス(この場合はあるIDのmixiのコンテンツをみるというサービス)を指している。この場合は、このURIはまさにIdentifierとして機能を果たしているのであって、そのときにアクセスできたコンテンツを指している訳ではない。
URLがURIとして拡張された意図はまさにこのIdentifierとしての機能を果たすということであった。しかし、URIが意味することが2重になり混乱を生じている。
そこで次のような区別が必要となる。URIが指すものはリソースと総称されるが、そこでこのリソースを2種類に分けて考える。情報リソース(information resource)と非情報リソース(non-information resource)に分ける。前者はそこにあるWebページそのものがコンテンツであるようなものである。後者はWeb上にはそのコンテンツ自体は表現されないリソースである。
情報リソースの場合は、URIはそのリソースのidentifierでありかつそのURIでアクセスできる情報がそのコンテンツである。このリソースの意味はこのアクセスされたコンテンツということになる。前章の言葉使いでいえば、このエンティティは内包的に定義されるといえる。
非情報リソースの場合は、URIはそのリソースのidentifierでしかない。ではそのURIの意味はどうやって知るのだろうか?
一つの方法はそのURIがアイデンティティの確立された外部世界のエンティティを参照することである。ISBN(International Standard Book Number)やデジタルオブジェクト識別子DOI(Digital Object Identifier)がそれに当たる。ISBNは出版物につけられるコードであるが、出版する主体がアイデンティティを決定している 。しかし、その世界でアイデンティティが担保されていれば問題ない。
URN(Uniform Resource Name)がそういったエンティティを表現する仕組みとして用意されている[URI01]。例えばISSN(International Standard Serial Number、国際標準逐次刊行物番号)はIANA(Internet Assigned Numbers Authority)に登録されたISSN-URN Namespaceで規定されるURNである。URNで指し示されるものはWebにおいてもアイデンティティを持つといえる。
外部世界においてはアイデンティティがあるものであれば、URNとして登録しなくてもWebにおけるアイデンティティを持たすことができる。PURLプロジェクト ではそれぞれの持つidentifierをURIに変換するサービスを行っており、簡単にURIとしてのアイデンティティを得ることができる。DOIも同様な方法でURI化されている 。ただし、これらの方法の問題は、Webにおいてエンティティの意味を(一部でも)直接知ることができないということである。
外部世界を参照しているが、そのような一意なidentifierをもっていないエンティティはどうすればよいだろうか。なんらかの内包的定義にあたるものが必要となる。ただし、先の情報リソースと異なり、原理的にも完全に定義することができずあくまで部分的な記述となる 。この点で情報リソースとは本質的に異なる。それゆえ、情報リソースであるか非情報リソースであることが判別できることも必要である。
このような非情報リソースにはリソースそのものではないが、その説明にあたる情報(descriptive information)が付加されていることが望まれる。実はこのことは外部世界にアイデンティティを持つ非情報リソースにも当てはまる。たとえ外部世界でアイデンティティが保証されているといえども、Webからそれがなんであるかが知ることができなければ、結局同じだからである。

4.現在のWebにおける実現
上記の問題は現在のhttpプロトコルやや(x)htmlでは直接的な解決方法は用意されていない。まず情報リソースと非情報リソースの明示的な違いが表現されない。またURIに関する記述情報を付加するプロトコルがないということである。
そこで現在のWebではURIを用いたアイデンティティは次のように実現することが推奨されている[Ayers08]。
① 情報リソースを指すURIにアクセスするときにhttpプロトコルのcontent negotiationを用いて次のように振る舞う。http clientが(x)htmlを必要するときは(x)htmlで記述された情報がURLを、RDFを必要するときはRDFで書かれた情報があるURLを指し示す。
② 非情報リソースを指すURIを参照(dereference)したときはhttpdサーバは200 responseではなく、説明情報のあるURI とともに303 response を返す。303 responseは 3xx response (redirection)の一つで、see otherの意味である 。
まず①により、URIのidentifierとしての機能と指し示すコンテンツを分離している。またコンテンツとして人間向きとコンピュータ向き(RDF)に分けている。非情報リソースを指すURIの場合はそのURIそのものがidentifierの機能だけであるが、説明情報がredirectionとして関係づけられる。説明情報は情報リソースなので①の方式でコンテンツを得る。

(続く)

Webにおけるアイデンティティとセマンティックスの表現と利用 (草稿) (その1)

2009年05月02日 | 解説記事
人工知能学会誌用の解説記事の草稿です。

今回は「WebアイデンティティとAI」という特集の1つです。この特集、とっても意欲的でぜひ一読の価値があります。

***********
1. はじめに
 本稿ではWebの世界においてモノやコトのアイデンティティはどのように表現されるかについて考察する。ここではモノやコトを一括してエンティティと呼ぶことにする。ご承知のようにWebの世界にはURI (Uniform Resource Identifier) というアイデンティティの手段がある。URIは世界中で一意に同定できかつアクセスもできるという強力なアイデンティティの手段である。URIはこれまでにない強力さと便利さをもっていたため、Webの初期にはURIさえあればアイデンティティの問題は解決できるという楽観的見方もあった。しかし、このアイデンティティURI神話というべきものはすぐさま現実の様々な問題に直面した。Webの世界におけるアイデンティティについてどう表現し利用するという問題はそれほど単純ではないことが認識された。しかし、その解決はWebの世界にとって重要なことであり、現在盛んに議論されている。本稿ではこの問題に関する最近の議論を紹介するとともにその中の一つの問題であるアイデンティティ統合について筆者らが取り組んでいる事例を紹介する。
なお本稿の議論は、3つのワークショップ[Hayes06][Bouquet07] [Bouquet08]の議論によるところが大きい。とくにDavid Booth[Booth06][Booth08]とHarry Halpin [Halpin06][Halpin08]の論考は興味深い。興味のある方はこれらのワークショップの論文を直接参照されたい。
まず第2章ではコンピュータがアイデンティティをどのように扱うのかについての枠組みについて述べる。その上で、第3章と第4章では具体的にWebの中でのアイデンティティの表現の仕方について考察する。第5章と第6章ではWebの中でのアイデンティティの利用について述べる。第5章ではLinked Dataというアプローチによるアイデンティティを介したWebの新しい利用法について、第6章では研究者情報サービスにおけるアイデンティティ統合について述べる。
本稿においては人、モノ、コトを区別せずにエンティティとして考察するが、第5章ではその例として人のエンティティを扱う。

2.意味、参照、アイデンティティ
エンティティのアイデンティティを語るにはそもそもエンティティが何を意味しているかがわからないといけない。一般にモノやコトを定義するには内包的な方法と外延的な方法がある。内包的な方法では何らかの公理と他のエンティティを使って個々のエンティティが「定義」される。その定義を満たしていることがそのエンティティのアイデンティティである。もし、内包的な定義が完全にできるならばアイデンティティにおける曖昧性は存在しない。
外延的定義においては実世界(参照される外部の世界)におけるエンティティをもってその定義とする。参照されるべき外部世界が明確であり、またその世界におけるエンティティが明確であり、そして参照が明確であれば、ここにも曖昧性はない。もっともそれは外部世界のアイデンティティ問題に置き換わっただけである。
中間的な定義もあるであろう。一部のエンティティは外部世界の参照によって定義され、一部のエンティティはそれらのエンティティとの関係で示されるといった具合である。実際の問題においては内包的定義のみ、外延的定義のみで完結することは難しく、混在して使われていることが多い。
アイデンティティの問題は、内包的定義(普通にいうところの定義)、参照、参照される外部世界のエンティティという要素に分けて考える必要がある。

(続く)