ホワイト日記

柏での日々をつれづれなるままに書き記したいと思います.

第23回人工知能学会全国大会:近未来チャレンジ「Community Webプラットフォーム」

2009-01-21 00:05:06 | 研究
2009年の人工知能学会全国大会(6月17日〜19日)にて「Community Webプラットフォーム -ブログ・SNS・ソーシャルウェアの未来形-」というセッションを開催致します.
ブログやSNS,Wiki, Yahoo!知恵袋やOKwaveといった知識共有サイトなど,Webの社会的側面を捉えた研究を募集しています.
皆様からの沢山のご応募をお待ちしております.

第23回人工知能学会全国大会・近未来チャレンジ「Community Webプラットフォームセッション」

申し込み期間(タイトルと概要のみ):
  2009年1月14日(水)〜 26日(月) 午後2時〆切
カメラレディ提出期間:
  2009年4月8日(水)〜 4月20日(月) 午後2時〆切

第23回人工知能学会全国大会「AIとサービス,価値」オーガナイズドセッション

2009-01-20 00:17:48 | 研究
2009年の人工知能学会全国大会にて「AIとサービス,価値」というオーガナイズドセッションを開催致します.
これは2008年の人工知能学会大会で開催した「人工物と価値」オーガナイズドセッションの続きになります.
今年はサービスという観点も取り入れ,AI研究がサービス設計や評価,価値の創出と定量化にどう貢献できるかを探って行ければと思っております.
こちらも多くの皆様からのご応募をお待ちしております.

第23回人工知能学会全国大会オーガナイズドセッション:「AIとサービス,価値」

申し込み期間(タイトルと概要のみ):
  2009年1月14日(水)〜 26日(月) 午後2時〆切
カメラレディ提出期間:
  2009年4月8日(水)〜 4月20日(月) 午後2時〆切

第20回人工知能学会・セマンティックウェブとオントロジー研究会:Wikipediaワークショップ

2008-11-24 19:29:02 | 研究
2009年1月22日(木),東京大学本郷キャンパスでWikipediaに関する研究を集めたワークショップを開催致します.
既に研究でWikipediaデータを利用されている方をはじめ,これからWikipediaデータを使って研究を始められる方を対象としたチュートリアルも開催致しますので,皆様ぜひご参加頂ければ有難く思います.

=====================================================================
     第20回 セマンティックウェブとオントロジー研究会
         Wikipediaワークショップ論文募集
         http://sigswo.org/A803_cfp.html

■開催日:2009年1月22日(木)
■会場: 東京大学本郷キャンパス工学部2号館231号講義室
 http://www.u-tokyo.ac.jp/campusmap/cam01_04_03_j.html

== 概要 ==
近年,Web2.0文化の浸透に伴い,協調的にコンテンツを編集するスタイルの
ソーシャルメディアが発展してきました.Wikipediaはその代表例で,大量の
ユーザが書き込みを続けた結果,幅広い知識を網羅する大量の知識ネットワーク
が構築されるに至りました.

ここ数年,各種研究分野においても新しいコーパスとしてのWikipediaに大きな
注目が集まっており,WWW・自然言語処理・情報検索といった分野を中心に,
関連研究が報告されてきました.さらに,AAAI,WWW,ISWCといったトップ
カンファレンスにおいてもWikipediaに関する論文が増え,AAAIではWikiAI,
ESWCではSemWikiといった特別ワークショップが開催されてきました.

このように世界的には多くの注目を集めているWikipediaですが,国内では
様々な研究分野の研究会において,分散的に研究発表がされてきたのが現状で,
Wikipedia研究について深くディスカッションする機会が十分であったとは
いえません.そのため,本ワークショップでは,Wikipediaに関する研究者に
対して深いディスカッションをする機会を設けるために,Wikipediaの研究を
一堂に集め,集中的に議論することを目的としています.多くの方々がご発表,
ご参加され,有益な議論と情報交換が行われることを期待しております.

== トピック ==
* Wikipediaからの情報抽出
 関連・関係抽出,意味抽出,オントロジ・シソーラス構築
* Wikipedia記事の信頼性評価
* Wikipediaの統計報告
* WikipediaとセマンティックWeb
* Wikipediaと自然言語処理
* Wikipediaと多言語解析,翻訳辞書構築
* そのほかWikipediaを利用した各種研究
情報検索,対話処理,コンテキスト解析など

---------------------------------------------------------------------
Wikipediaマイニングチュートリアル〜Wikipediaマイニングの勘どころ〜
講演者:中山浩太郎(東京大学)

== 目的 ==
Wikipediaのコーパスとしての有用性は,ここ数年でNLP,AI,Semantic Web,
IRなど各種の研究分野で広く認識されるに至りました.しかし,Wikipediaを解
析するためには,大規模データの取り扱い方法や,データベースの有効な利用方
法,ノイズデータの除去など,いくつかのポイントがあり,これらのポイントを
クリアしなければ,解析が困難である上に精度低下の要因にもなります.そこで,
本チュートリアルでは,これからWikipediaマイニングを始めようという方,は
じめたばかりの方たちの間で情報を共有することを目的とし,ケーススタディと
して,講演者の経験からいくつかポイントと思うポイントを提示します.最後に
ディスカッションの時間を設けて,より良い方法論を模索したいと思います.

== アジェンダ ==
* Wikipedia研究の要点
* mwdumper
* データベースの扱い
 インデックス
 ストアドプロシージャの勧め
* Wikipedia解析の定石
 ノイズデータの除去
 リダイレクトページのリンクを伝搬
 アンカーテキスト解析
* 大規模リンク解析
* ディスカッション

---------------------------------------------------------------------
■ 発表申込〔締切: 2008年12月22日(月)〕
 以下の発表申し込みフォームにご記入の上,
 sigswo{at}nii.ac.jp 宛てにご送付ください.

■ 原稿提出〔締切: 2009年1月15日(木)〕
 お申込み頂いた順番にページ番号をお知らせしますので,ページ番号を
 付記した原稿(A4,2〜10頁,PDFファイル)を作成し,上記のアドレス宛て
 にご送付ください.原稿作成には人工知能学会研究会スタイルファイル/
 Wordテンプレートをご利用ください.
 <http://www.ai-gakkai.or.jp/jsai/sig/style.html>

 原稿は研究会のページ <http://sigswo.org/> に掲載します(研究会資料
 の冊子は作成しておりません).なお,原稿のWeb公開に際して配慮が必要
 な場合(知財権のある場合など)は発表申込み時にその旨お知らせください.

======================発表申し込みフォーム=========================
研究会:第20回SWO研究会:Wikipediaワークショップ(2009年1月22日開催)
申込締切:2008年12月22日(月)
送付先:sigswo {at} nii.ac.jp

タイトル:
著者(発表者に○):
所属:
概要(数行で):
著者連絡先Email:

発表希望時間(以下の3つから1つ)を選び,他を削除してください。
15分(発表10分・質疑5分)
25分(発表15分・質疑10分)
35分(発表20分・質疑15分)
======================発表申し込みフォーム(終わり)=================

「人工物と価値」オーガナイズドセッション

2007-12-17 14:52:59 | 価値創成
2008年の人工知能学会全国大会にて下記のオーガナイズドセッションを開催致します.
人工物と価値に関して広く論文投稿を募集しておりますので,
ご興味をお持ちの方は奮ってご投稿・ご参加下さいます様,お願い致します.

第22回人工知能学会全国大会オーガナイズドセッション:「人工物と価値」

申し込み期間(タイトルと概要のみ):
  2008年1月9日(水)〜 21日(月) 午後2時〆切
カメラレディ提出期間:
  2008年4月2日(水)〜 4月14日(月) 午後2時〆切

DBWeb2007にて(雑感)

2007-12-16 15:20:12 | 研究
DBWeb2007に参加して思ったことを備忘録として書いておこうと思います.
まとまっていなくてすみません.

重要な情報はWebに現れない


重要な情報はWebに現れない.SNSに流れるかも知れないが,それも確実ではない.重要な情報は結局オフラインでしか伝わらない.週間ダイアモンド11月12日号ではウェブの真贋という特集が組まれており,この特集号では2007年時点でのWebの現状についてまとめられている.この中に,Webを使った大学生の就職活動に関する話があり,就職活動において重要な情報は公のWebには現れない,そうした情報はSNSやメール等のクチコミによって広まるという話があった.

Webの危機(共有地の悲劇)


近年Web上にスパムが増えている.商品の宣伝しか掲載されていないブログサイトも増えている.検索結果中にこうしたページが増えている.Webは共有物であるので,一人一人がきちんと情報発信すると良いが,一旦そのルールが崩れるとWebは崩壊の危機に直面するのではないか.これは共有地の悲劇とも通じる話だろう.

結局,Webから有用な情報が減りつつあるのではないだろうか.Webに情報を発信する人が少なくなっている?
最終的には個々人が出来る範囲でWebに情報発信して,Webの価値を高めていくべきではないか?

大事な情報はWebには現れないし,Webの情報には限界がある.
→ Webに頼り切らないことが大事.

実際に体験してみてはじめて分かることがある.Webにある情報から物事の全ての側面について理解することは困難.
→ Webでの情報収集は適度なところで切り上げる.実際に足を運んでみる.ある程度情報を集めたら,後は実際の感覚や直感を大事にするべき.

気付き研究の必要性


実世界での気付きから,再びWebに対して情報発信するサイクルを作ることが大事.
気付くこと,情報発信することが大事

関連研究として,大阪大学・松村研究室で進められているフィールドマイニングプロジェクトがある.
また,東京大学・大澤幸生研究室ではチャンス発見に関する研究を進めている.
気付きに関する研究と,そこからの情報発信への結びつけについて研究を進めて行きたい.

関連する(?)ページ
中京大学・三宅なほみ研究室
日本認知科学会

CFP: Social Intelligence Design 2008 (SID2008)

2007-12-15 18:29:54 | 研究
以前SID2007の論文募集の記事を書きましたが,次回2008年のワークショップ(SID2008)のアナウンスを頂きました.
毎回,工学系を中心としながらも幅広い分野の研究者が参加していますので,新しい視点を得る良い機会だと思います.
会期は2008年12月(1年後ですね)の3日〜5日,論文の投稿〆切は5月16日だそうです.
前回イタリアでの会議にも多くの方にご参加頂きましたので,今回も皆様ふるってご参加頂ければと思います.
_______________________________________________________________

C A L L F O R P A P E R S

The 7th International Workshop on Social Intelligence Design (SID2008)
Designing Socially Aware Interactions

San Juan, Puerto Rico
December 3-5, 2008

http://cdr.uprrp.edu/SID2008/default.htm

________________________________________________________________


IMPORTANT DATES

Paper Submission: May 16, 2008
Acceptance Notification: July 11, 2008
Submission of Revised Paper: Sept 12, 2008
Workshop: December 3-5, 2008


Social Intelligence Design (SID) as a research and practice field attempts
to integrate and understand the interactions between designing and social
intelligence. It involves multiple disciplinary approaches concerning design
and implementation of systems and environments, ranging from group/team
oriented collaboration support systems that facilitate common ground
building, goal-oriented interaction among participants, to community support
systems that support large-scale online-discussion.

FOCUS

Social Intelligence Design (SID) as a research and practice field attempts
to integrate and understand the interactions between designing and social
intelligence. The workshop's theme this year on designing socially aware
interactions acknowledges the essential need for designing tools,
procedures, and techniques to improve the interactions by addressing
socially related factors.

Researchers from all fields employing computation and or cognition including
design, workspaces, education, e-commerce, entertainment, digital democracy,
and other fields are invited to participate.

DBWeb2007に参加(Splog関連)

2007-12-15 18:16:53 | Weblog
またしても久々の投稿になってしまいました.
少し前の話になりますがDBWeb2007というデータベース関連のシンポジウムに参加してきました.
その中でブログに関するセッションがあり,スパムブログの調査を行っておられる方のお話を聞いてきました.
ある期間に投稿されたブログ記事集合に対してサンプリングを行い,そのサンプル中に含まれるSplogの数から全体のSplogの数を推定するお話と,ブログ記事内に含まれるoutリンク数からSplog を判別するというお話でした.
Splogの多くはoutリンクを多く含んでいるので,これによってある程度Splogを除外できそうです.

スパムブログの定量的調査と分離の試み(島根県立大・石田和成先生)
http://castor.kyoto-su.ac.jp/dbweb2007/program-dbweb2007.htm

DBWebとは別ですが,Splogに関する調査を行っています.
まだまとまってはいませんが,資料を以下のURL にアップしておきます.
http://www.race.u-tokyo.ac.jp/~fukuhara/Research/paper/07/07Nov04NLPmeeting-splog.pdf

Splog関連情報

2007-05-15 00:08:35 | Weblog
久々の記事投稿です.
ブログ記事の検索を行う中で問題となるのがスパムのブログ(Splog)です.
英語圏のブログでは2−3年前から問題になっていましたが,
日本語のブログでも最近特に増えてきたように思います.
Splogに対抗するために情報を調べてみました.

http://airweb.cse.lehigh.edu/
Adversarial Information Retrieval on the Web に関するワークショップ.
Web spam がテーマのようです.

http://airweb.cse.lehigh.edu/2007/program.html
上のAIRWeb の今年の発表プログラム.
Splog をはじめWeb spam に関する発表が多くあります.

http://ebiquity.umbc.edu/papers/
UMBC のTim Finin先生のグループの論文.
ここではPranam Kolariを中心にSplog空間の現状と対策について研究を進めているようです.

http://www2007.org/proceedings.html
WWW2007の発表論文.Splog関連の発表は↓
http://www.cs.bell-labs.com/cm/cs/who/pfps/temp/web/www2007.org/papers/paper111.pdf

http://splogspot.com/
Splog検索エンジンなんていうのもあるようです.

情報資源の開発と整備2: 日本語とドイツ語の流通情報の比較

2007-02-28 00:48:31 | その他
以前,情報資源の開発と整備という題で日記を書きましたが,最近また気になっています.

Data Mining: Practical Machine Learning Tools and Techniques というデータマイニングの教科書的な本があるのですが,この本の紹介ページを見てみると,ドイツ語訳が出版されていることに気付きました.
日本語版は,もしかすると現在有志の方が翻訳されているのかも知れませんが,上のページには見当たらず残念に思いました.

これと同じ状況をWikipedia の中で見かけます.Wikipediaではある言語で書かれた記事Aから,同じ項目について他の言語で書かれた記事Bがある場合,記事Aから記事Bにリンクが張られるのですが,英語の記事を見ているとドイツ語へのリンクはよく目にしますが,時折日本語へのリンクが無い記事を見かけます.これは何だか残念に思います.

ちなみに言語ごとのWikipedia記事数の比較では,1位が英語で1,660,803記事,2位がドイツ語で548,795記事,日本語はフランス語,ポーランド語について第5位で333,480記事となっています(2007/2/28 0時40分確認).
各言語のWikipediaユーザ数は英語3,691,612人,ドイツ語362,055人,フランス語219,868人,ポーランド語103,099人,日本語115,959人ということです(出展: List of Wikipedias のUsers).

ちなみに日本とドイツの人口を調べてみると,日本が127,767,944人(2006年,Wikipedia, 日本の記事より), ドイツが82,424,609人(2004年,Wikipedia, ドイツの記事より)で,人口に関しては日本の方が多いのですね.

こうした状況は,たまたま自分が目にしたWebページとWikipediaだけの話で,出版物については違うのかも知れません(これは調べてないので分かりませんが).

ドイツの人はWikipediaをよく利用し,また記事も書くということでしょうか?
その辺の事情についてご存知の方がいらっしゃいましたら,お教え願えれば幸いです.

TREC

2007-02-13 23:34:14 | 研究
TREC(Text REtrieval Conference)という情報検索のコンテストがあるのですが,調べてみるとこれがなかなか面白そうです.
ブログに関してはTREC Blog Trackというのが2006年あたりから開始され,Webで検索してみるとアメリカ,イギリス,中国,台湾などから多数のチームが参加しているようでなかなか面白そうです(ブログ記事のコーパスも公開されているようです).
他にもTerabyte Trackというテラバイト単位のデータを対象とした検索コンテストや,言語横断の検索に関するCross-lingual track, SPAM Trackというトラック(これはスパムデータも公開している)など様々なtrackがあり,どれもなかなか面白そうです.
たまに検索してみると現在様々な取り組みが進んでいることが分かり刺激になりますね.