Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

WWW2009 参加メモ (その4) 一般発表

2009年04月28日 | 会議参加記
あとは参加したセッションと気になった発表など。
基本的にsocial network, semanic web, linked dataを中心に聴講。

ちょっとした聴講メモ。

**Social Web**
*** Tagommenders: Connecting Users to Items through Tags
233 Shilad Sen, Jesse Vig and John Riedl
MovieLensやsocial taggingのデータを使ってrecommendationをするという研究。
Basian Networkなど3種類のアルゴリズムをつかい、総合的に推定。
<よく調べられた研究。>

*** Collaborative Filtering for Orkut Communities: Discovery of User Latent Behavior
365 Wen-Yen Chen, Jon-Chyuan Chu, Junyi Luan, Hongjie Bai and Edward Chang
Orkutにおける community recommendation
Association rules mining (ARM)
Latent Dirichlet Allocation (LDA)
の両方を使って比較。
あと並列化の効果。

*** Personalized Recommendation on Dynamic Contents Using Predictive
Bilinear Models
713 Wei Chu and Seung-Taek Park
Yahoo!のトップページのように動的に変わるページをPersonalizeする話。
Colloborative filteringでは新ユーザや新コンテンツ対応が難しい。
ユーザとコンテンツのfeatureを抽出してfeature-basedでrecommendationをする。
<かなり実践的な話のようだ。>

*** Network Analysis of Collaboration Structure in Wikipedia
115 Ulrik Brandes, Patrick Kenis, Juergen Lerner and Denise van Raaij
Wikipediaのedit networkの分析。
<何か新しいのか??>

*** Social Search in "Small World" Experiments
45 Sharad Goel, Roby Muhamad and Duncan Watts
Mirigramの6次の隔たりの検証。
<これは面白い。丁寧に論文を読んでみないと。。。>

Track: Social Networks and Web 2.0 / Session: Photos and Web 2.0

*** Mapping the World's Photos (Page 761)
David Crandall (Cornell University)
Lars Backstrom (Cornell University)
Daniel Huttenlocher (Cornell University)
Jon Kleinberg (Cornell University)

Best Paper 候補
GeoTagの集中度のくらlandmarkを発見。そのLandmarkを代表するphoto
をtagの共通から発見。
逆にラベルのない写真をどのlandmarkかを推定
<geotagつきのflikrのデータの膨大さに驚く。その集中度をうまく使い、画像を解釈せずに処理。うまい。>


*** Constructing Folksonomies from User-Specified Relations on
Flickr (Page 781)
Anon Plangprasopchok (University of Southern California)
Kristina Lerman (University of Southern California)

metadataから隠れた階層構造を発見する。
Flikr自身のcollectionから単語間の階層関係生成
Signifanceで切る。
複数Pathはflow bottleneckで選択
ODPと比較
<これってsematic webの方ではよくやられている手法。画像系だから新しい?>


Mining-5 Andrew Tomkins
*** Learning Consensus Opinion:Mining Data from a Labeling Game
556 Paul Bennett, Max Chickering and Anton Mityagin

Image Gameのデータの分析。
単語と2-5程度のイメージをみせて一つ選択。二人が合うとAgree。
そのときのデータをMS SearchのRankingと比較。
<このMSのlabeling gameネタは2つぐらいあったと思います。そんなに重要な研究なんだろうか。まだよく理解できていません。>

Semantic Data Management

*** Rapid Semantic Web Mashup Development through Semantic Web Pipes
160 Danh Le Phuoc, Axel Polleres, Giovanni Tummarello, Christian Morbidoni and Manfred Hauswirth
Yahoo! PipesならぬSW Pipesの実装
<これは前にも紹介されていたが、普通に使えそうで面白い。>

Linked Data

*** Large Scale Integration of Senses for the Semantic Web
525 Jorge Gracia, Mathieu d'Aquin and Eduardo Mena
たくさんあるオントロジーの同じ概念を統合することに関する考察。
閾値をどこにおくかを実験。

*** Triplify - Light-weight Linked Data Publication from Relational
Databases
1 Soren Auer, Sebastian Dietzold, Jens Lehmann, Sebastian Hellmann and David Aumueller

RDBからRDFを作り出す話。
RDBからRDFを引き出すSQLパターンをたくさん用意しておく。
WordPress とかシステムごとに用意する。
<安直だが、結構はやるかも。>

*** Extracting Key Terms From Noisy and Multitheme Documents
366 Maria Grineva, Dmitry Lizorkin and Maxim Grinev

wikipediaから単語の関係グラフをつくり、そこからNewmanコミュニティを抽出してランキング。それを単語の重要度などに使う。
<え、それでいいのか?>

****
やっぱり5日目ぐらいになるとだれて理解力が落ちてますね。反省。
WWW2009は論文発表はちょっとクオリティにばらつきがある。各トラックごとセレクションが厳しすぎて研究のクオリティにまして論文自体のクオリティが効いてしまっているのかなあ。

(おしまい)

WWW2009 参加メモ (その3) 4/23, 24 Panelとkeynote 

2009年04月28日 | 書評
4/24のkeynoteはDr. Alfred Z. Spector (VP Research and Special Initiatives, Google, Inc)で“The Continuing Metamorphosis of the Web”。
いま重要なのは
A. Totally Transparent Processing,
B. The Rule of Distributed Computing、
C. Hybrid, not Artificial, Intelligence
だそうだ。Aでは、Voice Searchに力点がおかれていたところがちょっと興味深い。英語圏ではそうなのかな。吉川さん@SVもそういうものを立ち上げていたし。日本だと音声インタラクションとははやらないそう(萌ゲームとはありかな)あと翻訳も強調していた。いま40前後の言語をサポートしているらしい。
Cは興味が近い。AIで効果のあった部分は知能拡張や専門問題解決。いま、巨大なユーザレスポンスがあるので、人の力を使って、多くのことができるようなった。hybrid intelligenceとはコンピュータだけでなく人を含むような系。
まあこれまでもいわれてきた話ですが、Googleのもつ巨大データがあると何か違うことができそうで、その意味では期待感有り。

そのあとはWeb Scienceとはなんぞやというパネル。これは正直言ってよくわからないパネルであった。Web ScienceはNetwork Scienceを含み、社会学や心理学を含む学際的領域。だから研究者も複数の分野を知っておくべきと。しかし、結局Web Scienceが何なのかはわからずじまい。

4/24のkeynoteはつまらなかったので割愛。

WWW2009 参加メモ (その2) 4/22 Key note (TBL) 

2009年04月28日 | 会議参加記
次に恒例のTBLのkey note speach. 年度初めにTBLのこの"ご神託"を聞くのがすっかり癖になっていて、ある意味で期待しています。今年は何を持ち出すのかと:-)

予想通り、linked dataは一押しでしたが、今回はtalkは割と構造的で聞きやすかったです(っていつもそうでないわけですが)

まずはWebで変わったこと、変わらないこと。先のPanelでも出てきたようにWebは意外に変わっていないところが多い。いまだ静的なページは多いし、協調的なWebの使いかも変わらないし、hyperlinkでつながる一つの世界は維持されている。でもいろいろ環境は変わった。ディスプレイの低廉化、モバイル、データの氾濫。

そういった状況下において
1. Web applications
2. Open social networking
3. Open Linked Data
が重要。

1. Web applicationにおいては非集中、モジュラリティが肝要。html+αでいろいろなことができる。


2. Open social networking
SNSは囲い込み。しかし、それはAOL時代とかの昔のよう。それではフラストレーションが溜まる。"I want my data back"。
だからOpenAPIとLinkedData
RDF+OWL+HTTP+SPARQLで実現できる。
プラバシー、匿名性に注意。

3. Linked Open Data
Linked Dataはどんどん増えている。

Linked Data はどこにでもある
- Government (e.g, Obama)
- Enterprise
- Science
- Social network
- Community (eg. OpenStreetMap, linkedgeodata.org)

社会的関心事項としては、データの由来のトラッキングやどういう風にデータを使ってよいかの合意形成という点。

”自分のためにやろう、そうすればみんながついてくる”

ごいったぐらいでしょうか。私のつたない英語理解能力で書いてますんで間違いも多いでしょうけど。

ここでもTBLは社会を強調していますね。



WWW2009 参加メモ (その1) 総論と4/22 panel 

2009年04月28日 | 会議参加記
やっぱりまとめようと思うと遅くなってしまいますね。全く。なので2日目は飛ばして本会議のレポートをメモをまとめる形で書いておきます。

全体の感想。
私の印象では今回のWWW2009は総じて社会色が強かった。これはビジネス色が強かった北京でのWWW2008とは際だった対比を作っていた。北京では、Google,MS,AT&T Labからkey note speakerがでてWebの将来を語っていた。Speakerのセレクションからしてビジネス指向でした。一方、今回はinvited speaker, panelも社会を意識しています。これはリーマンショックからくる業界的な影響なのか、ヨーロッパという場所柄(ヨーロッパは総じてアメリカよりはITでも社会性を重視)からだろうか。例えば今回のPlatium Sponsorの一つONCEはスペインの障害者を支援する団体。たぶん、両方なのでしょう。さらには20周年ということでロングレンジで考えましょうという雰囲気もあったと思います。
シリコンバレー的雰囲気のdog year Webも必要だけど、もう少し長い目、広い視点でWebをみるのも必要だということを感じさせてくれました。


4/23 本会議一日目

今回はまず冒頭でWWW誕生20周年記念パネル。出席者は
* Tim Berners-Lee,
* Robert Cailliau (CERNでTBLとともにWWWを提案)、
* Vinton Cerf (現Google Vice President and Chief Internet Evangelist、”インターネットの父”)、
* Dale Dougherty (現O'Reilly Vice President、O'Reillyの共同設立者)、
* Mike Shaver (Mozilla Vice President、Mozzila Organizationの設立メンバーの一人)。
司会からの質疑形式で行われた。
Q1: まずWWWの最初の印象はという質問。
TBL: コラボレーションのプラットフォームと思っていた。
VC:htmlのソースがみれることは印象的でlearning by doingを促したと思う。DD:WWWをTBLのHyperText91で知った。ただしポスター発表だった。

Q2: WWWの発展で一番エキサイティングなことは?
RC:多くの小さなことの積み重ねがあったことが重要。あとGoogleがいまだ機能しているのはこれはこれで驚き。(VCが反論 :-))
VC:ドメインネームがユーザに見え、そのおかげでドメインネームが認知され、商売にまでなった。あとはindexingができるようになったこと、新しいビジネスを作ったこと。
DD:いかにサイトが急に増えたか、こんなに早く普及したこと。
MS:20年たっても基本的に変わらないことが驚き。TBL:当時はコマンド型のワープロが当たり前でMacのWYSWYGのワープロが先進的だった。にも関わらずHTMLが受け入れられたこと。あと人々が相互に教えあったこと。

Q3: 未来に期待することは?
VC:Internetをmotivateしていること。data linkingは重要。cloud computingの間でもこれは重要。それはnew platformになる。宇宙開発にも重要。政府も真剣にInternetにコミットするようになった。
DD:Potential。若い人にはWWWは電気と同じ。前の世代はnon-WebとWebを繋ぐ。new genrationはsocial media。Twitterは思ったいる以上に重要。とってもオープンなので。新しい世代はWebは当たり前なので、ソーシャルとテクノロジーが合わさって新しいモノができるだろう。
MS:世界人口の残りがWebにアクセスできるようになってもWebが変わらないだろうかは興味のあることだ。Webはとてもシンプル。WWWはシンプルさが重要で、だから簡単に学んだり、コピーしたりできる。簡単さを失わないこと。(拍手!)
TBL:未来のシステムも複雑じゃなくてクリーンに。世界の残りのひとがWebにはいることはexciting。
RC:Webは地球上の問題をjust-in-timeで解く仕組み。あとmobileは重要。データや経路がどこにあることなんて気にしない。anyplace, anytimeは社会的な振る舞いとなるだろう。相変わらずsimple and cleanも。
VC: docuemnt, data, peopleがonlineになることはすごいポテンシャル。

このあとJim Hendlerらが会場から質問(略)

この陣容でやっぱりRobert CailliauとVinton Cerfはよくも悪くもインターネット第一世代。Dale DoughertyとMike Shaverとは発想の原点が違う。インターネットが物理的なネットワークであることからイメージしている。一方、後者はすでに物理的なネットワークはもはや意識になく、社会に普及したインフラとしてのインターネットからイメージしている。TBLはどうなんだろう?よくわからない。
ただ両者とも社会におけるWWWの重要性は間違いなく高いということは同意している。