goo blog サービス終了のお知らせ 

Vanteyのアース線(もしくは枯れた資料帳)

怠け者のウィキメディアン・Vanteyの、脳内が帯電してきた時のはけ口。非百科事典的。過度な期待はしないでください。

WPの一部画像の向きがおかしい件(2011年12月)

2011-12-18 23:41:32 | 機能・ソフト等
ウィキブレイク中とはいえ、半年に1本くらいはウィキメディアネタを入れとかないと本ブログの看板にかかわるので、最近のネタから一つ。

自分が過去にコモンズにアップロードした写真の何枚かが、90°回転した状態になっていることに気付いたのは、今月初め頃のことでした。
最近の多くのデジカメの Exif には画像方向 (orientation) の情報が入っている(そしてデジカメの設定により ON / OFF は可能)ことは知っていましたし、それをそっくり残したまま横向き画像を90°回転して縦向きにしてうpした画像ばかりが被害に遭っていたので、原因はすぐに推察できました。
やはりというか、画像の方向情報を読んでそれに従い画像を表示する際に自動回転するという機能が MediaWiki に実装されていたのでした。
MediaWiki 1.18 がコモンズに実装されたのは2011年10月5日のことで、それ以後にこの機能が ON にされたようで、特に12月に入ってから各所で被害報告が相次ぐようになりました。



被害はファイルページだけではなくて、当然、その画像を呼び出しているウィキペディア等他プロジェクト(そちらが主たる用途である)の表示にも及びました。
例えば最近見た記事でも、ごらんの有様だよ!!!



対処法などについてもざっと調べたところ、ファイルページの隅にいつしか設置されていた 画像回転依頼 request rotation のリンクはこのためのもののようで。

踏んでみると、画像の正しい回転方向を指定するウィザードが現れ、



OK を押すと、 bot を召喚するタグが貼られて、


じきに bot がやってきて、画像方向のメタデータ値を修正した同じ画像を上書きアップロードしてくれる、というわけ。



但しこの bot がやってくるまでには、かなり時間がかかります。 flickr 移入画像の査読 bot が召喚から1時間でやってくるのとは違って。小生は数日待たされました。

   *  *  *  *

{{私論}}
しかしなんでこんな傍迷惑な機能が実装されたのでしょうね。
現在コモンズには1100万点を超えるファイルがあり、このうち Exif の画像方向値がおかしい(かった)画像は5万点はあるとみられています。それらの全部について、手動での修正――Exif の書き換えと再アップロードは bot に任せるにしても、その指示作業は1枚1枚手動である――を強いているのです。
それに(一時的にせよ)画像が正しく表示されなくするということは、その画像が存在する意義を減ぜしめ、またそれを用いている世界中の言語版の百科事典等の記事をも破壊する行為にほかなりません。

この機能により、事前の画像編集を経ずに新規にアップロードされる分については、画像方向値に従って初めから正しく表示されることもあるのかもしれません。しかしそれとて必ず正しいわけではなく、特に水平撮影の写真などでは画像方向値が高確率でおかしかったりもします。これらの中には、結局誰かに手動で回転依頼してもらわねばならない画像も少なくないはずです。
新規に立ち上げられるウィキでは、おそらく有用な機能でしょう。しかし、非常に多くの既存画像を抱えるウィキにこの機能を導入するというのは、あまりに無思慮であったのではないでしょうか。実際、この機能の導入にあたって事前に慎重な検討と十分な議論と周知があったという話は聞かれず、そのことに対する批判こそが最近は聞かれます。

まあ、この機能をWMに実装した奴等が「僅かな新規うp画像中のさらに僅かな縦画像に正しく対応する方が、5万点からの既存画像を破壊することより重要だ」と独断で判断したのですから仕方ありません。
こういう上位機能やプラットフォームの開発をやってる連中は概して "上から目線野郎" が多いっぽいですし。2010年4~5月に jawp を騒がせた「名前空間名変更騒動」中の議論を見ていてつくづく思いました。まして非日本語圏の同種コミュニティにおいてをや。
奴等はこの機能を停止して元に戻すということは、考えていないようです。剰え、画像方向値が〈通常〉ではない画像を監視する bot が検討されているなどという本末転倒な話もあって。
もうね、ワケワカンネ。

WMは「新規利用者の拡張」を主眼にここ数年 MediaWiki やWP関連機能などの改良に取り組んできている訳ですが、その運用の段でこういうことをやってて、却ってベテラン利用者を引かせてどうすんの、と思ったりもするのです。

----
Wikipedia:井戸端/subj/縦画像について - Wikipedia
http://ja.wikipedia.org/wiki/Wikipedia:井戸端/subj/縦画像について

----
Summary of images:
Description = ウィキペディア日本語版の井戸端での議論
Source = http://ja.wikipedia.org/w/index.php?title=Wikipedia:井戸端/subj/縦画像について&oldid=40345911
Date = 2011-12-10

Description = 記事に表示された画像が90°回転してしまっている例
Source = http://en.wikipedia.org/wiki/King's_Cross_St._Pancras_tube_station
Date = 2011-12-10

Description = bot による画像回転の正常化対処の手順
Source = http://commons.wikimedia.org/wiki/File:Honda_itansha_rear_at_C77_20091229.jpg
Date = 2011-12
License = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

「プロジェクト」名前空間、始動

2010-09-14 23:51:06 | 機能・ソフト等
ウィキペディアが用いているウィキソフトウェア MediaWiki の機能に、「名前空間」 (namespace) という概念があります。
これはウィキ内にある文書をその性格別に分類したもので、それによってページの機能を分けたりしています。ページ名に「ノート:」とか「Wikipedia:」とか「Category:」とかのプリフィックスが付いている文書がありますが、これが名前空間です。

メインコンテンツである「記事」 (article) はプリフィックスなしのページ、すなわち「標準名前空間」に置かれており、一方でそのウィキの管理関係の文書は jawp の場合は「Wikipedia」という名前空間に置かれています。


この名前空間には MediaWiki のデフォルト機能として用意されるもののほかに、各ウィキ毎に独自の名前空間を設定することができます。
上記した「ノート」とか「Wikipedia」とか「Category」とかの名前空間は、このデフォルト機能に基づき設定されているものです。
そして独自名前空間は jawp では、2006年3月よりウィキポータル用の名前空間として「Portal」が設定されています。

eswp や frwp ではこの他に、ウィキプロジェクト用にも独自の名前空間が設定されていました。
この度、 ja でもウィキプロジェクト用の名前空間を設定しようという話になり、名前空間名の投票などのプロセスを経て「プロジェクト」名前空間が設定され、対象となるページが移動された本日あたりから本格稼働となりました。

インタフェースの変化はこんな感じです。


 ↓


実質ウィキブレイク同然でほとんど何もしていない小生ごときがエラソーに言えたことではないのですが、ここまでの設定の労をとってくださった方々におかれましてはほんとうにご苦労様でした。

----
Help:名前空間 - Wikipedia
http://ja.wikipedia.org/wiki/Help:名前空間
Wikipedia:ウィキプロジェクト/名前空間の新設 - Wikipedia
http://ja.wikipedia.org/wiki/Wikipedia:ウィキプロジェクト/名前空間の新設
Wikipedia:ウィキプロジェクト - Wikipedia
http://ja.wikipedia.org/wiki/Wikipedia:ウィキプロジェクト

----
Summary of images:
Description = 「プロジェクト」名前空間設定前後のウィキプロジェクトページの例
Source of wiki page = http://ja.wikipedia.org/wiki/Wikipedia:ウィキプロジェクト 執筆支援
Date = 2010-09-12 / 2010-09-14
License = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

ウィキメディア各プロジェクトのデフォルトUI切り替え大作戦

2010-04-08 02:58:10 | 機能・ソフト等
まずはお詫びと訂正から。
前エントリ最後で述べた、「Thumbnail Purger」ガジェットのベクター外装への対応ですが、「▼」タブからのドロップダウンで既に対応されていました。
(因みにその左隣の「☆」はウォッチリスト登録。登録すると「★」になる)



スクリーンショットを取得した時の環境が普段と違う試験用環境で(スクショ用にはありふれたMS Pゴシックを用いておきたいというフォントの都合。筆者は別のフォントを常用しています)、その際のブラウザはIE互換、そしてIEのバージョンが6(試験用にわざと残しています)だったためと思われます。
常用の環境では、問題なく動作しています。
外装「ベクター」のガジェット用ドロップダウン機能はIE6非対応なことが謀らずも明らかになりました。


今回のデフォルトUI変更大作戦の実行は、少し前にウィキメディア財団から告知が出ています。

Wikimedia gets ready for some big changes
http://blog.wikimedia.org/2010/03/25/wikimedia-gets-ready-for-some-big-changes/
 (Wikimedia blog 2010年3月25日)

抄訳を含む日本語記事はこちら。

Wikipedia、使い勝手を向上する大幅な変更を4月より実施
http://itpro.nikkeibp.co.jp/article/NEWS/20100329/346321/
 (ITpro ニュース 2010年3月29日)
「Wikipedia」、初のUIデザイン大幅刷新を実施へ
http://japan.cnet.com/news/media/story/0,2000056023,20411143,00.htm
 (CNET Japan ニュース 2010年3月29日 13:54)

この時点での計画では、全プロジェクトの先陣を切ってまず4月5日にコモンズに変更を適用し、その後4月下旬に英語版に、他の言語版はその後に変更するとしています。

コモンズで実際に実施されたのは6日だったようです。
前エントリに載せた6日にアクセスしたスクショでは「本日からモノブックからベクターに変更されています。」と書いてありましたし、コモンズに変更を適用した旨の Wikimedia blog の最新エントリも6日付となっています。

Vector meets Commons
http://blog.wikimedia.org/2010/04/06/vector-meets-commons/
 (Wikimedia blog 2010年4月6日)


ところで今日は、「What's New?」のページが和訳されていました。








私たちは、より使いやすいサイトを利用者の皆様にお届けするために日々努力しています。そして新しい外観や雰囲気、わかりやすくなった編集機能などの改善を皆さまと共有できることを大変うれしく思っています。私たちのプロジェクトのユーザビリティを改善することは、ウィキメディア財団の優先課題の一つであり、今後も更なるアップデートを実施していく予定です。

=== 今回の変更点は以下の通りです ===
* ナビゲーション: ページの閲覧・編集時のナビゲーションを改善しました。各ページの上部のタブは、閲覧中の画面がページ本体なのかそのノートページなのか、あるいは現在閲覧中なのか編集中なのかをよりはっきりと示すようになりました。
* 編集ツールバーの改善: 編集ツールバーを再編して、より使いやすくしました。ページの整形がより簡単に、かつ直感的に行なえるようになっています。
* リンクウィザード: ウィキペディア内の他のページや外部サイトへのリンクを追加できる、使いやすいツールを備えました。
* 検索機能の改善: 検索結果の候補予想の提示を改善し、お探しのページにより素早くたどり着けるようにしました。
* その他の新機能: その他にも、ページ編集を簡潔化するために、表の作成を簡単にする表ウィザード、検索・置換機能を追加しました。

Creative Commons License

----
Summary of images:
Description = Screenshots of Wikimedia Commons
Source = Wikimedia Commons
Date = 2010-04-06 / 2010-04-08
License = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

ウィキメディア・コモンズのデフォルトUIが変わった

2010-04-07 04:17:34 | 機能・ソフト等
2010年4月6日、いつものようにウィキメディア・コモンズを訪れたら、以前来た時(最後に来たのは多分4月3日)からUIが変わっているではありませんか。

因みに私は、外装(スキン)はデフォルトの「モノブック」にしてありました。
それが、モノブックとは違う外装になっています。




そしてヘッダメッセージに「未設定状態での外装が、本日からモノブックからベクターに変更されています。」と。

あんですとぉぉ?!
この外装は「ベクター」って言うのか。いやそこじゃなくて問題は。



確かに、デフォルトが「ベクター」になっています。

比較のためにモノブックに戻してみますとこんな感じ。




ヘッダの利用者バーの左端の「New!」を踏むと、今回の変更の説明が表示されます。


We have been working hard to make things easier for our users. We are excited to share some improvements, including a new look and feel and simplified editing features. Improving the usability of our projects is a priority of the Wikimedia Foundation and we will be sharing more updates in the future.

=== Here's what we have changed ===
* Navigation: We have improved the navigation for reading and editing pages. Now, the tabs at the top of each page more clearly define whether you are viewing the page or discussion page, and whether you are reading or editing a page.
* Editing toolbar improvements: We have reorganized the editing toolbar to make easier to use. Now, formatting pages is simpler and more intuitive.
* Link wizard: An easy-to-use tool allows you to add links to other Wikipedia pages as well as links to external sites.
* Search improvements: We have improved search suggestions to get you to the page you are looking for more quickly.
* Other new features: We have also introduced a table wizard to make creating tables easier and find and a replace feature to simplify page editing.

Creative Commons License

要するに、これはかねてから計画していたユーザビリティ改善の結果であると。
例のスタントン財団による89万米ドルの寄附(2008年12月3日)により始まった改善プログラムの成果が漸く実装に至ったということでしょう。

このページでは主な変更点として、「タブの再配置」のほか、「編集ツールバーの刷新」なども説明されています。
その辺は次エントリで触れられればと。


この外装に対する個人的感想としては、 おもて/ノート と 閲覧/編集/履歴表示 のタブの位置が分けられたことで、誤クリックが減るのではないかと。これは初心者にもベテラン編集者にもきっとありがたいことです。

ただ一つだけ言わせてくれ。個人設定のガジェットで「Thumbnail Purger」(上掲のモノブック外装で「*」のタブ)を使っていたのですが、ベクターには未対応っぽい。早く対応してくれ。

----
Summary of images:
Description = Screenshots of Wikimedia Commons
Source = Wikimedia Commons
Date = 2010-04-06
License = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

平城遷都1300年祭のシンボルマークがウィキペディアで使う警告アイコンに見えて困る

2010-01-28 01:02:51 | 機能・ソフト等
平城遷都1300年祭にはキモマスコットの他に、掌を象ったシンボルマークがあります。



公式サイトに行くと、このシンボルマークがブラウザに favicon として表示されます。

この favicon が、ウィキペディアンにとってはなんとも心臓に悪いのです。
なぜって、WPで警告表示用のメッセージボックステンプレートに表示されるアイコンが、ちょうどこういうデザインなんです。


(フォントは IPA モナー 明朝 を使用)

ちなみにこれはサンドボックスですよ。実際のWP内ではこんな文言は使われませんw

----
平城遷都1300年祭
http://www.1300.jp/

----
Summary of images:
Description = せんとくんと平城遷都1300年祭シンボルマーク
Date = 2009-05-13
Source/Author of photograph = Vantey
Author of symbols = 社団法人平城遷都1300年記念事業協会
Permission of photograph = Copyright (c) 2010 Vantey / Copyrighted free use, Trademarked

Description = Wikipedia:サンドボックス で生成した Template:Notice の出力例
Date = 2010-01
Permission = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

「WikiTrust」 を試用してみました

2009-09-09 03:38:32 | 機能・ソフト等
前エントリでは、執筆者間の「意見の一致度」を検出して文書内の単語単位で色分け表示する MediaWiki 拡張機能 「WikiTrust」 が enwp に実装されて実験が行われている、ということを紹介しました。

コンセプトの能書きはいい、それよりも利用者の立場で使ってみたい(デモを見たい)! と思い、 早速試してみました。


WikiTrust のサイトの Demos によると、どうやらまず、お使いの Firefox に WikiTrust 対応化のための拡張機能(アドオン)をインストールする必要があるようです。
Firefox ブラウザ無料ダウンロード
ということでアドオンをインストールして Firefox を再起動し、 enwp を訪れてログインすると、
文書上部のタブ列に「trust info」というタブが出現しました。




任意の記事でこの trust info タブをクリックすると、画面にダークフィルターがかかって「Downloading trust information...」という表示が出て、





やがて文字に色分けがされた記事が表示される……はずなのですが、、

きちんと結果が表示される記事はまだほとんどありません。
WikiTrust のサイトには Colored pages のリストが載っていますが、それに従って "対応済み" とされるページを訪れて trust info タブをクリックしても、
大抵は「There is no trust information available for this text yet.」とのみ書かれた白紙のページが表示されるか、



もしくは運良く「色付け済み」ページが表示されても、記事の全部の文字背景色が真っ白(色なし、普段見ているのと変わらない状態)だったりします。
尤も、文字背景に色が付くのは "信頼できないとされる" 部分であり、 "信頼できるとされる" 場合は白くなるので、真っ白というのは最高の状態なのですが、
それではネタになりません。ビジュアル的にも。

そうして漸く、多く色の付いたページを見つけてキャプチャしたのがこれ。
わし星雲の中央付近にある暗黒星雲「創造の柱」 (Pillars of Creation) についての記事です。



ヘッダの緑の枠内とその右下のボタンのテキストは次の通り。

The article text is colored according to how much it has been revised. An orange background indicates new, unrevised, text; white is for text that has been revised by many reputed authors. If you click on a word, you will be redirected to the diff corresponding to the edit where the word was introduced. If you hover over a word, a pop-up displays the word author.

The text color and origin are computed by WikiTrust; if you notice problems, you can submit a bug report here.

 [ I believe this information is correct ]




そして、記事内のテキストの任意の箇所にマウスオーバーすると、その部分の執筆者名がポップアップされます。
このキャプチャでは色付きの箇所ですが、文字背景色が白色の箇所でも同様にポップアップが出ます。



ちなみにそこでクリックすると、その部分が加筆された時の編集差分が表示されます(差分画面は MediaWiki の元々の機能)。

----
Main Page - WikiTrust
http://wikitrust.soe.ucsc.edu/index.php/Main_Page

----
Summary of images:
Description = Screenshots of WikiTrust on English language Wikipedia
Source = English language Wikipedia
Date = 2009-09-09
License = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

内容の信頼度(?)を単語単位で色分け表示する MediaWiki 拡張 「WikiTrust」

2009-09-09 03:04:45 | 機能・ソフト等
真実と多数決:Wikipedia、「信頼度表示システム」を導入へ
http://wiredvision.jp/news/200909/2009090123.html
 (WIRED VISION 2009年9月1日)

誰でも無料で利用できる百科事典『Wikipedia』では、260ヵ国語で1200万ページにわたって提供される情報を、毎月6000万人を超える人々が使っている。しかしその人気とは裏腹に、Wikipediaは信頼できないとする批判を長い間受け続けてきた。インターネットに接続できる人なら誰でも寄稿できるため、このサイトは破壊行為や偏見、誤った情報などの被害を受けやすい。しかも編集は匿名で行なわれるため、信用できる情報と、破壊目的で作成された偽の内容とを見分けるのは容易ではない。

しかしこの秋からは、Wikipediaで見つけた情報を信じてもよいとする新しい理由ができる可能性がある。『WikiTrust』と呼ばれるオプション機能により、執筆者の信頼度とページでの掲載期間の長さに基づいて、Wikipediaのテキストが色分けされるようになるからだ。

カリフォルニア大学サンタクルーズ校のWiki Labの研究者たちが開発したプログラム『WikiTrust』は、これまでの寄稿がどのくらい長く継続しているかに基づいて執筆者の評判を計算するアルゴリズムを使って、新たに編集された文章を色分けする。基になる概念はシンプルだ。情報がページに長く残されているほど、その情報が正確である可能性が高いというわけだ。

疑わしい筋からの文章には、最初は明るいオレンジ色の背景が付き、信頼できる執筆者の文章には薄い色が付く。この文章を読む人や編集する人が多くなるほど、その文章は徐々に「信頼」を得るようになり、オレンジ色から白に変わっていく仕組みだ。この機能は、Wikipediaに登録したユーザーが、オプションで利用することができる予定だ。



原文:
Wikipedia to Color Code Untrustworthy Text
http://www.wired.com/wiredscience/2009/08/wikitrust/
 (Wired News 2009年8月30日)

紹介のされ方ゆえに誤解している人が多いようですが、この WikiTrust というのは、特にウィキペディアの(新)機能ではなくて、 MediaWiki の拡張機能の一つとして公開されているものです。
なので、自鯖に MediaWiki をインストールして管理してる人なら誰でも組み込んで使えるようにすることができます。
で、現在 enwp に実装されてデータベース構築と処理改善の実験が行われている、ってところでしょうか。


長期間活動している利用者ほど「より信頼性が高い」と仮定(あくまで仮定)して高いスコアを付け、高スコアの利用者が執筆した部分がどれだけ長期間残っているかを検出して文字の背景色を変える(ちなみに低スコアほど濃色で、段々薄くなる)ことで、「意見の一致度を検出する」仕組み……と私は大雑把に理解しました(やや違ってるかもしれません)。
編集履歴がすべて残っているコラボレーティブ・プロジェクトだからこそ実現し得たアイデアではあります。

ベテランでもひねた人とか、逆に一見の執筆者でも完成度の高いテキストを書き捨てて行く人もいますから、執筆歴の長さがそのまま内容の信頼性につながるとは一概には言えないでしょうし、まあそのような "前提の部分" の危なっかしさは、作ったほうも初めからわかってるでしょう、きっと。
技術者のお遊びとしてはなかなか面白いと思います。
(それを言っちゃあ、ウィキメディア・プロジェクト全体からして技術者の遊び場とも言えるのですがw)

あと、記事内での記述順序の入れ替えのような(大幅編集ながら実際の原執筆者は違う)編集に対応できないのは、仕様です。
MediaWiki 現行の差分表示機能でも追いきれていませんから。


次エントリでは、この WikiTrust を実際に試用してみます。

----
Main Page - WikiTrust
http://wikitrust.soe.ucsc.edu/index.php/Main_Page

----
Summary of image:
Description = Screenshot of WikiTrust on English language Wikipedia
Source of image = http://www.wired.com/wiredscience/2009/08/wikitrust/
Source of Wikipedia article = http://en.wikipedia.org/wiki/Reaganomics
Permission of Wikipedia logo = Copyright by Wikimedia / 日本国著作権法32条1項に基づく引用
Permission of Wikipedia article = CC-BY-SA-3.0, GFDL
Creative Commons LicenseGNU Free Documentation License

ローカルプロジェクトの事情を考慮しない多言語 Bot の横暴

2008-12-17 04:50:22 | 機能・ソフト等
前回のエントリの後2008年12月14日に、コモンズの GFDL タグにも Autotranslate が実装されました。


さて、 ja の記事・カテゴリからコモンズのカテゴリへのリンクを設置するテンプレートには {{Commonscat}}{{CommonscatN}}{{CommonscatS}} というデザインの異なる3種があります。

このうち CommonscatS は2008年7月7日にテンプレートとしての機能が白紙化され、事実上の不使用状態にあります。
これは、2008年6月末~7月初めに SieBot というコモンズを主活動地にする Bot により、多数の ja のカテゴリページに Commonscat が、 CommonscatS や CommonscatN の存在を無視して貼りまくられ、結果テンプレートの重複が多発したことへの暫定対処によるものです。

SieBot の一連の Bot 活動は、 Commonscat がまだなかった多くのカテゴリページへの Commonscat 提供に貢献した一方で、多数のカテゴリページにおける表示の整然性を損ねることになり、ページの美観的にはひどいものでした。
結果、これら重複テンプレートの整理や表示の調整、間違ったリンクの修正に多量の人手が費やされたことは、地味ながらも記憶されておくべきものです(実施者の功績云々ではなくて、そういう面倒で無駄な営為があったことが)。
その後、 ja に SieBot は現れていません。


先週後半、こんどは BotMultichill という dewp を主活動地にする Bot により、カテゴリページに使用された CommonscatN がすべて Commonscat に貼り替えられ、そして2枚以上貼られた Commonscat の2枚目以降が "redundant template" であるとしてすべて除去されてしまいました。
CommonscatN の呼び出し元は現在、標準名前空間がほとんどとなっています。

Commonscat 系テンプレートが2枚以上貼られているページがあったというのは、そのページにおいてそれなりの理由があってのことです。
そういう個別の特殊事情を考慮しないで一律にこういう Bot 作業を実施したというのは、いったいどういう了見なのでしょう。
今回のテンプレート置換作業にあたり、事前ないし事後の告知や議論が ja のテンプレートのノートページなりウィキプロジェクト Bot なりでなされた形跡は見つけることができませんでした。
BotMultichill の会話ページに至っては dewp への事実上のソフトリダイレクトです。


言語間リンクを語る際によく問題にされるように、記事でもカテゴリでも、相互の言語間リンクが張られているからといってその主題が扱っている範囲は各言語版で必ずしも同じではありません。語義からして微妙に異なっていることも別段珍しくないのです。
ですから、コモンズへのリンクでも、2つ以上のカテゴリへとリンクする必要がある場合というのは確実に存在し、またそういう事例は排除されてはならないはずです。

そういった基本的な問題意識や、クレームに対応しうる各言語の語学力、各プロジェクトにおける実際の運用状況の把握などなくして、 Bot に限らず他言語版のプロジェクトへと作業範囲を闇雲に拡大すべきではありません。
これらの資質を1つでも欠いたままそれを行うのは危険というものです。

今回の BotMultichill の Bot 活動は、言語間の相互運用性の確保を主に指向しているように見えます。いずれは SieBot が過去に一部試みたように、 Bot による Commonscat のメンテナンスまでも視野に入れているのでしょう。

しかしそこに、各言語版の利用者の顔は見えるのでしょうか? pywikipedia のローカライズもしないまま、一定の利用実態のある使い方をその言語も解さぬ輩が「余計なもの(和訳)」として切り捨ててしまう強権が、多言語 Bot の飼い主にはあるというのでしょうか?

Bot スクリプトの欠陥で、正しい言語間リンクを貼っても貼っても Bot に剥がされる事例があります。多数の相互リンク網の中にイレギュラーを検出する仕組みでは、たった1つのプロジェクトにて正しく修正されたものさえ、再び誤りへと差し替えられることが、現実に起こり得るのです。

(主に Bot を用いた)多言語間の斉一というのは、一見多様性の尊重と克服への試みのようにも見えますが、その意に反して多様性の排除と圧殺につながる可能性をも秘めていると思うのです。
Bot の運用者にはより慎重な対応を望みます。

コモンズの自動翻訳テンプレート

2008-12-11 03:41:06 | 機能・ソフト等
コモンズの画像ページで CC-3.0 系のライセンスタグが、ライセンスの文面が日本語で表示されるようになりました。
既に気付いている方もおられるかもしれません。
より正確には「日本語で」ではなく、「オプションで設定している言語で」表示されます。

これはどうやら、これら CC 系テンプレートに Template:Autotranslate というメタテンプレートが実装されたからのようです。
11月最終週の週始めに、一斉にこれらテンプレートに編集が入っています。

コモンズの主要なテンプレートには、各言語の訳文がサブページによって用意されていて、画像を二次利用などしたい閲覧者は任意の言語の訳文へのリンクをクリックして、これら訳文を適宜参照できるようになっています。

これを自動化したんですね。
閲覧者がどの言語のユーザインタフェースを用いているかをサーバ側が見て、それによって表示する言語(のサブページ)を自動的に切り替える、という寸法です。

各言語限定のプロジェクトとは違い、流石は多言語混在・連携のコモンズならではの機能といえるでしょう。


ところでCC系の原則すべてのテンプレートに Autotranslate が実装されたのに、冒頭で「CC-3.0 系」と書いたのは、 2.0 系や 1.0 系には日本語の訳文サブページが現時点で未整備だからです。
該当する言語のサブページがない場合は、既定値として英語の文面が表示されます。

なお、 GFDL 系のテンプレートにはまだ Autotranslate は実装されていません。
CC は各国に支部があるなどライセンス発行元が多言語対応していますが、 GFDL は英語を唯一の正文とし、各言語訳はあくまで参考訳であるため、英語の文面を外すわけにはいかず、さりとて各言語表示を新たに付加すればタグの面積が大型化してしまう……などの事情があるのかもしれません。

   *  *  *  *

そういえば最近、コモンズの画像ページにおける記述内容のセクション分けに、
多くの人が ==Summary ==, ==Licensing == などと書いているところを、
== {{int:filedesc}} ==, == {{int:license}} == と書いてある事例を見かけました。
日本語環境ではそれぞれ、節の名前は「ファイルの概要」「ライセンス」と表示されます。

MediaWiki にそのようなマジックワードがあるようで、詳しい表示例集はまだ見つけていませんが、
meta:Help:System message#Transclusion に「"{{int:xxx}}" というのはシステムメッセージを利用者が設定している多言語で表示するものだ」というようなことがちょろっと書いてありました。

こいつは使える! とばかり、コモンズ画像の査読やカテゴリ変更の際に使いまくっています。

オープンソースのビデオコーデック Theora 1.0 がリリース

2008-11-05 19:45:39 | 機能・ソフト等
ロイヤルティフリーの動画コーデック「Theora 1.0」公開
http://internet.watch.impress.co.jp/cda/news/2008/11/04/21402.html
 (INTERNET Watch 2008年11月4日 13:37)

HTML5を支えるOSSのビデオコーデック「Theora」が正式リリース
http://journal.mycom.co.jp/news/2008/11/05/006/
 (マイコミジャーナル 2008年11月5日 09:32)

Xigh.org、オープンソースのビデオコーデック「Theora 1.0」をリリース
http://sourceforge.jp/magazine/08/11/05/0629234
 (SourceForge.JP Magazine ニュース 2008年11月5日 15:27)

The Xiph.Org Foundation announces the release of Theora 1.0.
http://www.xiph.org/press/2008/theora-release-1.0/
 (Xiph.Org Foundation 2008年11月3日)

Theora はまだまだ普及しているコーデックではありませんが、 Firefox 3.1 では Vorbis と Theora がネイティブサポートされる予定ですので、再生環境に関しては多くの人が気付かぬうちにぐっと普及していた…ということに近い将来なりそうな予感です。


フリーなメディアを扱うウィキメディア・プロジェクトにアップロードが可能な動画ファイル形式は現在のところ、ビデオコーデックに Theora を使用した Ogg だけとなっています。
Ogg が一般に普及することは、ウィキメディアにある動画をより多くの人に観てもらえる機会が増えることですので、一ウィキメディアンにとってとてもありがたいことです。

----
関連項目
Theora - Wikipedia
http://ja.wikipedia.org/wiki/Theora
Help:音声・動画の再生 - Wikipedia
http://ja.wikipedia.org/wiki/Help:音声・動画の再生
Commons:ファイル形式 - Wikimedia Commons
http://commons.wikimedia.org/wiki/Commons:ファイル形式
Help:ビデオ変換 - Wikimedia Commons
http://commons.wikimedia.org/wiki/Help:ビデオ変換

「goo Wikipedia記事検索」ブログパーツが消失中

2008-10-04 23:13:55 | 機能・ソフト等
何日か前から、「goo Wikipedia記事検索」のブログパーツが行方不明になっています。


ブログパーツサポートリストのページで「goo オフィシャル」でソートすると、今でも
goo Wikipedia記事検索
http://wpedia.search.goo.ne.jp/blog_parts.html
膨大なWikipediaの記事を、ランキングと検索窓の二種類から探せるブログパーツです。

の説明文が出てきます。
ところがこのリンクを踏むと、
指定されたページがみつかりませんでした。
※このページは10秒後にgooトップページに自動転送します。

と表示されます。

このブログパーツが期間限定であるという注記があったようには記憶していませんし、また近日このブログパーツが廃止されるという告知を見た覚えもありません。


まあ、自身は goo のミラーサイトではなく本家を頻繁に訪れてますし、ブラウザの検索バーの検索サイト選択にもwpを組み込んであるから、どうでもいいんですが。

それにしても最近、消失ネタばっかり…