ITpro の記事によると、Googleは、2008年から行なってきたオンライン百科事典 Wikipedia の翻訳活動で、1600万語以上の英文記事を、少数言語に翻訳できたと発表したそうだ。そして、その少数言語の中に、アラビア語も含まれていた…国連の公用語でもあるのに、なぜ?
しかし、そのもとの英文記事を見ると、英語版の記事の量を1.0とした場合、アラビア語の記事の分量はたったの0.3で、0.5の朝鮮語やヒンディー語より少ない。ウィキペディアの発展状況からだけ見ると、確かに弱小言語なのかもしれない。(ちなみにトップはドイツ語の2.8、次いでフランス語の2.2、ロシア語の1.9、日本語はその次の1.5 である。日本語の記事は英語より多かったのか…。)
また、記事によると、翻訳には、人力のほか、Translator Toolkit (翻訳者ツールキット) を使ったとのことであるが、アクセスしても、使い方がさっぱりわからない。ただ、チャットの機能があることだけはわかった。
【追記 2010/07/24】 「日本語の記事は英語より多かったのか…」などと書いてしまったが、コメント欄にむじな様よりご指摘。これは、「「書きかけ表示がない記事の数」だけの統計で、英語の場合は相当内容を書き込まないと、「書きかけ(stub)」指定になってしまうので、ノンスタッブ項目だけに絞ると英語がたまたま少なくなってしまうだけ」とのこと。
ご紹介いただいたList of Wikipedias によれば、すべての記事の合計が100万を超えているのは、英語とドイツ語だけで、英語は3,359,002件と、次点のドイツ語1,096,791件の3倍以上という圧倒的記事量を誇っている。
しかし、そのもとの英文記事を見ると、英語版の記事の量を1.0とした場合、アラビア語の記事の分量はたったの0.3で、0.5の朝鮮語やヒンディー語より少ない。ウィキペディアの発展状況からだけ見ると、確かに弱小言語なのかもしれない。(ちなみにトップはドイツ語の2.8、次いでフランス語の2.2、ロシア語の1.9、日本語はその次の1.5 である。日本語の記事は英語より多かったのか…。)
また、記事によると、翻訳には、人力のほか、Translator Toolkit (翻訳者ツールキット) を使ったとのことであるが、アクセスしても、使い方がさっぱりわからない。ただ、チャットの機能があることだけはわかった。
【追記 2010/07/24】 「日本語の記事は英語より多かったのか…」などと書いてしまったが、コメント欄にむじな様よりご指摘。これは、「「書きかけ表示がない記事の数」だけの統計で、英語の場合は相当内容を書き込まないと、「書きかけ(stub)」指定になってしまうので、ノンスタッブ項目だけに絞ると英語がたまたま少なくなってしまうだけ」とのこと。
ご紹介いただいたList of Wikipedias によれば、すべての記事の合計が100万を超えているのは、英語とドイツ語だけで、英語は3,359,002件と、次点のドイツ語1,096,791件の3倍以上という圧倒的記事量を誇っている。