いくやの斬鉄日記

オープンソースからハイスクールフリート、The Beatlesまで何でもありの自称エンターテインメント日記。

著作物の定義

2007年09月25日 23時18分03秒 | 日記
著作物

これを読んでいただければ、Anthyのコーパスに著作権が発生しないということがご理解いただけますかね。
コメント (2)    この記事についてブログを書く
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« コーパス集めの雑感 | トップ | 第7回 関西 Debian 勉強会 »
最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
落ち着いてガンバレ (Unknown)
2007-09-26 22:16:01
1. 例を挙げて「著作権は発生しないと考えます」と*主張*することは自由ですが、端から見ると「有」とも取られかねない。
コーパスを含めてデータベース等『なにがしかの意図』を持って集められた総体には編集著作権等が生じるとみなされる。個別の行を取り出した場合無いようにも思るが、日本語の場合主語を省略しても通じてしまう場合があるのでcase by caseでグレー。日本語言語処理研究関係で生データを出さずに、統計処理の結果の様な形で流通させる事が多いのは、これらの問題を極力回避しようとする苦肉の策だったりする。
(最近はみんな面倒になって、あえて著作権者のはっきりした新聞データベース等を金で買って済ませるのが多いけど...)
プログラムとデータを別に配布するのも「万が一」汚染された場合の影響を最小限にする狙いも有り。
2. 日本では「パブリックドメイン」はそもそもNG。消滅や無効は有っても放棄は出来ないと考えるのが現行法(解釈は分かれている)。
非常に不明瞭な状態となるため、逆に利用の妨げとなる場合がある。
著作者人格権を行使しない旨、ライセンスに規定するか、今ならクリエイティブコモンズを使うのが次善の策。データにGPLやLGPLが利用できるかは、人により意見が分かれる。
3. 納得出来なきゃ送ってくるな方式は「悪意有る汚染」に無力だし極めて危険(あなたが)。
これは日本と関係なく世界共通。GPLを採用しているフリーソフト等でもpatch等のcontributeに対して、FSFの様に一筆求めたり、クリーンルーム方式で再開発したり(確かQtがそうだと昔聞いた)、自由の獲得にはとかくRMSの様な闘志が必要。
無論Linuxの様に「問題があったら直すよ」方式とか有るけど、一度広まってしまうと修正/回収に要するコストの問題など、政治力やパトロンが無いとそれはそれで別の問題が出る。
(最悪ケツまくってドロンも有だけど..)

いろいろネガティブな事ばかり書いたけど、最後に少しだけ提案
・生データをまとめたダケで出すのは危険なので、同じ物が独立したN人以上の提供者から来たら採用、それ以外は敢えて隠蔽。Nは別途統計的に優位な数値となるよう検討
(時間がかかるので地道に心棒強く)
・人の分離は大変なので、まずは顔の見える奴から引き込む
・念の為、当面anthy本体とは別で様子見
・blogやML等で言ってないで、言語処理や大規模データ系の研究会レベルで意思表明する。
TとかNとかIとかのメーカで燻ってる奴とか懇親会で捕まえると結構個人的に相談に乗ってくれるよ。
おお、 (いくや)
2007-09-26 22:42:43
ブログでは初めてといっていいナイスなアドバイスありがとうございます。

とりあえず、私はコーパス集めを目的にしてるわけではなく、Anthyの変換精度を上げるための手段にしてるだけなのです。そして、そんなに暇でもないので↑のようなことはほとんどできそうにありません。
しかも別にこの道を究めていきたいわけでもないです。
ならいっそやめた方がいいですかね。

public domainがダメなんてことは言われなくてもわかっていて、本人がpublic domainにしたいといってるのだからその意志を尊重しましょう、と思っています。

編集著作権に関しては、発生しないようにバラバラにすることを考えています。

この2つがあれば3番目もクリアになると思ってるんですが、甘いですかね。

どこのどなたかは存じませんが、あなたのような方にコーパスを提供していただくのが一番だとは思います。
もしあなたが私の立場なら、どうなさいますかお聞かせいただけますか。

コメントを投稿

日記」カテゴリの最新記事