いくやの斬鉄日記

オープンソースからハイスクールフリート、The Beatlesまで何でもありの自称エンターテインメント日記。

Anthyのコーパス収集のお願い 追加その1

2007年09月25日 20時46分55秒 | 言語入力機構
まず前提ですが、必ずご自身の文章のコーパスをお送りください。例えば何かの本を写したとか、そのようなコーパスが混じることは避けてください。

コーパスの例をもう一度見ていただきます。
anthy-9100b - |しゅうせいした|つもりの| |修正した|つもりの|
anthy-9100b - |りりーすしました| |リリースしました|
anthy-9100b - |ごしてき|ありがとう|ございました| |ご指摘|ありがとう|ございました|
anthy-9100b - |さきの|めーるの|とおり| |先の|メールの|とおり|
これら一つ一つには著作権は発生しないと考えます。よって、ライセンスも適用されません。
送っていただいた時点でpublic domainにすることに同意したとみなします。

Anthyのソースとともに再配布され、同じライセンス(public domainにライセンスというのもおかしいですが)で再利用される可能性もあります。当然ですね。

送っていただく前に、必ず内容を確認してください。いただいたものをノーチェックでソースに入れるということはしませんが、私に見られたら困る個人情報などは事前に削除しておいてください。もちろんそのような内容が含まれていたからといって、公開したりはしませんが。

ログを書き出すファイルは事前に作成しておかないとダメのようです。
$ touch ~/.anthy-corpus.txt
などを実行してください。

また何かあれば追加します。

追記:
すみません、corpus.1.txtはpublic domainです。
あと、↑をちょっといじりました。

さらに追記:
送っていただく分はpublic domainとさせてもらうことにしようと思います。

さらに追記:
public domainで個人を特定する必要はないので、メールアドレスは不要になりますね。
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 今日やったこと | トップ | コーパス集めの雑感 »
最新の画像もっと見る

コメントを投稿

言語入力機構」カテゴリの最新記事