授業コーパス科研のメモです。
CHILDESは子供の第1言語習得研究から始まったコーパス・システムです。そこでは多くの研究者がメンバーになって自分の収集したデータを提供したり、他の研究者の公開したデータを利用したりといった合理的な研究が行われています。
しかし、データが公開されたり、共有されたり、ということには必然的に多くの問題が予期されます。そのへんのことを今、調べているところですが、以下は、調査者が被調査者に収集したデータをどの程度まで使用してもよいのかを問う(あるレベルまでの使用許可をお願いする)、そのレベルを記述したものです。CHILDESのほとんどのデータは(2)までで実施されているそうですが、データの種類によっては厳しい使用制限も仕方がないのですね。
被調査者に許可を得るデータ・アクセスの制限分類(http://talkbank.org/share/levels.html)
(1)無制限:匿名化の処理をすることなしにウェブを通して文字化資料とメディアにアクセスすることを許可する。
(2)文字化資料における名字と住所の匿名化を要求出来るレベル:これにより、最少の作業で相互作用のほとんどを保持することが可能。
(3)文字化資料における十全の匿名化:名字、住所(地域)に加えて、名前も匿名化することを要求出来るレベル。プライバシーを守る上ではそれほど重要ではないが、ある場合には必要になるだろう。(訳者注:英語の場合)
(4)音声の匿名化audio bleeping:匿名部分を部分的または全体的に信号音に置き換えることを要求することが出来るレベル。
(5)映像の不明瞭化video blurring:ある場合には映像を不明瞭化する処理を施すことを要求出来るレベル。これは技術的に実行が困難であり、実際的とは言えない。むしろ、パスワードを設定するなどの別の方法が望ましい。
(6)パスワードの設定:実行が容易だが、アクセスを制限することになる。
(7)非公開宣誓書:極端に保護を要求する場合には、パスワードの設置に加えて、非公開の宣誓書に署名を要求出来るレベル。非公開宣誓書では、個人を特定するいかなる言及についても出版を禁止し、データのコピーは禁止される。
(8)管理された視聴:直接のオンラインでの監視下の管理された条件でのみ視聴が可能であることを要求出来るレベル。このレベルは非常に個人的あるいは自己開示的な性質を持ったデータの場合(e.g.精神治療インタビュー)に用いられる。
?(9)アーカイブ(保管)のみ:データは視聴可能ではなく、もともとの調査者だけが使用する一般的なシステムのフォーマットで保管される。調査者は、分析システムの道具を用いることを許されるが、データには実質的には貢献しない。(訳者注:ここの意味はよくわからないです。どなたかご教示を!)
CHILDESは子供の第1言語習得研究から始まったコーパス・システムです。そこでは多くの研究者がメンバーになって自分の収集したデータを提供したり、他の研究者の公開したデータを利用したりといった合理的な研究が行われています。
しかし、データが公開されたり、共有されたり、ということには必然的に多くの問題が予期されます。そのへんのことを今、調べているところですが、以下は、調査者が被調査者に収集したデータをどの程度まで使用してもよいのかを問う(あるレベルまでの使用許可をお願いする)、そのレベルを記述したものです。CHILDESのほとんどのデータは(2)までで実施されているそうですが、データの種類によっては厳しい使用制限も仕方がないのですね。
被調査者に許可を得るデータ・アクセスの制限分類(http://talkbank.org/share/levels.html)
(1)無制限:匿名化の処理をすることなしにウェブを通して文字化資料とメディアにアクセスすることを許可する。
(2)文字化資料における名字と住所の匿名化を要求出来るレベル:これにより、最少の作業で相互作用のほとんどを保持することが可能。
(3)文字化資料における十全の匿名化:名字、住所(地域)に加えて、名前も匿名化することを要求出来るレベル。プライバシーを守る上ではそれほど重要ではないが、ある場合には必要になるだろう。(訳者注:英語の場合)
(4)音声の匿名化audio bleeping:匿名部分を部分的または全体的に信号音に置き換えることを要求することが出来るレベル。
(5)映像の不明瞭化video blurring:ある場合には映像を不明瞭化する処理を施すことを要求出来るレベル。これは技術的に実行が困難であり、実際的とは言えない。むしろ、パスワードを設定するなどの別の方法が望ましい。
(6)パスワードの設定:実行が容易だが、アクセスを制限することになる。
(7)非公開宣誓書:極端に保護を要求する場合には、パスワードの設置に加えて、非公開の宣誓書に署名を要求出来るレベル。非公開宣誓書では、個人を特定するいかなる言及についても出版を禁止し、データのコピーは禁止される。
(8)管理された視聴:直接のオンラインでの監視下の管理された条件でのみ視聴が可能であることを要求出来るレベル。このレベルは非常に個人的あるいは自己開示的な性質を持ったデータの場合(e.g.精神治療インタビュー)に用いられる。
?(9)アーカイブ(保管)のみ:データは視聴可能ではなく、もともとの調査者だけが使用する一般的なシステムのフォーマットで保管される。調査者は、分析システムの道具を用いることを許されるが、データには実質的には貢献しない。(訳者注:ここの意味はよくわからないです。どなたかご教示を!)