BLOG 思い遥か

日々新たなり/日本語学2020

日本語カバー率の誤解

2021-10-28 | 日本語学21

基本は重要度を意味することができる。基本語彙はまさに重要な単語の集まりとして設計できる。資料の語の項目を頻度順位で表すことでその重要性ははっきりする。繰り返し出てくる単語を学習の優先順位に学ぶということであるから、効率、効果的である。キーワードとなってまれに出る語を重要でないとするのでもない。
その様子は文字における漢字制限に現れた。当用漢字を1850字と定めて言語政策の一つにした35年間の文字遣いは、漢字を用いる、それを重要度のあるものとした。しかし1981年に常用漢字1945字の制定で、すべてが重要度を同じとしたものでもなかったことを再び見直して、およそ30年後には2136字となった。

さて、頻度率による語の選定はカバー率として説明される。その統計解釈は言語によるより分野によってさまざまであり、一覧で語られるところは、日本語では一般的にとらえがたい。
そのデータの一つ。

上の表は「語数とカバー率」の表ですがhttps://nflrc.hawaii.edu › pbllrepo › uploads › Ne... PDF
これは、これらの言語では、語彙調. 査に基づいて使用率順に並べた上位1000語を知っていれば、一般的な文章や放送の. 80%が分かるという意味です。では、日本語は ...

出典は、『図解日本語』沖森卓也・木村義之・陳力衛・山本真吾著 三省堂 2006 p.82 より 作成されたものであるが、さらにその元データが何かというと、国語研究所、日本語の語彙と研究、日本語教育指導参考書と見える。102ページより引用。
>英語・フランス語・スペイン語の3言語についてはモスクワ国立言語研究所の調査(南博『島島術』に紹介されたもの)によったが,冠詞・前置詞・代名詞などの機能語は除外していると考えられる。中国語については,柴垣芳太郎氏らの調査によった(『中国語学事典』のⅧ語彙篇の〔1〕中国常用語彙)。これは「的」「了」などの助詞,「会」r要」などの助動詞を算入している。日本語については,国立国語研究所『現代雑誌九十種の用語用字(1)一総記および語彙表一』の表1「90誌全体でその順位までの見出し語が延べ語数のどのくらいの割合を占めるか」によった。

ここにあるように資料はそれぞれの数値を対照しているに過ぎない。比較にならないことを注意しているにかかわらず、次のようなまとめをしている。
>なお,調査にいろいろ差があることを承知しつつ推論をすれば,英仏西3言語と比べると,日本語はやはり効率が低い言語ということになるだろう。日本語では,10,000語で91.7%のカバー率になることが報告されているが,これは,英仏西3言語の上位5,000語のカバー率よりも低いのである。
> 以上をまとめると,日本語では語彙面で90%o以上の理解を可能にするためには,上位約10,000譜を覚えなければならず,基本語彙というときにも,最低5,000~7,000語が必要になるということである。

https://repository.ninjal.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=1249&item_no=1&page_id=13&block_id=21
現代雑誌九十種の用認用字 第一分冊  総記および語彙表一 昭和37年…9月15日 初版
kkrep_021.pdf  26ページより引用
>語嚢表に掲げた見出し語の総量は約七千二百である。標本異なり語数は約四万だったから,その一割八分ほどを示したことになる。更に調査対象の語志彙(これは別冊の分析編で推定する予定)に比べれば,その一割を下翻るかも知れない。しかし延べ語数の観喜からすれば,上記七千二百語の範囲で本文の八割六分ほどがまか
なわれる。(助詞・助動詞を除いた部分について言っている。それらをも含めれば,この報告所載の語で本文がまかなわれる割合は更に大きくなる。)

助詞、助動詞を除いた部分について言っている。それらをも含めれば,この報告所載の語で本文がまかなわれる割合は更に大きくなる、という、報告内容は、おで、もっと注意されるべきであるが、何より漢字語彙のいわば語数をどう見るかであろう。語構成を学習することからすれば、つまり漢字学習のことで、ここに見える漢字は制限漢字であるので、その理解度が変わってくる。

上記の報告を用いて日本語のカバー率が問題であるとする発言には、一方で覚えやすい欧州諸言語のかかわりというカバー率の捉え方に、比較の材料をとろうとしている。いずれも意図的にも見えることで、詳しく対照すること、それは言語によるデータの語の母数、ジャンルを明らかにすることが必要である。日本語調査はより精度を持ったものと考えてよい。



日本語教育学入門書の語彙⑤ 基本語彙カバー率
2019-08-26 | 日本語語彙
漢字語彙はとくに難しいので、日本語での漢字の習得には工夫があることを教育実践として推測すればよい。基本語彙の考え方は出現率による統計値にあるが、語彙の数値を結果による比較をする場合は、とくに気をつけなければならない。使用頻度が高い基本語彙を、カバー率からみて上位語の選定にするのはよいとして、言語によって上位1000語の語彙が単純比較されるだけでは、その数値の示すことがらが具体的にどのような違いであるかを説明しないことになる。日本語文章のカバー率は数値が報告されてきたものと記述での相違がある、1000語で半数は未知語というのは誤解がある。



https://harmony-bear.at.webry.info/200608/article_22.html
2006年08月23日
>現在の日本語教育では、基本語彙の考え方を採用しているテキストが多いようです。
使用頻度の語彙数に対して一般的なコミュニケーションにおける語の何%を占めているかを示す数値をカバー率といいますが、他の外国語に比べると日本語のカバー率は低いそうです。

日本語と外国語の基本語彙
上位3,000語のカバー率は英語が90.0%、フランス語は92.8%、
中国語は86.8%、朝鮮語は85.0%に比べて日本語は75.3%です。
日本語のカバー率が90%を超えるのは約10,000語となります。
この事から日本語を学習する外国人はやっぱり大変なのねー。と思っていましたが、そうでもないようです。
カバー率が高いということは、1つの単語に対してたくさんの意味を持っており、学習者はその状況や文章に応じてたくさんの意味の中から適した意味を選ばなければならない。
例えば英語の「take」には「~を取る」をはじめ「持って行く、連れて行く」、「(時間を)費やす」、「買う」、「食べる」、「飲む」・・・・・・熟語も含めるとかなりの意味がありますね。
これは私にも経験がありますが、知っている単語ばかりが使われている文なのに意味がつかめないという事が起きます。
その点日本語は意味を知っていれば、文の意味が理解できることが多いということなのでしょう。
日本語母語話者の使用語彙や理解語彙が多く感じるが、覚えてしまえば使うのは簡単なのかも知れませんね。
いずれにしても、たくさんの意味や単語を覚えないと、外国語を使いこなせない訳ですけど・・・
ちなみに平均的日本語母語話者の理解語彙は4万~5万語程度、使用語彙は1万5千~2万語程度です。
そんなにたくさんの単語を理解できているなん自分でもてびっくりです。
日常使っている語も1万5千語以上なんですね。




http://www.nakaco.com/mizumon/flood/kanazawakouzui/cover-rate/cover-rate.htm
>(50%の値)
 統計学的には「カバー率」50%として求めたものが、その母集団の中で最も頻度が高く、ありそうなものとして選択され、求める数値です。犀川の基本高水流量の選択例を変形して、24個の314gのボールに例えてみます。大きさが547mmから1,741mmにばらついていますが、大きすぎるものや小さすぎるものの数は少なく、最も集中しているのが938mm近辺のボールで少なくともこれよりも小さいボールが50%でした。最もありそうな大きさとして938mmを選ぶことが統計学的に最もありそうな選択ということになります。

当用漢字表(1946年〈昭和21年〉11月16日)
当用漢字別表(1948年〈昭和23年〉2月16日)
当用漢字音訓表(同)
当用漢字字体表(1949年〈昭和24年〉4月28日)
当用漢字改定音訓表(1973年〈昭和48年〉6月18日)
1981年(昭和56年)、当用漢字を基にしつつ緩やかな「目安」である常用漢字表が内閣から告示され、当用漢字表は廃止。
2010年(平成22年)11月30日、平成22年内閣告示第2号として告示、2136字、4388音訓(2352音、2036訓)から成る。


コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。