日本語の語彙調査を本格的に語彙として実施したのは戦後の国語研究所である。それはその後の語彙調査を進めることとなった画期的なことであった。現代雑誌九十種の用語用字というもので、日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。日本語をおおよそ4万語であるとして、日常語の語数をみることができるようになった。これは理解語彙の大きさを見積もったことになる。そのうちに使用語彙があるのであるが、読んだり書いたりする使用語彙はそれよりも少なくなるので、個人使用に限る言い方では注意がいる。使用語彙という用語が紛らわしいので表現語彙また発表語彙ということがある。語彙調査はさまざまな用途、目的に応じて行われるようになってきたので、その結果を扱うときには調査の実態を知る必要がある。よく取り上げられるデータが、いつどのような方法で、何を範囲とし基準としたものかを知る。
① 国立国語研究所(1984)『日本語教育のための基本語彙調査』(6,103 語)〈「基本調査」〉
② 国立国語研究所(1982)『日本語教育基本語彙七種比較対照表』(6,195語)〈「七種対照」〉
「国立国語研究所の語彙調査の歴史と課題」 - 東京大学|大学院教育学 ...
www.p.u-tokyo.ac.jp/sokutei/pdf/vol06/p168-186.pdf
>歴史と課題の2つについてお話ししたいと思います。
語彙調査について,国語学や日本語教育で,どういうとらえられ方をしているか,代表的なものを2つ挙げました(資料1)。1番目は『国語学大辞典』,これは,国語学会(現日本語学会)で編集したもので,執筆者の水谷静夫氏は,語彙調査を戦後積極的に推し進めてきた人物です。彼の定義では,語彙調査とは「言語表現のある集合について用語情況を,どんな語がどれほど使われているかの観測を中心に調べること」となっています。簡単に言うと,使用頻度,あるいは使用率の観測をすることで,その結果は語彙表という形で出てきます。2番目は,やはり語彙調査に深くかかわった石綿敏雄氏の定義で,1番目よりもう少し広いとらえ方をしています。2行目の「語彙の構造についての計量的な調査研究」は,前述の使用頻度,使用率を,もう少し学問的に言ったものかと思います。計量的な調査研究とは,使用率を調べたり,語彙表を作ったりするだけではありません。係り受けの関係や語構成について,あるいは,語の分布――カバー率なども含めた総合的なものを称して語彙調査をとらえています。
語彙調査データ コーパス開発センター -Center for corpus development-
www.ninjal.ac.jp/corpus_center/archive.html
5 件のアイテム - 昭和の語彙調査データ 現在まで公開されてきた言語資源データを ...
現代雑誌200万字言語調査語彙表. 著 者 ...
現代雑誌の語彙調査-1994年発行70誌-【国立国語研究所報告121】. 著 者 ...
語彙力調査のページ
www1.odn.ne.jp/drinkcat/quiz/
日本語語彙力調査. ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作っ ... 調査方法の解説. 辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。 管理人の場合は左上に掲載 ...
>日本語語彙力調査
ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作った発端です。
正確を期するには1500問ぐらい確かめないといけないのですが、さすがに多すぎるとやってられません。
問題数は少なめなので誤差はありますが、興味がありましたら確かめてみてください。
30問 誤差12.3%
50問版 誤差9.5%
100問版 誤差6.7%
参考:小学館日本語新辞典(2005年版)
調査方法の解説
辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。
管理人の場合は左上に掲載されている単語と決めて調べた。
この調査では同様に『小学館日本語新辞典』の、各ページの左上に掲載された単語を収録した。
なお、その文字で問題を作りづらい場合は、隣接する単語で置き換えていることを断っておく。
(日本語語彙論6 再説)
日本語語彙のカバー率を見る。
日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。
① 国立国語研究所(1984)『日本語教育のための基本語彙調査』(6,103 語)〈「基本調査」〉
② 国立国語研究所(1982)『日本語教育基本語彙七種比較対照表』(6,195語)〈「七種対照」〉
「国立国語研究所の語彙調査の歴史と課題」 - 東京大学|大学院教育学 ...
www.p.u-tokyo.ac.jp/sokutei/pdf/vol06/p168-186.pdf
>歴史と課題の2つについてお話ししたいと思います。
語彙調査について,国語学や日本語教育で,どういうとらえられ方をしているか,代表的なものを2つ挙げました(資料1)。1番目は『国語学大辞典』,これは,国語学会(現日本語学会)で編集したもので,執筆者の水谷静夫氏は,語彙調査を戦後積極的に推し進めてきた人物です。彼の定義では,語彙調査とは「言語表現のある集合について用語情況を,どんな語がどれほど使われているかの観測を中心に調べること」となっています。簡単に言うと,使用頻度,あるいは使用率の観測をすることで,その結果は語彙表という形で出てきます。2番目は,やはり語彙調査に深くかかわった石綿敏雄氏の定義で,1番目よりもう少し広いとらえ方をしています。2行目の「語彙の構造についての計量的な調査研究」は,前述の使用頻度,使用率を,もう少し学問的に言ったものかと思います。計量的な調査研究とは,使用率を調べたり,語彙表を作ったりするだけではありません。係り受けの関係や語構成について,あるいは,語の分布――カバー率なども含めた総合的なものを称して語彙調査をとらえています。
語彙調査データ コーパス開発センター -Center for corpus development-
www.ninjal.ac.jp/corpus_center/archive.html
5 件のアイテム - 昭和の語彙調査データ 現在まで公開されてきた言語資源データを ...
現代雑誌200万字言語調査語彙表. 著 者 ...
現代雑誌の語彙調査-1994年発行70誌-【国立国語研究所報告121】. 著 者 ...
語彙力調査のページ
www1.odn.ne.jp/drinkcat/quiz/
日本語語彙力調査. ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作っ ... 調査方法の解説. 辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。 管理人の場合は左上に掲載 ...
>日本語語彙力調査
ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作った発端です。
正確を期するには1500問ぐらい確かめないといけないのですが、さすがに多すぎるとやってられません。
問題数は少なめなので誤差はありますが、興味がありましたら確かめてみてください。
30問 誤差12.3%
50問版 誤差9.5%
100問版 誤差6.7%
参考:小学館日本語新辞典(2005年版)
調査方法の解説
辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。
管理人の場合は左上に掲載されている単語と決めて調べた。
この調査では同様に『小学館日本語新辞典』の、各ページの左上に掲載された単語を収録した。
なお、その文字で問題を作りづらい場合は、隣接する単語で置き換えていることを断っておく。
(日本語語彙論6 再説)
日本語語彙のカバー率を見る。
日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。