BLOG 思い遥か

日々新たなり/日本語学2020

基幹語彙

2020-10-25 | 日本語学2020

基本語彙に、>「出現頻度が高くて不規則である語」というのは、「基本語彙」に含めていい  というコメントを受け取った。不規則である語が、なにを指しているか。不明であるので、しばし考える。コメントの中に、さらに、>日本人は日本語を使いなれているので、「出現頻度が高くて不規則である語」というものが見落とされがちなので、非常にしつこい話ですが、「そこはコンピュータでチェックしろよ!」  というのを見て、何か思惑があるようであるから、コンピュータでチェックして、品詞分解をすると、してみて、とんでもない品詞分解ツールがあるから、精度があがってきたものの、それがわたしたちの記憶とどうかかわるか。現実の結果がわからないことになる。ここで記憶というのは、規範をもとうとする言語意識のことで、そう考えるところのものである。
さて、そうすると、基幹語彙という考え方があって、これですると、そのチェック機能が働くのだろうか。


https://core.ac.uk/download/pdf/234725162.pdf
語彙調査と基本語彙
著者 林 四郎
雑誌名 電子計算機による国語研究 巻 3
ページ 1-35  発行年 1971-03
シリーズ 国立国語研究所報告 ; 39

大ざっぱに基本語彙といわれる概念をもうすこし細かく分けて,概
略次のように定義しつつ五つの概念を立ててみたい。
 (1)基礎語彙 意味の論理的分析によって求められた半人工的な語彙
 (2)基本語彙 特定目的のための「○○基本語彙」
 (3)基準語彙 標準的社会人としての生活に必要な語彙
 (4)基調語彙 特定作出の基調を作るのに働く語彙
 (5)基幹語彙 ある語集団の基幹部として存在する語彙




日本語語彙論  基本、基礎、基幹
2013-10-15

基本語彙、基礎語彙の違いは何か。
基本語彙が明らかにされ、統計処理によって示される上位語を重要としてとらえられるようになった。

それに対して基礎語彙はそれまでの研究者や教育家によって選定された語彙についてそれを受け継ぐ形で用いられてきた。
辞書などにも基礎語彙として示す場合には辞書の編集者によって選定基準が発案されて示されている。

基礎語彙に基本語彙を組み込めばともに必要なあるいは重要な語彙として成り立つ。
とくに基礎語彙は語学学習に必要でそのうえ日常使用される語が選ばれ、重要語として位置付けられる。

日本語教育で日本語の基礎語彙を日本語研究者、日本語教育家に2000語をめどに選定してもらってそれぞれの選定された2000語を重なる語と重ならない語で選り分けたところ、どうしても約6000語になってしまうということがあった。
それぞれの重要とする2000語の基準が異なったためであるが、そのなかには漢字の語彙とカタカナの語彙とが入り組み合った事情もあったようである。基本語彙という場合にはある資料のまとまりをとるのでそのようなことは起こらない。

基本語彙について
基礎語彙に対して、基本語彙というのは、語彙調査をした結果、使用率が大きい語のグループを言う。
基礎語彙に比べて客観的であるといえる。

使用率の高い1500語とか、2000語とか5000語を習得の目的に選んだりする。
基礎語彙と、基本語彙を組み合わせれば学習語彙がわかってくる。

基本語上位(1,000語)のカバー率は、英語約80%、中国語と朝鮮語約73%、日本語約60%といわれ、日本語は基本度が低い。
なお、漢語は「異なり語数」で最も割合が高く、和語は「延べ語数」で最も割合が高い。

基礎語彙について
これだけ知っていれば、生きていけるとして、選ばれた語で、選んだ人の主観が反映されている。

基礎語彙の考え方は、イギリスのオグデン Charles Kay Ogdenが選出した Basic English 1930 がある。
オグデンは日常に必要な語を850語選んだ。

日本では、土井光知1933年に「基礎日本語」として1000語の選定をした。

基幹語彙について
上の二つに対して、基幹語彙という考え方を、林四郎氏が提唱している。
基幹語彙について
 上の二つ、基礎語彙、基本語彙に対して、基幹語彙という考え方を、林四郎氏が提唱している。
 基幹語彙とは、ある資料の基幹となる語彙のことで、林氏は国立国語研究所による新聞の語彙調査をもとに、政治、経済、文化などの分野別に使用回数の多い語を取り出した。それぞれの語が複数の分野で出現度の高いものを《深い》としている。そして「幅が広く浅いものを」を基幹度が高いとしています。次は、その、一例。
  動詞  いる ある する いう なる つく
  指示詞 この これ こう ここ これら
  接続詞 しかし そして だから および


1 コメント

コメント日が  古い順  |   新しい順
不規則性・出現頻度 (Maria)
2020-10-26 13:19:01
Maria です。
毎度毎度不規則活用動詞の例を挙げていると飽きられるので、ちょっと切り口を変えることにします。
名詞では、「漢語は『ご』」「やまとことばは『ご』」という一応のルールがあるわけですが、「お作法」「お赤飯」「お線香」「お佛壇」といった例外があります。「おズボン」「おタバコ」「おビール」はどう解釈したらいいのでしょうか。
「イチ」は漢語、「ひと」はやまとことば、というルールもありますが、「ひと波瀾」「ひと騒動」「ひと悶着」などの例外があります。
「大」は漢語で「ダイ」、やまとことばで「おお」ですが、漢語の「地震」の「大地震」は「おおぢしん」で、「騒動」の「大騒動」は「おおそうどう」です。
このあたりは、社会的なコミュニケーションに必要な「基本語彙」(おそらく三万五千語から五万語くらいの辞書で網羅できる。ただし地名・姓・人名のような固有名詞を除く)として、少なくとも九十九パーセントは明らかになるので、「これは基本語彙なのかどうなのか」という話に注力するのがいいのではないか、と思います。
現在の商業文化においては、「国語国文学は、実学ではない」(「終わったコンテンツ」、すなわち「オワコンである」)という偏見ないし誤解ないし誤った思いこみがあるのではないか、と憂慮しています。
「国語屋が本気出したら怖いんだぞ」というのは、産業界に知らしめておいた方がいいのではないか、と思います(つーか、「研究費出せよ」と言いたい)。「のばなしなんねぇ」とか「市中虎」みたいな人って、国語国文学方面にはウロウロしていらっしゃると、日本語処理分野に興味を持ってから身に染みました (-_-;)。
とある現場で、新人が先輩の机の上に辞書が置いてあった(机の上に立ってた辞書が十冊くらいはありました)ので、「すいません、辞書お借りします」といって手に取ろうとしたら、「ダメッ! まだ読んでないからっ!」と叱られたという話を聞きました。うん、普通の人にとっては、辞書は「引く」ものであって「読む」ものじゃないよね(^_^!)。
「そういう用例は、コレコレの作品のドコソコにある」というのが、頭に入っていらっしゃる方もいらっしゃいました。「すごいですね」と言ったら、「特殊な用例だから覚えているだけであって、そんな大したこっちゃない」と真顔で言われて「勝てない …… orz」と思いました。身内すずえの『ガラスの仮面』ではありませんが、姫川亜弓とか北島マヤみたいなのが同じ舞台に立っている感じです。コンピュータ持ってるから、なんとか平常心を(つーか、正気を)保っていられる部分があって、「国語国文学は身体に悪い」と思っています。

そういえば、「地震」を「なゐ」という地方もあって、有感地震は「地震(じしん)」で「起きた」と云い、震災クラスの地震は「大地震(おほなゐ)」で「降(ふ)る」だという話もあります。
とりあえず正規形を網羅しておいて、「例外にあたる部分はどうなっているか」に着目するというアプローチはあると思います。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。