BLOG 思い遥か

日々新たなり/日本語学2020

語彙の単位体、形態素

2021-10-13 | 日本語学21

語のとらえ方を文法単位におく。語彙単位にとらえるのはその単位体をシフトする。シフトは野球で言えば定位置からずれての守備体勢、はやりのテレワークではシフト勤務になるとフレックス勤務などと用いるから、語彙単位には語を語彙項目とすることがあるのはシフトになるとどうなのか。そこで語彙における語とは何かを改めて議論することが行われなければならない。
コンピュータに入力して計算にかけることが可能となって量的処理をする語彙論では形態をとらえることになった。文法単位体の形態はこれまた文法論のうちにあって語彙単位にとらえるのはその形態をスライドする。シフトと言い、スライドと言い、同じように単位を融通するので気を付けなければならない。
スライドは語義で見ると、slide、 (━する) 横ざまになめらかにすべること。また、そのようにすべらせること。抽象的な事柄についてもいう。「登板ピッチャーがスライドした」 と日国大に見えて、さらには、比例になる、ある数量、比率に対応させて、他の数量を変えること とあるから、文法単位を語彙単位にスライドする。
文法に形態と形態素を分析すればそれは分析手法が語の場合と異なる。語は語構成に接辞を位置づけるかどうか、一方で接頭語と言ってきた接頭辞となるものと文法論となる。
形態素の単位を語彙論で説明することになる。それがどうなるかは、計算でのことか、入力するプログラムでの仕組みに結果があらわれる。次のような作業である。


文章を意味のある最小の単位に分解して、意味や品詞など判別すること。
形態素解析とは - 意味の解説|ITトレンドのIT用語集

https://e-words.jp/w/%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90.html
Morphological Analysis
2019.1.15更新
>形態素解析 【morphological analysis】
形態素解析とは、自然言語で書かれた文を言語上の最小単位である形態素に分割し、それぞれの品詞や変化などを割り出すこと。ITの分野ではコンピュータによる自然言語処理の一つとして、かな漢字変換や全文検索、機械翻訳などで用いられる。

日本語や英語など人間が普段使っている自然言語において、文中で意味をなす最小の構成要素を形態素(morpheme)という。文がどのような要素によって構成されているかを調べるために、形態素の列に分解してそれぞれの文法上の属性(品詞の種類や活用形など)を明らかにしていく処理を形態素解析という。

例えば、“This is a pen.” という英文は “this”(代名詞)、“is”(be動詞)、“a”(不定冠詞) “pen”(一般名詞)のように分解できる。“apples”を“apple”(名詞)と“-s”(接尾辞/複数形)の組み合わせであるというように、一つの単語を接尾時・接頭辞や語幹などに分解する場合もある。

日本語では「これはペンです」を「これ」(代名詞)「は」(係助詞)「ペン」(一般名詞)「です」(助動詞)のように分解できる。文法上の要素に分解していくため、「食べた」は一語ではなく「食べ」(動詞/連用形)「た」(助動詞)に分かれる。

コンピュータによる形態素解析処理は、当該言語の文法規則や、単語や接辞などの要素を列挙した辞書データを用いて行う。英語などアルファベット圏の言語は単語ごとに短い空白をあける「分かち書き」をするため、基本的に単語の接辞や変化を調べるだけでよいが、日本語や韓国語などでは単語に分けず一文を続けて記すため、単語分割の段階で複雑な処理や大量の辞書データが必要となる。

また、自然言語では複数の異なる解釈が可能で、辞書や規則の機械的な適用だけでは一意に定まらない表現なども存在するため、慣用句や自然な表現を集めた文例データや、要素間の連結についての統計的なデータを用いて精度を向上させる場合もある。


1 コメント

コメント日が  古い順  |   新しい順
形態素の定義 (Maria)
2021-10-16 21:04:24
「文字列の最小の区分」という意味で「形態素」とか「形態素解析」とかいった言葉を使うと、いちおう電算業界に身をおいて日本語処理をしていた経験からいうと、かなり危なっかしいと思います。
「いる」の語幹は「い」です。で、「持っている」の省略形は「持ってる」です。
このとき、「省略されている、『いる』の語幹である『い』」は、どこへ行っちゃったんでしょうねぇ?
「長さが 0 である形態素」というものを、コンピュータ業界や国文法業界のヒトは、どう捉えているのかという問いに、まず答えていただきたいと思います。
そこから逃げ回っているから、われわれは迷惑しているのですよ。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。