すこし前になる。日本語文法の説79 国文法批判 20190909 にコメントいただいた。読んでくださる上に、やり取りを9回続けている。それで、その20201012から、しばらく意見交換が続いている。まことにありがたいことと、さらに、実用文法の考えを示された。また、学校文法の実用性を議論することになる。二人の方の投稿、ハンドルネームではそうであるが、もう一方には、現行の国語教科書にある国文法の説明がおかしい、という主張が見える。お二方だけでなく、もう一方、実装の担当の方がいる。最近に、おひとり語彙の担当の方のやり取りに、ばっかり可愛がられているような気がする、という声も聞こえるようで、そういうことはない、のだが、なにしろ、便所の落書き的な態度とか、これはわたしのことかと、思わせるような、当を得たことなので、文節を俎上に挙げるにしても、二度めはないぞ?と言ったりするのは、どういうことだろう。
以下、学校文法で橋本学説が主張するものではないので、受けとめ方には留意する。
そこで、連文節の考え方をどう受け止めるか。連文節を説明して、その働きを日本語文の文節として理解すれば、それで、問題解決になることがある。ただし、連文節の扱いを、文節以上のもとする、それはそれでよいのだが、文節の余りの便利さに、その大方の了解が教師、または、研究者にはない。つまるところ、構文に至るのは文の成分で、学校文法では、連文節を係り受けのある文の解析として文節にしない。文節と連文節にその説明で線引きをすることは、実は文節内の係り受けで、連文節の単位の取り方に、桜の花が さくらのはな|が さくらの|はなが ということである、難しいことではない、これはどちらで分節か、という、いわば屁理屈が出てきてしまって、屁理屈と言わなければ、連文節を解釈しないという頑固さで、それ以上の理論展開をはかろうとしない物言いである。これは、そこに膠着すれば解決しないので、文節批判は批判にならない、未解決議論におとしめてしまう。文節批判の出発点はここにあるので、これは、認めるか、どうか、理論の整合性を橋本学説の文節によることができるかどうかである。これを解決すべく、と言っても、そう考えた時枝学説ではないが、このあとに時枝理論学説の入れ子型構造を文の成分に、次に来る議論として捉えてよいのであるが、橋本学説と時枝学説の入れない態度は、その後継者たちは、一切、そこには触れない。
ちょっとわかりにくくなるといけないので、指摘がある例で述べる。
「書いちゃった」、これは文節である。分節としてとりだすと、「書いて|しまった」に分解して2文節になるということだけであって、言われる通り、断じて何が得か、と言うようなことになるだろうけれど、そういうときに、すでに、「書いちゃった」と析出したものを、なぜ文節と扱わないか、と言うのを考えてみる。しかし、現実の資料に、これは実装するには、その単位で語の成立を見る、あるのであるから、つまり分節として扱わなければ、上手くいかない。ということは、それが明らかに文節だからなのである。ここで、それほどにこだわらなくてよいが、文法は音韻であることを知るべきで、音変化を起こして音韻に、「かいちゃう」をまとまった発音としてことばになっている、連文節にできないのはなぜか、書いちゃう 書いてしまう、と同じで、これを音韻に認める語扱いにするか、それだけのことで、ただ、話し言葉だとか、訛りだとかいうことはあるであろうが、このままに分析ができる。ここで教師が教えられないというのは、方言教育をしない、あるいは話し言葉の砕けた言い方を、まずは教えないという、共通語教育の観念があるだけで、そこに分析を持たないだけであるから、それで教育能力を云々するわけにはいかない。書いてしまった、連文節なのである。
参考サイトで、連文節を説明するのを挙げておこう。
ただし、これも、文の成分にだけ分析をする。
https://www.kokugobunpou.com/%E6%96%87%E3%81%AE%E7%B5%84%E3%81%BF%E7%AB%8B%E3%81%A6/%E9%80%A3%E6%96%87%E7%AF%80%E3%81%A8%E6%96%87%E3%81%AE%E6%88%90%E5%88%86/#gsc.tab=0
国語の文法
ホーム > 文の組み立て > 連文節と文の成分
所長氏は形態素解析と構文論(および知識表現などの自然言語解析方面)に興味がある文法寄りで、「Mr.Moto」という物騒な名前のメンバーは、「それをいかにしてコンピュータ上の処理につなげるか」に取り組んでいる熱血ハッカーでございます。
ところがこの二人、あちこちで日本語処理関係の発表をするたびに、半可通に叩かれて痛い目に遭っています。そのなかで多いのが、三上文法における「主語」であるとか橋本文法でいう「文節」であるとか、そういうことを持ち出してくる「日本語の文法の枠組みや成り立ちについて、真面目に考えたことがない」ヒトなのですよ。こちらは仮説を立ててはコツコツとコーパスデータを分析して結果を積み上げたうえで発言しているのですが、そういった議論から逃げている連中がいます。そういう怒りがあって、不真面目な(自称)研究者は(なまぐさな)学生に対する「憤り」があって、ときどき不動明王化してしまいます。
> 二度めはないぞ?と言ったりするのは、どういうことだろう。
というのは、「研究態度が不真面目な」連中に対する発言なので、誤解を与えてしまった点にはお詫びいたします m(_ _)m。
本題です。
> 方言教育をしない、あるいは話し言葉の砕けた言い方を、まずは教えないという、共通語教育の観念があるだけで、そこに分析を持たないだけである
のは、教師が「共通語教育」「規範文法」というタコツボ(漁具ではなく、個人用の退避壕のほうです)に逃げ込んでいて、「なるべく文法のようなものと向きあいたくない」という怯えがあるせいではないかと思います。
「てやんでぇ」は「何を|言って|いらっしゃるのですか」と文節で切れるし、「あたぼうよ」も「当りまえだ|べらぼうめ」になります。そもそも「文」というのは入れ子構造になっているので、括弧で括って「文接続詞の『と』」をつければ、それ自体がひとつの文節です。「ネ・サ・ヨ」で切れたら文節、というのも、「係り受け関係を明らかにするうえでの実用的な区分」としては有効なので、形態素レベルの解析まで踏みこむのはもっと先へ行ってからでいいと思うのですが、「ら抜き言葉」とか「正しい敬語の使い方」とかいったあたりを突いてくる教師というのがいたりします。かといって、「形容詞の連体形に用言の『です』が繋がるのは文法的におかしい」みたいな生徒の質問には答えられない。
そういう意味では、「教師の国文法リテラシーの底上げ」ということも考えなければならないと思うのですが、とはいえ教師には「教科書通りに教える」という縛りがあるので、「まず教科書の説明を正せ」という流れにはなるかと思います。
記述文法と形態素解析の範囲でいうと、たとえば「動詞の連用形の任意個の連なり」は、「ひとつの文節」と解釈するのが便利です。たとえば、「食べすぎた」も「持ちかえった」も一文節、ということになります。「出入り」は難しいところですが、これはデイリとデハイリの両方を辞書登録する、という形で処理しています。
ここには、「形態素解析レベルの記述文法は、たかだか接続関係の話であり、形態素解析は構文解析の前処理としての位置づけになっている」ことと、「構文解析を考えると、『文節』レベルで考えたほうが係り受け関係の処理については実用的である」という処理上の都合があります。
これが深刻な問題になったのが、補助動詞「いる」の処理です。「いる(i-ru)」の語幹は「い(i)」です。そうすると、「持っている(mo(t)-Qte-i-ru)」の省略形である「持ってる」は、「mo(t)-Qte-(i)-ru」だということになります。ところが、「い(i)」の連用形は「い」なので、下手に接続関係を定義してしまうと、「語幹=連用形」となり、「連用形は任意個連接して連文節となる」という文法上の規則と競合してしまいます。
つまり、「持ってる」を解析すると、候補として「mo(t)-Qte-(i)-(i)-(i)-(i)-(i)-(i)- … -ru」が出てきてしまって、「処理が止まらない」という怖ろしいことが起きます。しかたがないので、補助動詞「ゆく・いく」「おく」「いる・おる」などは、不規則活用動詞(「いく」はもともと不規則活用ですが)と横並びで、「語幹から活用語尾までが全体である」とかいろいろと試行錯誤したものの、「これが可能・使役・受身・尊敬の形態素と絡んだらどうなるか」みたいな話でまた悩む、といった経験をしております。
ただ、こういう話は形態素解析エンジンを自前で開発して文法記述をああでもないこうでもないと工夫し、じわじわと解析精度を上げてゆくといった苦労をしないと理解してもらえません。
記述文法は規範文法や説明文法や読解文法に比べても人気がなく、さらに処理となると「どっかで誰かがもうやってるんじゃないの?」程度の認識しかされていません。「どっかで誰かが完成させているのなら、かな漢字システムがバカなのはどういうこった」とは思うのですが。
だれか真面目に興味を持って取り組んでくれないものかなぁ、と思っています。
「連文節」について考えているうちに思い出したことがあります。「そもそも論」になってしまいますが、「議論の基礎になる用語の定義そのものが不自由なんじゃないだろうか?」という点です。
一般的な(「学校文法的な」です)解釈からすると、「月の砂漠をはるばると」の「月の砂漠を」は連文節ではなく「用意しておいた」の「しておいた」は連文節です。「しといた」だと明らかに連文節です。そこで、
『句』(https://blog.goo.ne.jp/gooksky/e/7748d401d46dc2e7e8cc59ea0256f8d8)
というエントリとの関連で、「語」「句」「文節」「連文節」という概念を整理できないか?と思います。
「月の砂漠を」は「〔月の砂漠〕を」であり、「月の砂漠」という句に「を」がついて文節になっている「月」「砂漠」は、修飾関係にあります。
「〔ラーメンと餃子〕を」も文節で、この場合「ラーメン」「餃子」は並列関係になっています。
これに対して「しといた」「持ってった」は、分かちがたく結びついていて、それ自体が文節です。
ところが、文法の解説書の中には、このような別タイプの文節を、両方「連文節」と呼んでしまっているものがあります。これは、「句」という概念を持ちこんで、「複数の語からなる文節」という点では確かに「複文節」と呼べるかもしれないけれど、しっかりと区別する必要があるのではないか、と思います。
所長氏、実装氏、広報氏の方々、ご安寧のことと、お慶び申します。日本語処理をもとに文法論議の発展をのぞみます。
本題にて、ご提議のこと、2点にすると、教師と教科書ですか。教育の関係者には文科省をはじめ、文法についての方面を四方八方に置くようなことがあり、ひとり国語教師だけではありませんので、ターゲットをどこに置くかを決める必要があります。教科書係官、教科カリキュラム、教室現場の人的構成、初等教育段階、これに、国語教師がいて、英語教育があって、受験産業、言語研究専門家と、それをとりまく人々がネット、メディアにいます。どこを相手にしても、教科書記述にある文法となりそうですね。こと、文法だけに限って言えば、このうちの2派ぐらいになります。教員検定にある初等教育免許者と中等教育免許者です。ここに、昔風に師範学校系統の文法教育と、大学教職課程の教科専門です。さらに、ぶちあげて、国語担当の教師たちには文法研究の得手不得手が激しい、つまり、文学専門が圧倒していて、ことばの興味の持ちようが違います。しかも、言語教育には外国語教育担当者、主に英語教育のかたがたが持つ国語へのいわれなき、いわば偏見です。研究者の中身もその立場で古典文学を忌避しての言語論を展開しますね。したがって、教科書の説明がだめだとするなら、いきなり、問題を特定しますが、そのたたき台となる教科書を持ってくる必要がありますが、そこには、それがない、という現実にぶつかるでしょう。言葉のきまり、ような、解説はありますから、それを持ってくるとどうか。いまはなつかしい、中等口語とか、高等文語とか、そのような現在使われる学校教育の教科書を探してみて、それがあればいいでしょうか。
不動明王様は、大日如来の化身でしょうし、守護神ですから、怖そうなのはよいとして、そこにいらっしゃるだけで験あらたかです。
yamauchiです。
連文節についての記事を、先ほど拝見しました。それはまた、どう決めるか、決めていくか、という議論になると思います。
そこで、
形態素解析ですが、つぎの引用の通りと受け止めさせていただきます。
>ここには、「形態素解析レベルの記述文法は、たかだか接続関係の話であり、形態素解析は構文解析の前処理としての位置づけになっている」ことと、「構文解析を考えると、『文節』レベルで考えたほうが係り受け関係の処理については実用的である」という処理上の都合があります。
言うところの記述文法というのは立場が定まらないということです。記述文法とする、理論、現代言語学の手法はその研究者個々に選ぶ手法で分析するという状況になってしまいますので、あっちを突っつき、こっちを突っつきし、たがいに参考にするような態度を持ちながら、統一されません。個別言語のことなので、互いに了解できることはありますが。こういうと、これには誤解を招くので、記述文法に統一する立場がある、それができるといいですね。
>こういう話は形態素解析エンジンを自前で開発して文法記述をああでもないこうでもないと工夫し、じわじわと解析精度を上げてゆくといった苦労
したがって、こういうふうにやっているということで、上記を理解する人が実践を共にすることでしょう。機械処理の文法ということで、その立場を堅持することになります。
1995 自然言語処理 vol.2 No.4 日本語形態素解析システムのための形態素文法
論文がヒットして、読んでみました。
形態素解析は門外漢だと、自分のことがわかります。
所長が不貞腐れている原因のひとつは、
>連文節についての記事を、先ほど拝見しました。
というので「恥を晒してしまった」というのがあります。所長はタイピングが速いのと、日本語処理に関する理解が深いので、「誤変換がありすぎる」というので落ち込んでいます。「JAI-Parsar だったら、こんなことはないのに。ちくしょう」とかいって落ちこんでいます(笑)。
さて、本題です。
「文節とはなにか」と考えたときに、現代では、「ネ・サ・ヨ」うんぬんより、「ワープロ入力の際に、どこで『変換キー』を叩くのが自然か?」という話になるのではないか?という話はあるのではないかと思います。「思ってた」で、「おもって」で変換キーを叩いて「た」を入力しようと思ったら「田」が出て「思って田」が出たら orz な気分になりますでしょう?
そういう意味では、「ここで『変換キー』を叩け!」という区切りが、いわゆる「文節」という概念と一致したりするわけです。
もう一つ、「日本語形態素解析システムのための形態素文法」(一九九五)の、「参考文献」の欄に、所長の名前がなかったのが利いているようです。所長氏の言うには、「つーか米澤さぁ~ん、ひとこと声掛けてよぉ~」という話もある(共立出版とか学会関係で、それなりに縁はあったそうですが)んですが、その頃は所長は闘病生活真っ盛りだったので、お会いする機会がなかったそうです。
つーか、当時は JUMAN よりこっちの方がパフォーマンスは上だったのになぁ。JUMAN の辞書引きシステムはパトリシア木(まぁ、当時は記憶領域が狭かったからそうなるんですが)で、後に「ダブル配列(Double Array)法」が採用されたんですが、うちらは「ダブル配列用よりも、その元祖であるトリプル配列法のほうが、複数バtみたいな話をしてたんだけどなぁ。
…… 申し訳りません m(_ _)m。愚痴になってしまいました。
形態素解析システムに関しては、「ほぼ完成形」を自負しておりますが、構文解析になると、「効率が悪い」というところがネックになっておりました。
ところが、Moto ちゃんが「一つの文があったとして、述語と述語の間に『係る』名詞句が(いわゆる、「名詞+述語+名詞」みたいなものを「名詞句」とするとして)ニ十個も三十個も並ぶと思うか?」という話をして、「だったら総当たりでチェックすればいいじゃん」と言い出しました。「nの階乗」とか言ったって、「十の階乗」くらいだったらコンピュータでなんとかなります。
もう「形態素解析」なんかはどうでもいいと思っています。現在のターゲットは、「構文解析」です。
とはいえ、そこに踏みこむと形態素解析のときに出てきたような「運用上のややこしい話」が山ほど出てくると思いますが、「それはそれで国語学上の論文のネタになる」と思うと、「ちゃんと処理系を動かさないとな」と思っています。
>できるとしたらヴォーカルしかない
大いにうなづきました。お伝えくだされば幸いです。幼少期から、音痴は遺伝するのか母譲りの変調、転調、さわりの名人でした。
以下は、あちらのページに飛んだりで戻ったり、混ざります。
本題、変換キーは文節キーですか。どこかで書きましたが、文節は息の単位とする説明は日本人向けで、丁寧に発音するというのは、音韻もそうですが、スペースを入れたり、母音終わりだったり、これは、大体が意味を前提にして作られた理論です。
そのことを言う人はいない。国語の話者なら簡単でも、留学生に文節、音節の単位は習得対象です。モーラ単位で練習させていると、た、た、た、た、というような、短銃うの連射音に聞こえると、怖いと言われたことがありますし、留学生に文節作業をさせるとうまくいきません。これは現代人にも通用しなくなりました。息の切れ目とか、丁寧な発音とか、してくれなくなった世代がいます。まるで日本語学習者です。
思い出すことに、中国から来た日本語教師に研修をしてローマ字入力をさせると、これは日本語かな文字変換でも同じことで、漢字入力しようと日本語に変換すると奇妙な候補ばかりが出てきて、現地では通用した日本語教師が如何に、言ってみればいい加減発音で、それは仮名音節単位ではないという、さらには方言で日本語を習得していたというようなことがあって、1979年のころの経験があります。日本語学習にワープロを取り入れた画期の試みで、おもわぬところで、日本語の再研修になりましたよ。
「日本語形態素解析システムのための形態素文法」(一九九五)、よかったのですが、年代的なこともあって、わたしの学習に形態素解析の論文名がよかったのでしょう。
それにあわせて、「日本語処理に関する活用形態素の提案」Japio YEAR BOOK (2016 山本和英)を読みました。この方は、方言、文章解析と、いろいろヒットするのですが。
https://www.kokugobunpou.com/%E6%96%87%E3%81%AE%E7%B5%84%E3%81%BF%E7%AB%8B%E3%81%A6/%E9%80%A3%E6%96%87%E7%AF%80%E3%81%A8%E6%96%87%E3%81%AE%E6%88%90%E5%88%86/#gsc.tab=0
連文節と文節、連文節と連文節、これは、どれも文節です。
切り方が、あるので、句と混用しないのがよいと思います。
とらえかた、考え方ですから、脳内処理と異なるような感じがしますね。
規則活用、不規則活用と、日本語教育が便宜にあつかって、ここが淵源かどうかわかりませんが、不規則活用の多い言語のせいでしょう、その影響には全くないにもかかわらず、国語動詞の5段と1段を規則変化とし、カ変サ変を不規則としました。これはもとに変格活用とあるのでその分類を受けるようで、しかし実際には、規則活用の変形とも見えて、なにしろ、サ変動詞を入れて、パターンは2語しかないのだから、不規則と呼ぶのはどうかと思う結果、これを規則に入れるかどうかの議論がありません。
しかし、あたらしい文法となると、なにが規則か、不規則かという法則の準拠なく、国文法の引き写しで、1st G、2nd G 、3rd Gという名称があるので、このように番号づけだと規則も不規則もない日本語教育です。
例によって、国文法活用の無原則極まりないという批判によって、後戻りができなくなってしまっています。
国文法には規則性を活用の原則として見ている、それがたとえ文語文法にあったとするナ変でいいでしょう、おもいあわすべきです。言ってみれば、1段活用、2段活用、3段活用、4段活用、5段活用がありますね。靡きと呼ぶ現象もあります。いまそれは、形態素解析に吸収されていますし、活用変化に表で見えます。
>「文節とはなにか」と考えたときに、現代では、「ネ・サ・ヨ」うんぬんより、「ワープロ入力の際に、どこで『変換キー』を叩くのが自然か?」という話になるのではないか?という話はあるのではないかと思います。
大類 雅敏『そこに句読点を打て!』 (一九七六) という著作がありまして、そこで「文藝」との整合性というものに配慮しちゃったという部分があります。
それを言ったら、野坂 昭如さんの文章というのは、「句点と読点の使い分けができていない」ということで、「文法的には日本語の態(てい)を成していない」という批判はあるかと思います。
とはいえ、『方丈記』は、句読点のない時代に書かれたので、「どこで切るか」というのは読者に丸投げされています。
「ここではきものをぬいでください」が、「ここで履物を脱いでください」なのか、「ここでは着物を脱いでください」なのかは、読者に委ねられています。「ふたえにまげてくぶにかけるじゅず」が、「二重に曲げて頸に掛ける数珠」なのか、「二重に曲げ、手首に掛ける数珠」なのか。
おそらくは、「話しことば」と「書きことば」のギャップを埋めるものとしての "記号" というものに、多くの人は「読む」という点では馴染んでいるものの、「書く」という場面においては使いなれていないのではないかと思います。
「紛れのない文章を書く」というプレッシャーは、「隙あらば誤読をして足を掬ってやろう」という勢力との闘いでもあります。
うちらは WebLog で好き放題に発言しているわけですが、そのための「スタイル」「文法」「文体」というものを確立してきたという自負はあります。
とはいえ、こんな苦労を後(のち)の世代には背負(せお)わせたくないなぁ、と思います。