P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

具陳なのかクリシェなのかを見定める(2)

2021-12-12 | ジャンル横断的な問題

前回のおさらい
・助詞を含む字面の並びだけで格納してしまえば慣用句・コロケーションの検出がしやすくなる(助詞に独自文字コードをあてる事前提で)
・死角はない/資格はない:ユーザーが選ぶことで一意性のある導線
・副詞のクリシェ検出はややこしい(単に規定成分/叙述成分のところの検出はシンプル)
・(助詞抜き)題目導入フレーズのクリシェ化は急がば回れ式の解決スタイル
・規定句はタッチ液晶サジェストと相性がいいフレーズ(動詞での規定、形容詞での規定、形容動詞での規定、ノ形容詞での規定、連体詞での規定)
・はアジェンダ名詞提題性を確立しやすい(助詞抜きにおいて特に)
・「--次第」が成立する語:「ゲージ語」の特とりあげ(こちらは規定のかざり伴わなくともゲージ語単体使用において検出活性:アジェンダ特異事例)
・各々個々のクリシェ連結を網羅検知するのをあきらめる代わりに上記の構造的クリシェ検知を張り巡らし、単純イ万を軽視する

…噛み砕くとこんな感じにはなりますが前回記事:具陳なのかクリシェなのかを見定める(1) - P突堤2

の概要はこのようになります。

特にアジェンダ名詞については従来の副詞による連用修飾とは違い、修飾するというよりも提題を導入のマクラとしてそこに叙述成分が連なっていく、[連用承接]という考え方から光を当てて前回の考察に発展的解釈を加えていきたいかと思います。
なぜこのようなややこしい術語を用いて副詞や連用修飾の枠組みを解体するようなつまらぬことを言い出すのか理解に苦しまれる方もいらっしゃるかとは思いますがそれは杞憂であります。
額面通りの文法論の見地からの精緻なパラダイムにはいささかも影響しません。
これはペンタクラスタキーボードというのがあって、さまざまな素性の語(を含むフレーズ)のかな漢字変換を三属性変換というのに分けて、それと同時にジェネラルな変換は通常変換にまかせて、三属性(イ万:名詞具陳 / ロ万:様態叙述 / ハ万:接辞がらみ)など特定の機能役割にフォーカスしたいときは個別の三属性を指定して変換をサポートしてやる
…という一連の"P作法"のもとで浮かび上がってきたインターフェースのありかたについて、通常変換の優先的影響範囲というのを勘案するにあたって副詞の職能というものに着目し、それを追求していっているうちにもっと未分化な連用承接、特に言えば助詞抜きで叙述頭にくる導入詞全般というものに広く目配りをして、
それの下位にあたる個々の三属性変換においてはより専業性を際立たせて住み分けし、特に副詞(通常変換)と様態叙述属性ロ万が被らないように検出のフィルタ特性というものを風通し良く分別するねらいのもとで自然帰結的に発生したアーティフィッシャルな(いわば作為的に分解能を偏向させた)文法標識というものであって、
これらはすべて傍流の、機械の都合に迎合したあくまで局所的な言語現象ですので識者の方々には秩序紊乱であるなどと目くじらを立てぬようどうか寛大な目で受け止めていただく事を願う次第であります。

クリシェか具陳か、という観点でいうとアジェンダ名詞をクリシェに組み込もうとする目論見はちょっと無理筋ではないかという懸念もあるにはあるのですが
・焼き芋今季節でおいしいですよね
・仮想通貨あのまま持ってたら
などのフレーズのように[提題][副詞]が同時におこるケースでは「焼き芋」「仮想通貨」などアジェンダ部のほうが文頭検知にまず引っかかる場合があるので副詞でもない何か素性不明の未知語が文頭に来ているとスッキリしない観がありますので
個別の語彙的意味は分からずとも「何だかわからないけれどこれはアジェンダ導入なんだ」というのが上位判定的に機能させられないかどうか果敢に試みていくことが通常変換バイアスに求められているのではないかという発想がまず来るかと思います。
文頭にくる未知語としましては
・何か複合語の断片
・何か連体修飾成分の断片
・句接辞を介した何か連用修飾成分の断片
・接題目形あるいは動詞連用形転成(実質体言)の提題的使用
・感動詞あるいは発話詞
・未知オノマトペ(副詞形成のものを含む)
・接続詞で未知語は今のところ心配しなくてもよいレベル

などがあります。着目点はさまざまありますが大きく分けると連用修飾系列のものとアジェンダ文頭のものの2つに大別されます。(感動詞接続詞等はその他添え物的トピックです)
連用修飾というのにはまず未知オノマトペ(副詞を形成)、たとえば
[ごんぎゃち]可愛い
というオノマトペ(?)副詞があったりします。
オノマトペ系というのは--する、というサ変だったり「--になる/--である/--だ」などのように副詞でないいろいろ語尾派生のものがあったりしてややとっ散らかっていて恐縮なのですが単に(強調としての)文頭副詞というのは後接に叙述成分と直結している形のものだけを選ぶ必要がありますが
そんな中でカタチだけ見ると提題のアジェンダの時と構造が似ている部分もありますし、導入-叙述とダイレクトに(助詞抜きで)緊密につながるということはタイピカル化しやすい純度をもっているのだということもできます。
さらに連用修飾のもう一つとして
インターン[以来]激務の毎日でして
みたいな句接辞チャンクが実効上連用修飾の役割を果たしているケースでは接辞を迎える語頭の未知語も使う接辞によってマッチする/しないの相性が出てきますので特定の具陳によらないクリシェ寄りの側面が強いかと思います。

着眼点のもう一つ、アジェンダ文頭のものの連結を注意深く観察していきますと
文頭提題の系列のものとして規定句チャンク
[香ばしい奴]RTしてるの面白い
という形容詞規定句などもアジェンダ化しやすいですしそれよりはやや適用容認度は下がりますが同様に原理的には動詞の規定句、ノ形容詞の規定句、連体詞の規定句なども(助詞抜き)アジェンダ名詞チャンクとして成り立つ見込みのものもあります。
もちろん単純名詞でもアジェンダ化するものはいくらでもありそうですが短い文字数の名詞を節操もなく検出しまくってしまうとノイズに振り回されてしまいますし、慎重を期してユーザーの個々の用例を地道に学習して抑制と頻用の線引きをしていくことが現実的なさばきに落ち着くところであります。
もとよりペンタクラスタキーボードでは区切りを明示化する機能キー[Ø文字マーカー]というものがあるのでユーザーの側が誤変換を誘発しそうな短尺アジェンダのフレーズを入力しようとするときには適宜Øマーカーを入れてもらって無用なリスクを回避することができます。
ユーザーにインターフェース上の作法を覚えていただくのは負担もあるかとは思いますがそれに応えるだけの効用というものがきちんと評価されていけば納得感のある解決策になっていくかと思います。

さて、話を続けます。アジェンダ文頭のものの続きとしましては
動詞連用形転成(実質体言)あるいは接題目形の提題的使用というものがあります。
ちょっと見慣れぬ言葉に戸惑いを覚える読者の方もいらっしゃるようですから簡単に解説していきますと、連用形転成は
・このえさ、魚の[食い]悪いね
・この頃なんだか[原稿書き]進捗遅いなぁ
みたいな動詞連用形で結ぶチャンクをひとつの提題としてイディオム的につながるモノです。
連用形転成名詞といえば、「食べ応え」みたいに独立した自立的語彙を確立したものもありますが、それ以外にも上記例のように臨時の用法あるいは臨時の複合語をなすものもアジェンダ化の役目を十分に果たすものもありますので未知語であっても検出能を緩めるわけにはいきません。
これが動詞連用形の転成のアジェンダフレーズであります。

対照的に接題目形の提題的使用というのは
・そのアプリへの[つぎ込み額]ハンパないな
・[力み加減]かえって可愛いよ
みたいなさっきとは逆に 動詞連用形+結辞でアジェンダ結節を形成するモノであります。
当ブログでは独自の解釈としてこういった連結のものを「接題目形」として提案しており従来であれば活用語尾はひらかれたかな文字列のおくり仮名であるところを特殊化・拡張化して
連用形+[心地]とか連用形+[加減]みたいな漢字の語尾部分をおくり仮名同様活用語尾とみなし、アジェンダ化する職能をもつひとつの活用形として文法処理していった方がコンピューターで解析処理するのに都合が良いのではないかとの狙いでIME文法を構築しようとするものであります。
どういった解析評価を構築していくのか仔細はまだ固まってはおりませんが、「次こみ学」よりは「つぎ込み額」を、「りき美香源」よりは「力み加減」を解釈抽出していく、個々の頻度だけでバラバラに配置をあてる変換ではなくて連接テーブル的に「接題目形語幹+語尾漢語」というものに特段の価値を見出してチャンク感を判定していこうという方向性が順当かなと思っております。

話が長くなりましたが連用修飾系列のものとアジェンダ文頭のものを[連用承接]というものに抽象化していって、文字列のマッチングだけだと検出限界があるクリシェの連結判定というものをもっと広く俯瞰していって「規定句である」「接尾辞派生複合語である」だとか
「連用形複合語」「接題目形アジェンダ」「(おまけとして)Ø文字マーカーの介入」という文字列マッチングだけにとどまらない構造的な特徴をパターン化してとらえて検出していく方策が今追い求めているアプローチであります。
この視座に立てば[連用承接]というのを巻き込んだ大きなフレーズとしての構造的クリシェというものを統一的にとらえていくことができますし、ブログの開設以来三属性変換を磨いていく過程において常に懸案の課題であった「助詞抜き連接」というやっかいな問題に一定の解答をもたらしてくれることになります。
しつこいようですがここでもう一度この一連の記事の言わんとする問題提起の源泉というものをたどっていきますと、

アジェンダ名詞の試みと(慣用句)叙述チャンクを検知することは車の両輪:慣用句対策として文字コードリテラル甄別は重要

ということであります。
アジェンダを検出することも大事ですがそれを際立たせる拠り所となるのは叙述フレーズ/叙述成分なのです。
叙述部に見当をつけられずにはアジェンダを確定することもできません。
ですから高望みする前に慣用句全般の愚直な文字列マッチング=独自文字コードでの助詞を含むリテラルフレーズ検知はまず当然のこととして足固めしておかなければいけません。
この問題には同じクリシェであっても叙述フレーズ(むすび)としての局所的なマッチングクリシェとしての側面と
語頭アジェンダ部分が仮に規定句であったときには文章全体からみた叙述部分としてのクリシェではなくアジェンダ部分の構成要素の中でもまた入れ子的/ネスト的に構え直す柔軟さが求められますし
構造的クリシェとリテラルのクリシェのそれぞれがアジェンダ部分にも叙述部分にも同様に走査されうる、一種混迷した様相を呈しております。
拙論の力不足もあってかその全容は未だつかめてはおらずまことに不甲斐ない思いではありますが今後の探究により少しでも風通しの良い論点整理ができるよう努めてまいりますので読者の方々にはじれったい思いをさせてしまって申し訳ありませんが今しばらくお待ちいただきたいかと思います。

さすがにここでの論説に力が入りすぎてしまって言うタイミングを見失ってしまったのですがこのシリーズ記事は前回今回では収まりきらす、次回はタッチ液晶インターフェース、特に規定句のフレーズの変換候補サジェストの可能性を具陳/クリシェの視点から掘り下げていきたいと思いますので年内投稿を目指して執筆していく次第であります。よろしくお願いします。
次回も具陳☆と考察・提案していきますのでもうしばらくお付き合いください。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする