P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

接頭語「お」のつく言葉は例外的にイ万(名詞属性)で処理してみてはどうか(本来接辞モノはハ万の役割なのだが…)

2021-03-05 | 変換三属性+通常変換のシステム考察

接頭語「お」は日本語の敬語体系に属しており、尊敬語、謙譲語、美化語に関係している、とありますが
ありふれているようで実は特殊な接頭辞「お」は、三属性変換のハ万の変換においてもとりわけ異彩を放つ存在であります。
大体の接頭辞においては頻出する「非」「未」「脱」などのようなものから
「プチ--」「猛--」「なんちゃって--」「名ばかり--」などのように典型的接辞単位から適用拡大してハ万の取り扱いに含めたものも種々あります。
これらは後続の言葉に意味属性、語彙属性、指向性属性などを与えるに足る「実質性」を持っていると言えます。
翻って敬語接頭辞「お」は語に丁寧さ、尊敬概念を付加するものの実質的な意味の展開には微々たる意味を付加するに留まったままです。(しいて言えば「お役所」「お義理」みたいに批判性や自嘲性のニュアンスをもたらすことがある、という例くらいでしょうか)
これはハ万で想定するところの接辞の語彙展開とは趣を異にするものであり、むしろ待遇コミュニケーション/立場位相の領域で判断すべきことでありハ万で本来的にこなしていく変換操作の対象とは一段違うものとして扱ったほうが適切ではないか、との視点が出てきます。
要するに接辞がらみの語を変換指定するハ万の中でも「お」だけは特別のものとして一種破格の扱いを持ち出そうという「例外処理」に関しての提案が今回の記事の骨子になります。

「お」に後続する品詞/よろづのタイプとしては、
おヒゲ・おベンツなどのような単純名詞に「お」がつくものもあれば、お守り・お通しのように動詞連用形に前接するものの全体として一個のまとまった名詞として確立されているものもあります。
こちらをタイプAとしておきます。これらはほぼIMEの辞書データに(たとえ連用形由来のものであっても)一個のイ万の単語として登録されているだろう類のものであります。(おケーキのようなお+単純名詞のものは類推容易とみなす)

対照的に、イ万(名詞)ではなく動作様態をあらわすもの あるいは イディオム起点語として動作語を導出するもの…つまり名詞的でない、ロ万に属すると解釈されるものも「お」がらみの語がいくつか見られます。
動作様態としては
お振込み・お届け・お初・おかんむり
などがあり、
イディオム起点語としては
お眼鏡(にかなう)・お鉢(が回る)・お定まり(の長話)
などがあります。
こちらをタイプBとしておきます。こちらもどちらかというと一個のロ万の単語として辞書登録されている見込みの高いものたちであります。
大事なことは、先のタイプAの語は三属性イ万(名詞)で取り捌くのは当然のこととして、こちらのタイプBのほうは今回の「お」がらみのものでありながら様態性が強いと判断して三属性ロ万(用言/イディオム起点)で取り捌くというものであります。よってイ万の含みはもっていません。

そして最後に、主に尊敬語の用例においてはたらき、動作様態の中でも大体の場合において定型の構文を作ってパターン化の度合いが強いものをより抜きます。
これらをタイプCとしておきます(タイプBとの微妙な違いに注意)
系統立てて整理してみると
・お持ちですか・お望みですか・お嫌ですか(だです系)
・お書きになる・お帰りになる・お召しになる・お寄りになるお持ち(--になる系)
・お話しする・お呼びさせていただきます(サ変派生系)
・お褒めいただきまして・お招きいただく(いただき系)
・お含みおきください・お手間おかけします(その他雑多構文系)

これらタイプCの語は活用用言であるので単体の語として切り出すというより基本形からの活用変化バリエーションとして捕捉される類のものであるので辞書マッチングで検知されるという図式の成り立たないものである公算が強いものたちであります。
こちらのほうは微妙なニュアンスはありますが三属性のとり捌きとしてはあえてイ万(名詞ではないがそれでもイ万カテゴリに所属あるいは兼務)に依拠する構えを取っていこうと思います。
辞書検知性の低いのも相まって、普段の通常変換でこのような「お」付きの語形変化についていくのはどうやら難しいだろう、混線要因にもなりそうであるし例外パージの意味合いも含めてイ万の職能を持たせた方があとあと都合が良いだろうとの期待感からこのような措置に致しました。
このようにするのには利点もあります。
たとえば同じ字面で複数の解釈があるパターン、
お先⇔お割き(タイプAとタイプCとの対立)が現れた時には「お割き」を出したいときには変換属性兼任、変換キーのハ万とイ万を押下遷移するふるまいをさせることで両方を満たす「お割き」が固有手段で出せるということ
お餅⇔お持ち(タイプAとタイプCとの対立)も上記同様に、
お便り⇔お頼り(タイプAとタイプCとの対立)のときには変換キーのロ万とイ万を押下遷移させてたどり着く算段(お頼りを出したい)、
お造り⇔お作り(タイプAとタイプCとの対立)

さらには適切な例ではないかもしれませんが
お感情⇔お勘定(タイプAとタイプBとの対立)これは「おかみさん、お勘定!」といったようにロ万かつ辞書登録もありそうなのでという流れをとる
劣り⇔囮⇔お取り(ロ万専業と[イ万とロ万兼任のもの]と[タイプC:イ万とハ万兼任のもの]との対立)
であったり
お宅⇔オタク(イ万とロ万との対立)を使い分けたり
多少やぼったいのですが
お菓子⇔犯し⇔お菓子(イ万専業とロ万専業と[ハ万とイ万兼任のもの]との対立)なども兼任や押下属性遷移などのシステムを運用して上手くさばけそうです。

また、さらに発展形の用途としては辞書に登録されていなさそうな
・おメールいたします
・おイッキなされる
・おチョイスで
・おググりください

なども、既定の各イ万/ロ万属性あったとしても、バイパス兼任的にイ万を噛ませる、あるいは接辞なのでハ万もひと噛みする、などの味付けをほどこして立体的に展開していけば、属性遷移という面倒はあるもののピンポイントで目的の語を浮かび上がらすことができ、通常変換でネックとなる「お」接辞語を避けながら候補導線分離を進める事ができて一石二鳥であります。
一応個々のレアケースなども今後精査していかなければなりませんが果たしてうまく機能するでしょうか?投資の意味も含めて検討のまな板にのせる価値はあるかと思います。
何より「お」がらみの検知は通常変換からパージされているのでこうした「お」がらみ語でありながら未知語までを含む厄介なパターンをとりあえず通常変換では心配しなくてもいい、というメリットがあります(もちろんその分デフォルトでの分解能は少し物足りなくなるが)。
そして一度三属性を通して変換確定したものは前後の用例配列も格納したうえで学習されますから(学習後は通常変換で出てくる)通常変換で出てこないことをことさら憂慮すべきほどのリスクは除去できるかと期待しておるところです。

以上が接頭辞「お」にまつわる例外処理の提案概要であります。
なお、「お」に似たような機能を持つ「御」についても触れておかねばなりません。
一般に、[原則的に『お』は和語に付き、『御』は漢語につく」との慣用ルールがあるそうですがこちらのルールを観照していきますと「御」のほうは先程のメインの「お」の場合に比べるとタイプ分類に基づく見通しを立てていくのはどうも難しそうであります。
なぜならば漢語は一般に品詞属性・語性のはっきりしないものが多く境界的でもあり横断的でもある特質を多分に持つからであります。
和語には活用やイディオム連綿性などが比較的特徴的である意味与し易いのでありますが漢字は同音衝突もありますし解釈候補が爆発してしまう複雑性をもっているのです。
なのでここはデカルトの箴言「困難は分割せよ」を援用いたしまして、分解能の対象を、

「御」と「誤」の分離だけにひたすら注力する方針を立てる

ことといたします。(流石に後半バテてしまったのか、という話は内緒です)
御と誤にまつわる誤変換は枚挙にいとまがなく、接頭辞「ご」のふるまいを精査していくと結局のところはこの「御」と「誤」の分解能を高めることに帰着する問題なのかというのも皆さまご納得して頂けることと思います。
例としましては

・御アクセス/誤アクセス
・ご記入/誤記入
・ご当選/誤当選
・ご登録/誤登録

などがあります。
三属性変換のさばきとしましては、

接辞「ご」を含む語:イ万専業 あるいは イ万/ハ万兼任(ケースバイケースで)
接辞「誤」を含む語:もっぱらロ万専業(結合相手がロ万の素性に結び付くかどうか不明の場合はロ万/ハ万兼任で)

このように処理していけばいいかと思います。
さて紙面も尽きてきましたので今回はこのへんにいたしまして筆を納めたいと思います。
このアイデアをもって、三属性変換の取り回しに少しでもプラスになっていければ良いのですが…。まずはこの方針でやっていきましょう(^^;)

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする