P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

接頭語「お」のつく言葉は例外的にイ万(名詞属性)で処理してみてはどうか(本来接辞モノはハ万の役割なのだが…)

2021-03-05 | 変換三属性+通常変換のシステム考察

接頭語「お」は日本語の敬語体系に属しており、尊敬語、謙譲語、美化語に関係している、とありますが
ありふれているようで実は特殊な接頭辞「お」は、三属性変換のハ万の変換においてもとりわけ異彩を放つ存在であります。
大体の接頭辞においては頻出する「非」「未」「脱」などのようなものから
「プチ--」「猛--」「なんちゃって--」「名ばかり--」などのように典型的接辞単位から適用拡大してハ万の取り扱いに含めたものも種々あります。
これらは後続の言葉に意味属性、語彙属性、指向性属性などを与えるに足る「実質性」を持っていると言えます。
翻って敬語接頭辞「お」は語に丁寧さ、尊敬概念を付加するものの実質的な意味の展開には微々たる意味を付加するに留まったままです。(しいて言えば「お役所」「お義理」みたいに批判性や自嘲性のニュアンスをもたらすことがある、という例くらいでしょうか)
これはハ万で想定するところの接辞の語彙展開とは趣を異にするものであり、むしろ待遇コミュニケーション/立場位相の領域で判断すべきことでありハ万で本来的にこなしていく変換操作の対象とは一段違うものとして扱ったほうが適切ではないか、との視点が出てきます。
要するに接辞がらみの語を変換指定するハ万の中でも「お」だけは特別のものとして一種破格の扱いを持ち出そうという「例外処理」に関しての提案が今回の記事の骨子になります。

「お」に後続する品詞/よろづのタイプとしては、
おヒゲ・おベンツなどのような単純名詞に「お」がつくものもあれば、お守り・お通しのように動詞連用形に前接するものの全体として一個のまとまった名詞として確立されているものもあります。
こちらをタイプAとしておきます。これらはほぼIMEの辞書データに(たとえ連用形由来のものであっても)一個のイ万の単語として登録されているだろう類のものであります。(おケーキのようなお+単純名詞のものは類推容易とみなす)

対照的に、イ万(名詞)ではなく動作様態をあらわすもの あるいは イディオム起点語として動作語を導出するもの…つまり名詞的でない、ロ万に属すると解釈されるものも「お」がらみの語がいくつか見られます。
動作様態としては
お振込み・お届け・お初・おかんむり
などがあり、
イディオム起点語としては
お眼鏡(にかなう)・お鉢(が回る)・お定まり(の長話)
などがあります。
こちらをタイプBとしておきます。こちらもどちらかというと一個のロ万の単語として辞書登録されている見込みの高いものたちであります。
大事なことは、先のタイプAの語は三属性イ万(名詞)で取り捌くのは当然のこととして、こちらのタイプBのほうは今回の「お」がらみのものでありながら様態性が強いと判断して三属性ロ万(用言/イディオム起点)で取り捌くというものであります。よってイ万の含みはもっていません。

そして最後に、主に尊敬語の用例においてはたらき、動作様態の中でも大体の場合において定型の構文を作ってパターン化の度合いが強いものをより抜きます。
これらをタイプCとしておきます(タイプBとの微妙な違いに注意)
系統立てて整理してみると
・お持ちですか・お望みですか・お嫌ですか(だです系)
・お書きになる・お帰りになる・お召しになる・お寄りになるお持ち(--になる系)
・お話しする・お呼びさせていただきます(サ変派生系)
・お褒めいただきまして・お招きいただく(いただき系)
・お含みおきください・お手間おかけします(その他雑多構文系)

これらタイプCの語は活用用言であるので単体の語として切り出すというより基本形からの活用変化バリエーションとして捕捉される類のものであるので辞書マッチングで検知されるという図式の成り立たないものである公算が強いものたちであります。
こちらのほうは微妙なニュアンスはありますが三属性のとり捌きとしてはあえてイ万(名詞ではないがそれでもイ万カテゴリに所属あるいは兼務)に依拠する構えを取っていこうと思います。
辞書検知性の低いのも相まって、普段の通常変換でこのような「お」付きの語形変化についていくのはどうやら難しいだろう、混線要因にもなりそうであるし例外パージの意味合いも含めてイ万の職能を持たせた方があとあと都合が良いだろうとの期待感からこのような措置に致しました。
このようにするのには利点もあります。
たとえば同じ字面で複数の解釈があるパターン、
お先⇔お割き(タイプAとタイプCとの対立)が現れた時には「お割き」を出したいときには変換属性兼任、変換キーのハ万とイ万を押下遷移するふるまいをさせることで両方を満たす「お割き」が固有手段で出せるということ
お餅⇔お持ち(タイプAとタイプCとの対立)も上記同様に、
お便り⇔お頼り(タイプAとタイプCとの対立)のときには変換キーのロ万とイ万を押下遷移させてたどり着く算段(お頼りを出したい)、
お造り⇔お作り(タイプAとタイプCとの対立)

さらには適切な例ではないかもしれませんが
お感情⇔お勘定(タイプAとタイプBとの対立)これは「おかみさん、お勘定!」といったようにロ万かつ辞書登録もありそうなのでという流れをとる
劣り⇔囮⇔お取り(ロ万専業と[イ万とロ万兼任のもの]と[タイプC:イ万とハ万兼任のもの]との対立)
であったり
お宅⇔オタク(イ万とロ万との対立)を使い分けたり
多少やぼったいのですが
お菓子⇔犯し⇔お菓子(イ万専業とロ万専業と[ハ万とイ万兼任のもの]との対立)なども兼任や押下属性遷移などのシステムを運用して上手くさばけそうです。

また、さらに発展形の用途としては辞書に登録されていなさそうな
・おメールいたします
・おイッキなされる
・おチョイスで
・おググりください

なども、既定の各イ万/ロ万属性あったとしても、バイパス兼任的にイ万を噛ませる、あるいは接辞なのでハ万もひと噛みする、などの味付けをほどこして立体的に展開していけば、属性遷移という面倒はあるもののピンポイントで目的の語を浮かび上がらすことができ、通常変換でネックとなる「お」接辞語を避けながら候補導線分離を進める事ができて一石二鳥であります。
一応個々のレアケースなども今後精査していかなければなりませんが果たしてうまく機能するでしょうか?投資の意味も含めて検討のまな板にのせる価値はあるかと思います。
何より「お」がらみの検知は通常変換からパージされているのでこうした「お」がらみ語でありながら未知語までを含む厄介なパターンをとりあえず通常変換では心配しなくてもいい、というメリットがあります(もちろんその分デフォルトでの分解能は少し物足りなくなるが)。
そして一度三属性を通して変換確定したものは前後の用例配列も格納したうえで学習されますから(学習後は通常変換で出てくる)通常変換で出てこないことをことさら憂慮すべきほどのリスクは除去できるかと期待しておるところです。

以上が接頭辞「お」にまつわる例外処理の提案概要であります。
なお、「お」に似たような機能を持つ「御」についても触れておかねばなりません。
一般に、[原則的に『お』は和語に付き、『御』は漢語につく」との慣用ルールがあるそうですがこちらのルールを観照していきますと「御」のほうは先程のメインの「お」の場合に比べるとタイプ分類に基づく見通しを立てていくのはどうも難しそうであります。
なぜならば漢語は一般に品詞属性・語性のはっきりしないものが多く境界的でもあり横断的でもある特質を多分に持つからであります。
和語には活用やイディオム連綿性などが比較的特徴的である意味与し易いのでありますが漢字は同音衝突もありますし解釈候補が爆発してしまう複雑性をもっているのです。
なのでここはデカルトの箴言「困難は分割せよ」を援用いたしまして、分解能の対象を、

「御」と「誤」の分離だけにひたすら注力する方針を立てる

ことといたします。(流石に後半バテてしまったのか、という話は内緒です)
御と誤にまつわる誤変換は枚挙にいとまがなく、接頭辞「ご」のふるまいを精査していくと結局のところはこの「御」と「誤」の分解能を高めることに帰着する問題なのかというのも皆さまご納得して頂けることと思います。
例としましては

・御アクセス/誤アクセス
・ご記入/誤記入
・ご当選/誤当選
・ご登録/誤登録

などがあります。
三属性変換のさばきとしましては、

接辞「ご」を含む語:イ万専業 あるいは イ万/ハ万兼任(ケースバイケースで)
接辞「誤」を含む語:もっぱらロ万専業(結合相手がロ万の素性に結び付くかどうか不明の場合はロ万/ハ万兼任で)

このように処理していけばいいかと思います。
さて紙面も尽きてきましたので今回はこのへんにいたしまして筆を納めたいと思います。
このアイデアをもって、三属性変換の取り回しに少しでもプラスになっていければ良いのですが…。まずはこの方針でやっていきましょう(^^;)

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

混ぜ書き不快派と漢字をひらく派は対立構造ではない

2020-02-09 | 変換三属性+通常変換のシステム考察

「大学卒業したら一緒に相撲」みたいに文を締めようと思っているところにいきなり名詞の「相撲」が飛び込んでくると面喰った気分になってしまいます。
この斜め上の誤変換は文の収束部(おそらく用言)で体言がきてしまうと急に特定性・話題を帯びたものが展開を急転させて浮いてしまうところに違和感の根があるようです。
また「設定すんだよ!」⇔「設定済んだよ♪」、「猫を飼いたい」⇔「猫を解体」のように同じ収束部でありながらサ変動詞/助動詞たい-の文末派生ニュアンスをつけたものと素直な一般動詞(漢語含む)との対立から誤変換が生まれるものもあります。
ペンタクラスタキーボードの三属性変換ではこういったサ変活用由来・モダリティ・文末派生のニュアンスが入っている解析候補を優先的に上位提示し先述のように話題が特定的になりやすい名詞やときにはモダリティのつかない生の一般動詞などの候補解釈を個別の三属性キーに任せて、通常変換でのアピールを抑制しています。
通常変換にはあと副詞をいち早く察知してそれを軸に優先的に候補解釈を生成して解析を進めていこう…との狙いもあるのですがそれについてはまたの機会で考察していきたいので今回は通常変換における表記の微妙な機微についてお話していこうかと思います。

通常変換の大事な守備範囲の一つに「頂く」「下さい」「出来る」などの補助動詞を「いただく」「ください」「できる」にデフォルト解釈する指向性をもつのもおさえておかなければなりません。
アスペクト表現の「ておく」「てきた」なども同様です。
さらには「とき」「ところ」「もの」「こと」「ため」などの形式名詞もひらがな表記が原則です。
文脈によって実質名詞としてはたらくときは時・所・物など漢字表記にしなくてはならないときもあるのですがコンピュータにそこまで判断させるというのは酷なのでせいぜいユーザーが漢字を好んだ時の用例を地道に集めて学習していくくらいしかないでしょう。
要するに通常変換では「漢字をひらく」規範意識を明確に持っておりそこから逸脱するあえての漢字表記を好む場合には三属性変換がその受け皿になって個別の漢字表記を引き受けることになります。
もちろん通常変換ででも出ないと困りますから、出るとすれば漢字をとじる表記は変換候補順位の次点以降に提示される旨は心得ていただきたいと思います。
漢字をひらく事はマナーというほどではありませんが読者へ読みやすい文章を届けるための書き手の気遣いだともいえます。

表記の問題のデリケートな使い分け、とりわけ個人差・場面差の振れ幅が大きいものとして漢字の混ぜ書きの問題があります。
俗に公官庁用語、メディア表記基準、PTA規範と呼んでいいものかもしれません。
ここでざっと収集した例を列挙しますと、

すい星 こん身 急先ぽう 晩さん会 強じん 惨たん 殺りく 進ちょく かん口令  怒とう 終えん
完ぺき えん罪 岩くつ王 ひっ迫 島しょ まん延 わい曲 投てき かい離 信ぴょう性 閉そく感
冒とく しん酌 ねん挫 けん責 どう喝 親ぼく 秘けつ 改しゅん 漏えい はっ水 流ちょう
編さん めい福 改ざん ねつ造 破たん 急きょ 謙そん 研さん ほう助 招へい べっ視 かっ歩
敬けん かく乱 あい路 横いつ 洗たく 干ばつ くん製 形がい化 警ら こう配 湿しん 焼い弾
ふ頭 だ捕 ち密 花き き電 う回 危ぐ 一る 炭そ菌 語い し意的 ら致 し烈 安ど き然

…などが挙げられます。
なんだ、書ける字なのにわざわざかなに直すのはどうなのか、「大学生ら致される」は誰に致されてしまったのか、など疑問はさまざまあるでしょうが
そこにある理由・背景といたしましては

・常用漢字にないならしょうがないよね
・ポリティカル・コレクトネスの観点から
・代用漢字にするくらいならいっそ素朴にいきたい
・教育の場において児童の学習進度に応じて
・日本語のグローバル化を念頭に置いて

などさまざまなケースがあるようです。
ペンタクラスタキーボードの構えとしましては柔軟に対応すべくインターフェイスを練っておるところであります。
なお、ここではこうした混ぜ書きに批判的な声もあるかとは思いますが規範の是非に白黒つけるというのではなく、アーキテクチャーの観点、
すなわち通常変換というものがあってそこからの特殊化・逸脱は三属性変換が受け皿になって効率的なフィルター導線を配置して目的の表記に自然な形でたどり着ける、いわばアフォーダンスに則した料理さばきをしたいと思っているのでそこにはあえて触れないようにしてシステムを組み立てていきたいのです。
それはなにかというとそのためには着手優先順位を決定しなければならないということでまずは「通常変換では混ぜ書きの表記の方を優先的に選好する」ということにエイヤッと決めてしまうことであります。
これは私の混ぜ書き観に適っているからというものではなくて、絞り込みのフィルターが合理的であるからというアーキテクチャー自身の要請によるものです。
混ぜ書きはその多くが人間都合によるものであってコンピューターに理解させて取り仕切るには不向きの懸案であり、法則が読めないところがカオスでもあるので仕方なしに一番上のレイヤーでのデフォルト解釈をまずは一律混ぜ書き容認に捉えていくしかないのであります。
それからオール漢字(多少難しくとも)のほうを好むのであればユーザーの変換候補切り替えの意図を漸次学習していき以後は出さないようにオペレーションしていけばよいのです。
大事なのは漠然と学習、バラつきのある学習をするのではなくて確実に反映する学習をすることであって特に通常変換→三属性変換に遷移していったということはユーザーに明確に忌避意識がはたらいていたということでありますからこの「忌避選好アクティビティ」という重要なサインをもれなく回収する、ということであります。
そしてできれば前後の用例・コロケーションつまり周辺語句もセットで学習し以降で同じフレーズが出た時に同じ轍を踏まないよう立体的に学習そして用例登録を厚くしていくというのが欠かせません。

また、学習の積み重ねがある程度進んでいった段階で、前述のPTA規範の文書を書かなければならなくなったときが来たとして、そのときにはまた混ぜ書きをひらいていちいち学習の再修正をしなくてはならないなどということ
…こうした事態を避けるために混ぜ書きに関しては設定メニューから「それまでの混ぜ書き変換の学習結果をリセットする」機能があることが望ましいです。
通常変換にはモダリティ・文末派生モノの優先提示であるとか補助動詞・形式名詞の漢字をひらくといったもろもろのバイアスが掛かっている複雑なものであることは承知しておりますが、それらのすべてを設定でリセットできるということはもちろんできませんし周辺用例などコロケーションを併せて記憶しているとすれば処理負荷にどんな副作用がくるかもわからないのでなおさら非現実的であります。
なのでせめて的を絞って混ぜ書きに関するものだけを限定的にリセットできるようにすることは構想段階から意識して織り込んでおく、の条件付きならなんとか実現できないものでしょうか。いやいや学習プロセスの中身はよく分かりませんが無理を承知で言いたいところであります。

以上で今回は通常変換の抱える漢字⇔かな 周辺の表記の勘所について考察していきましたがやはり混ぜ書きの問題が生半可では扱いにくいものであったので、これを思い入れのままに煎じ詰めるのはやめてアーキテクチャーの制約を軸にしてなるべくしてなった、落ち着くところに落ち着いたふうの一応の解決策が示せたのは自分にとっても血肉になった手ごたえを感じました。
さまざまな指向を持つユーザーの「住み分け」ならぬ「同居」をひとつのインターフェースの元で成立させていくことは非常に難しい事ではありましたがさらなる探究をして最適解を追い求めていきたいと思います。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

三属性変換:サ変動詞の法則を覆すよろづの例

2019-07-28 | 変換三属性+通常変換のシステム考察

漢語由来の熟語には「した」「させてもらった」「された」などとつながりサ変動詞(とその変化形)を形成するものが数多くありますが、
「をする」「になる」「となる」「である」のように助詞をはさんで基本動詞と連語をなすものもそれらの延長上に関連するものだと思います。
ペンタクラスタキーボードの三属性変換ではイ万:名詞(転成名詞含む)、ロ万:動作様態用言あるいは名詞述語文/連語を形成するもの、ハ万:接頭辞接尾辞がらみまたはメタ通機的なニュアンス
…のようにざっくりと分類してはありますが、サ変動詞の語幹部分である「サ変名詞」は、名前こそ名詞がついていますが、三属性変換では<属性ロ>ロ万 のグループで処理する範疇となっております。

漢語由来ということもあって同音異義語で衝突することも多く、ワードの意味属性の特性をうまく利用してなんとか表記の使い分けに対応できるよう三属性変換というのをブログ開設当初から提案しておるところです。
語彙的・意味的ニュアンスを三属性=よろづにその弁別を託して、多様な構図・職能の言葉ひとつひとつに苦し紛れながらなんとか3つのキーで執り捌けないかやりくりしているところであります。

その中の属性ロ(ロ万)においては用言を中心とした叙述成分全般を一つに束ねようとするものですからこれは一筋縄ではいきません。
大和言葉でも同音動詞が多い事にはいまだ解決の決め手がなく苦労しているところですがそこはまずおいておいて今回のサ変動詞の同音衝突の解決にもロ万だけでなくハ万の力を借りることで逃げ道を作ることができれば同音語の問題も実用レベル程度までは乗り越えられると願うばかりです。
先程からちょっと抽象的な解説が続きましたのでここらでわかりやすく実例を挙げながら考察していこうと思います。

<サ変名詞-属性ロロ万と属性ハハ万の使い分けの例>
機能ロ万・帰納ハ万
移植ロ万・委嘱ハ万
統治ロ万・倒置ハ万
押収ロ万・応酬ハ万
移動ロ万・異動ハ万
挑発ロ万・徴発ハ万
解説ロ万・開設ハ万
収集ロ万・収拾ハ万
感動ロ万・勘当ハ万
焼香ロ万・昇降ハ万
保護ロ万・反故ハ万
支持ロ万・指示ハ万

解説:よろづハ万にはメタ的・通機的なニュアンスのものの受け皿となっていますので単に動作というよりも構造構図を俯瞰してみえる表現や接頭語接尾語を含む語句をあえて別にとりたてているものです。
接頭語接尾語を含むものとは言い切れないまでも、熟語の構成上、生産力に富むパーツを持っているものもこのハ万に属するにふさわしい喚起力をもっています。
移植がロ万となっておりますがこの字面でなんとなくハ万みたいなイメージもありますがもう一方の委嘱、これがよりいかにもハ万的な通機性をもっておりますのでこの並びとしました。
徴発をハ万としたのは徴税・徴兵などのように生産力を持ったパーツを含んでいるからです。
収拾には動作としてのひろいあつめるという意味もありますが、収集ですでにそのニュアンスは重きを置かれているので事態を収める(収拾)というのが状況変化的なハ万の特性にピッタリくると思います。
昇降は対義語が組み合わさった言葉ですので、こちらもハ万に属する材料に厚い要素だと思います。
一般的に、人間(生物)の主体的アクションは属性ロ・ロ万にあてられることが多い傾向があります。そして比較してその要素に欠けると思われる方は必然的に消去法的に受け皿のハ万へと割り振られていくというカラクリです。
このへんはニュアンスの感じ方に個人差もあるかと思いますが慣れていただくかあくまで私個人の捉え方なのだとご理解いただいたうえで咀嚼していってほしいです。

先述の典型的な三属性の使い分けの例にはうまく説明しきれないようなちょっと苦しい例もありますので、そちらもあげてみたいかと思います。

<ちょっと苦しい例>
羞恥ロ万・周知ハ万
観戦ロ万・感染ハ万
操作ロ万・捜査ロ万・走査ハ万
鑑賞ロ万・干渉ロ万・完勝ハ万
好評ロ万・講評ロ万・公表ハ万

解説:周知は能動的なアクションとして立派にロ万を任せられる要件はあるのですが、羞恥のほうがより人間的アクションなのかという印象もあってこちらになりました。
後から気づいたのですが羞恥という言葉は「羞恥を覚える」「羞恥で赤くなる」「とっさの羞恥」という主語・補語成分にもなりうるバリエーションを持っています。
もちろん「周知を徹底する」みたいなものもあるのですが組み合わせが固定的です。このわずかな違いが羞恥をロ万にもってきた構文形成力であります。あくまでも個人的見解ではありますが。
感染については必ずこれをハ万で処理しろというものではなくて、ハ万→ロ万みたいに属性をリトライしつつ遷移していっている場合は越境しても候補に出してあげるなどの配慮が求められると思います。
干渉ロ万・公表ハ万についても所属属性はボーダーにあるものと思われるのでこちらも越境またがり属性で対応すればよいかと思います。
好評についてはサ変ではなくコピュラ付随のものというのもあって傾向的により早くロ万の席を占める妥当性があるものと思われます。これが微妙に影響してその他の衝突候補は消去法的にハ万へ行きやすい、重複またがり属性になろうという「見えない力」がはたらいているのかもしれません。


…で、ここまであれこれと長く綴ってはきましたがここまでは前フリでしてこの記事で何が言いたいのかというと
ここまで述べた属性所属のある種の典型法則にあてはまらないような例外についてちょっと触れておきたいなというのが全体としての趣旨であります。
まずはあげてみましょう。

<法則を覆す例>
返信ロ万と変身ハ万
交代ロ万・交替ロ万・後退ハ万
自制ロ万・自生ハ万・自省ハ万
要約ロ万・要扼ハ万
解約ロ万・改訳ハ万
進化ロ万・深化ハ万
添削ロ万・転作ハ万

解説:返信は返答・返礼みたいに生産力のある要素のものでありハ万に所属すべきなのだという意見もうなづけますが対抗の変身も構造的変化で通機的要素ももっていながら、子供たちの遊びのなかで「変身!」みたいにやる場面も見えてきて人間主体のアクション要素もありますからどれをロ万にするのか迷うところでもあります。
結局、「日常的動作」という面において、現代のスマホ・SNS社会の趨勢から言ってむしろ「返信する」のほうがより頻出するのではないか、という結論に落ち着きました。
表層上を見ていますと一瞬ハ万にも見えるのですがロ万の大事な決定要因の中に「より日常性がある」というのを気づかせてくれた稀有な事例だと思います。
交代/交替についても自制・進化についても日常性を鑑みてロ万にとりたてることとなりました。このへんの感覚は異論のある方もいるかもしれません。
後読み方が難しいのですが「要扼」(ようやく)の意味は敵を待ち伏せして食い止めること。とあり「前もって分かっているニュアンス」が通機的なニュアンスにこじつけられないこともないので属性ハ・ハ万へ受け持たせて日常性の高い「要約」をあえてロ万にもってくる処置としました。
「要約」はいかにもシステム的でハ万らしいところもあるのですが仮にロ万に設定するとして律儀なユーザーが通機ニュアンスでハ万の「ようやく」を押してみたものの「要扼」が出てきてなんだこれはと面食らっても「あー素直に動作としての要約にすればロ万でいいのだな…」と後から軌道修正もできそうなのですがその逆は成り立ちそうにもありません。
こういう語彙とキー打鍵遷移の非対称性もあってこの属性分けを後押ししてくれているかと思います。
解約についてもほぼ同じ理由です。もちろん日常性があるというところも大事です。
添削という言葉については、添は添える、削は削るで対義語構成の熟語ではあるもののより人手のかかっているのを感じますし転作の方の生産力の強いものを含む系のものほどハ万への帰属性が対義語構成の熟語のものよりわずかに強いのではないかと感じています。
一応検証はしていないので確かなことは言えませんが、ハ万になるということ自体がいろんな要素の複合からなっているのでロ万-ハ万と競合するときにではどの要素がよりハ万にとって欠かせないか個々の関係性というか優先順位も整理していかなくてはならないなという新たな課題も見えてきました。


以上、三属性変換の基本は押さえておくのも大事ですが、組み合わせ動作、順次動作でそのふるまいがとても奥深くて実のところ説明考察していくのが結構しんどいのですが、ラーメンに例えるとインターフェイスの真髄の入ったスープのダシみたいなものですから、妥協せずにぐつぐつ煮込んでいきたいなと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

アニメキャラ名の止め字を変換できるとうれしい

2018-09-01 | 変換三属性+通常変換のシステム考察
ニャル子・クー子・ハス太・ニャル夫・シャンタッ君・ニョグ太・ナチャ橋・ニャル滝・イス香・アト子・クー音

…これらは名状しがたいアニメ 『這いよれ!ニャル子さん』に出てくるキャラクターの名前です。
これらは日本人一般の人名で目にするパーツや名前の「止め字」と呼ばれる結び要素(子とか太とか)を配置してそれっぽく見せた創作の人名であります。
こんな名前が一発変換できれば面白くないですか?
このような人名はお遊びの範疇でありIMEの機能でわざわざサポートするものでもなかろう、と訝し気に構えてしまわれるのも無理はないかと思いますが、
「コンビニで懐中電灯が売っていればうれしい理論」と同様に、さほど需要がなくともたまにないとすごく困るものが置いてあると店への信頼感がグンと高まり利用基点としての地位を確固たるものにするのと同じ効果が期待できると見込んでいるのです。
アニメキャラに関わらずとも、「ジョニ男」や「チャラ男」のように人称パーツの言葉遊び的用法は一般的でありますので間口は広いイシューなのではないでしょうか。
ここで着目するのは「ジョニ男」や「チャラ男」のように逐一単語辞書に登録しておけばよいというのではなく、ポプ子・ピピ美・ナオ太・ハル子・マミ美・ルル子・モジャ子・パゾ美のような未知語としての人名にも常に変換してくれるという安心感をシステムとして提供できないかということです。

以前このブログで三属性変換の応用例として過去記事
属性選択の遷移過程を反映した変換候補のリオーダリング - P突堤2
において解説してきたことの延長なのですが、
「○○美や○○男などの生産力のあるパーツを使っている」
「それでいて固有の人名を表している」
という2つの条件を具有しているという特徴はまさに「接辞からみの語句=属性ハ」と「人名・名詞=属性イ」の三属性の遷移過程をトレースすれば限定性が際立つので、
単文字「み」や「お」という接続の広い分断のしかたであっても適切に人名/高生産性の「美」であると解釈できるという理屈が成り立つのです。
せっかく通常変換から一歩踏み込んだ三属性変換なのですからこういうローカルイシューを利用しない手はありません。
他にはポメ吉・キキ菜・チワ丸・トケ井・ポメ千代・キョロ乃・ちゃき右衛門 などの人名(ペット名?キャラ名?)などといったものに出会いましたが、
これらのキャラ名は概して基本カタカナ+典型要素 の構成が多いものだと言えますので変換のデフォルトはカタカナで良いと思います。
--中にはちゃき右衛門のようにひらがなであったりトケ井のように苗字部分の止め字だったりする例もありますが基本的な考え方は通じると思います。
あとは「奈」と「菜」や「夫」と「男」などの複数候補がある場合もあるのですがこれは地味に候補選択で使いわけるしかないですね。

もっと発展させて考えるのなら、
立つ瀬無し夫・口先ペラ男・びっくらこき麻呂・がまぐちふくらみの助・口数多子 のようにひとかたまりの句や何がどうしたの言いさしを含むパーツであっても柔軟に対応できればなお良いかと思います。
「たつせなしお」にしても「辰瀬奈塩」のように脈絡のない変換はいかにもこじつけっぽいですし、「お」さえ決定済みというヒントが与えられているのなら「立つ瀬無し」がもっとも無駄のない変換であるのは言わずもがなです。
ここはちょっと込み入ってはいますが実現できないほどの難題とまでは言えないと勝手に考えています。

せっかくキャラ名の変換も考えたのですから、それとともに深く関連する事項としましては、
たっ君・海坊・源爺・エモやん・ヤンさん・メーガン妃・ベイダー卿・芭蕉翁・ナチ公・さや姉・プロシュート兄ィ・遠藤関・ホメイニ師・日ナレ生
…などのような尊称や役職、立場関係の呼称名詞接尾辞一般についても[属性ハ]-[属性イ]経由での遷移変換で狙い目通りに処理できればありがたいところです。
これらはどれも末尾要素に呼称語がついているのでアニメキャラ人名と同様特徴的ではないかと思われます。
「日ナレ生(にちなれせい)」についてはちょっと変換が難しそうですので、この前提案した「トランス音訓変換/パズルのピースをはめる変換」の方で対応するのもアリかもしれません。このへんは臨機応変にということで…。

さらにいえば
Y田さん・F川さん・H美 のようなアルファベット混在時のケースや
マリアっち・凛にゃん のほか○○ぴょん・○○たん・○○っぺ・○○りん
なども先述の延長上で実現可能かと思います。
何もこんなオタク根性丸出しの些末な変換に肩入れしてどーする、と思われるかもしれませんが単純に法則性に則ってバリエーションをちょっと足すようなものですのでこれも一種の「もったいない精神」のあらわれでありますのでどうぞご容赦ください。

再びキャラ名の変換について考察していきますが、「○○丸」とつくようなキャラ名には
剣獅子丸・爆烈丸・九十九丸
のようにカタカナではなく漢字が使われる例の方が優勢である場合もありますのでこのへんはここの止め字に応じた細かなチューニングが求められるかもしれません。
[属性ハ]-[属性イ]経由ときておりますので変換候補をずらずら出すためにはこのまま[属性イ]を続けて押下していくものなのですが、漢字パーツという文字列の特性上、目的の語にきちんとたどり着けるかどうかインターフェイス上の難点が懸念されるところではあります。
ここのところはまだ改善策が見つかっていませんので今後の課題としていきたいかと思います。

あとは世間一般の人名の止め字には
希/沙/穂/佳/哉/吾
などのようにある程度定型的な止め字もあるのですが、「美」や「菜」などのように音感/添え物的な止め字の類だけにとどめておいて前述のような"語彙的止め字"については適用を控え気味にしていった方が良いのか判断の分かれるところでもあります。
あくまで感覚的な分類ですし明確な線引きは決まってはいないのですが、気軽に創作駄洒落人名を作るのにはある程度タイピカルな「型」というのがありますのでその流儀に従うのであればある程度制限するのは仕方のないことかもしれません。

最後に人ならざる者の「人生」をあえてひねくり出したいときに
ニャン生・ワン生・犬生・魔女生・ロボ生
のように当て字をすることもありますがこの例はタイピカルな接尾辞というわけでもなさそうなので対応範囲に含めるべきなのかというのも本質論として浮かび上がってくると考えます。
属性ハの挙動性質の位置づけをもっと検証していくことが求められますね。今後もこのトピックは深掘りしていきたいところです。

以上でアニメキャラ名という切り口で入ったこの議論でしたが三属性変換の奥行きについて考えさせられた面白いテーマだったと思いました。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

隅(すみ)と角(かど)は似ているようで属性が違う

2017-09-15 | 変換三属性+通常変換のシステム考察
三属性変換では目安として名詞/動詞などの品詞から属性の所属が決まっているようですが、これは厳密なものではなくケースバイケースで属性が思惑どおりでないことがあります。
たとえば、隅(すみ)と角(かど)のように、

すみ-炭/墨/須美/須見/鷲見:属性イ、済み/住み/澄み/棲み:属性ロ、☆隅:属性ハ
かど-☆角:属性イ、過度:属性ロ、過度/廉/カド:属性ハ

…この違いは別に「角のほうが突起感が出ていて物体的な主張がある(よって名詞的)、隅はなにか領域的なことでモワッとした抽象概念ぽい」…などの憶測で所属属性が決まったというわけではなく、
同じ同音語でもっと具体的名詞的な「炭」が先に割り当てられるのでそれならばと余りモノ的に属性ハ(トポス的概念でもあるので)に「隅」が落ち着いたという図式があったり、
「角」もトポス的概念をもちながらもすでに属性ハには過度(接辞系)、廉(抽象度が高い)とがありより優先度が高いとみて実体性の高い「角」のほうは名詞属性の属性イに充てられたという経緯があります。
まあ理屈を言うと小難しいようなのですが、三属性変換ではどの変換候補にもあまねく司る分類の判断基準というものがなく、あくまで同音異義候補間での相対的意味・用例関係で所属属性が決まってくるというご都合主義によって成り立っているところがあるのです。
三属性変換では厳密な品詞体系をもって単語のふるまいを一元的に制御していこうというものではなくて、その場その場の同音異義語の衝突を脚色ならぬ"脚品詞"して柔軟にさばいてしまおうという発想なので、あえてシステム的に未分化なカラクリで構えているわけです。
なのでこの「隅」と「角」のように一見似たような範疇の言葉でも変換グループが分かれてしまうことがあります。

※なお、廉(かど)とはある事柄の原因・理由となる点を意味する抽象名詞で「横領していた廉で逮捕された」のように使われます。


今度は視点を変えて、属性は同じであるものの同音語の所属が特徴的なケースを挙げてみます。
たとえば、度(たび)と毎(ごと)もその一例です。

たび-足袋/旅:属性イ、旅:属性ロ、☆度/旅:属性ハ
ごと-事:属性イ、ゴト(=行為):属性ロ、☆毎/言/事:属性ハ

「度」はカウント概念なので抽象的な属性ハです。「足袋」もすでに名詞属性として有力ですから重複回避的にここに落ち着くことに異論はないでしょう。
「毎」もカウント概念なので属性ハに所属するのは妥当ですが、「事」はちょっと特殊です。
「事」は「毎」の方に抽象概念担当を譲ったので替わりに名詞色が強い事を汲んでまずは属性イに所属します。
ただ「事」には勝負事や隠し事のように接尾語要素として機能する側面もあることから接辞まわりをカバーする属性ハも担当しています。
所属を兼任することは三属性変換では普通にあり得ることでユーザーがどちらの用法での変換を望んでいるかにもれなく対応するために敢えて冗長的になるよう意図しているところです。
ただ、その属性内での変換候補順位に差が出たりなど細かな違いが出てくるのは「どちらがよりその属性ニュアンスに適っているか」の評価を勘案したものになっています。
なお属性ロのカタカナの「ゴト」はスラング的で単語辞書に収録するまでもない言葉のように思えますが、二文字程度の語は三属性変換のポテンシャルを発揮するためにいっそのこと些細な語彙でも網羅的に収集したほうが良いのではないかとの方針で仮に提示したものです。


このように3種の変換キーの用途は品詞のみによって定まっている(文法的要因)のではなく、意味的・語彙的なもののファクターを微妙にミックスした帰属決定システムとなっています。
余談ですが、「たび」の変換候補である「旅」が名詞属性イと用言属性ロと属性ハで兼任して所属している事にも意味があります。
旅自体はもちろん名詞なので属性イに所属するところまでは飲み込めそうですが、一人旅や傷心旅という言葉もあることから接尾語機能として属性ハも兼任することにも必要性があります。
さらに、ここからがややこしいんですが「旅」はサ変動詞「旅する」の語幹でもありますしゴルフの「OBショットが一人旅…」などのように形容するときもある種の用言の相を呈しているニュアンスも用例としては持っておりそれらの複合的な要因で属性ロへの帰属も果たしています。
こんな調子ですべての属性への帰属を兼任しておりますが、同グループ内での候補順位はそのままでは低く、属性イ→属性ロなどのように変換キーを移行するタイプ遷移のときに上位に上がってくるふるまいをすることを想定しています。
(参考過去記事):属性選択の遷移過程を反映した変換候補のリオーダリング

このように品詞分類にとらわれない三属性変換は、本ブログで新たに導入した、文法的縛りのより緩い「よろづ」のクラス分類だからこそ可能だと言えるでしょう。
疑問点としてはそもそも通常変換をするときの形態素解析の基本単位は文法的に整理された品詞をよりどころにしておこなうべきもので、何やら訳の分からない「よろづ」というのはどういった説明原理になるのかわからないといった点が出てくるかとは思いますが、
今は手探りながらも地道に実例を挙げながら品詞とよろづの2本立ての筋道を併存させていくべく暗中模索しているところであります。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする