P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

品詞界一のかしこ・形容詞は入力上の扱いがそんなに甘~ない

2022-06-28 | 形容詞研究

形容詞(イ形容詞)は形態上いろんなバリエーションがありすぎてさすがに別口入力を備えて文法的定型動作に組み込もうとしてもなかなかそうは問屋が卸しません。
先の配列改善案で形容詞連用形活用語尾「く」の別口入力入りという博打に打って出ましたが時すでに遅し、形容詞関係の見通しの据わりの悪さにはほとほと手を焼いています。

形容詞活用はもともと別口入力の追加候補として検討に至ったこともあったのですが形容詞のすべての「い」にいちいち別口入力を必須とするのも煩雑で現実性に乏しく、
別の形容詞:ナ形容詞については生産力も旺盛でカタカナ新語のナ形容詞の生み出される素地というのが大きかった(コアな・損な等書き分け便利)のでその陰に隠れて造語新語の見込みも少ないイ形容詞へのケアは後回しとなっていました。
しかしタッチ液晶サジェストでの規定フレーズ予測変換との相性が良いことがだんだんわかってきたのでとりあえず連体形/終止形への受け皿はタッチ液晶がこなすこととして別の活用形:
連用形「く」を最前線に格上げして別口入力のまな板にのっけていこうとの目論見で様子を見てみようということで思考実験がてらその運用考察をしております。
活用形「い」の導入をあれだけ躊躇していたのにいざタッチ液晶で活躍の見込みが与えられると「なんだいっ、連用形『く』にだって使い道ってものがあるんだいっ!」ってな具合にやせ我慢したくなるものだから創作の世界ってのは不思議なものであります。
「く」がらみの詳しい解説はまたあとであげていきたいとは思いますが
大雑把に言うと連用形は連体形よりも後続の叙述展開の開放度が高い=先が予測しづらい
ために構文解析上の何かヒントになるようにマーキング要員としてぜひご活躍いただきたい、ひいては通常変換のプロセスにおいて「副詞(≒連用修飾語)の検出を優先的に着手する」という方針とも合致するので分解能向上に寄与するのは推して知るべし、なのである。
…という理屈の要請に応えてのことであります。

ただし、連用修飾検出のためだけに貴重なリソースを割くのは"ぜいたく使い"と言われかねないので
マーキング識別子の利点を生かしてさまざま雑多な形容詞のややこしいバリエーションになんとか喰らいつけないか…?との試みでいろいろ機能を模索しています。

まず変換泣かせの形容詞の形態として難題の「イ落ち構文」への対応策があります。
「イ落ち構文」とは
高っ/低っ/重っ/安っ/細っ/薄っ/臭っ/近っ/強っ/弱っ/ちいさっ/すごっ/肩身狭っ
などのように形容詞語幹単独用法ともよばれておりますが、形容詞を活用語尾まで言わずに語幹の部分で言い切る語法とされております。
これらの語は従来のIMEでもすっきりしない変換プロセスでもあり(単漢字変換じゃないと出なかったり)特に短尺のものは他の変換解釈と混線をして悪さをするイレギュラー要因でもあります。
これをたとえば
かる[く]っ ※くは別口入力 
のように入力して、タイポはともかく形容詞という情報は与えられているので変換出力を拡大解釈して
かる[く]っ→軽っ
のように柔軟に変換してやろう、というアイデアであります。

もちろん
軽くったって夜食は夜食
みたいに本則で妥当な変換は第一候補にあげるとしても
区切れ目の軽はおそらくこれでだいたい用は足せるかと思います。これもマーキングの恩恵です。
併せて言うと「駆る」「刈る」「狩る」等の動詞活用の語も除外できるのが自慢です。
楽観的な見通しでありますが、関西弁に特徴的な
あーしんど
ダサなっとる
世の中そんなに甘ないで
良うございます
お暑うございます
などの変化も、場当たり的な登録辞書の収録ではなく文法機能でもって変換を規定することができる日もくるかもしれません。

…まあうまくいけばの話でありますが形容詞はもっともっと思ったよりハードルが高く一筋縄ではいきませんね。
口語でくだけた形の言い方にも
固ぇ・広ぇ・悪ぃ・凄ぇ・古ぃ・強ぇ・かっけぇ・だっせぇ
などは語幹も含めて変化しているのでどうにも始末が悪いです。
これはすぐには解決策が見つかりそうもないのでのちのち俎上に載せていきたいと思っております。

補足的な観点で言えば機能形容詞のようなもの
ぽい、たい、よい、ほしい、みたい、らしい
などの境界領域で、あえて[く]マーキングをほどこして文法構造をはっきりさせる、誤変換誘発要因を軽減させる
などの試みも課題の一つでありますね。
-----------------------------

さてここまでは形容詞の活用という面から変換に関与できるかどうかを探っていきましたが、
生産性の面から言っても無視できない
複合語構成要素=接辞あるいは造語成分
としての形容詞語幹の使われ方にも注視していかねばなりません。

これはペンタクラスタキーボードにおける造語/未知語へのクイックアクセス手段として
新カテゴリ「[Ø]活用と単漢字変換の打開策」 - P突堤2
の過去記事でも提案している
「[の][の]代表変換」「トランス音訓変換」
の手法を援用して形容詞語幹を含む合成語・複合語を形成していくプロセスについて説明せねばなりません。

トランス音訓変換のほうで説明しますと、この提案作法は漢字を多く含む創作語あるいは未知語をタイプするのに難儀していた文字選択を
従来の単漢字変換の枠組みをもっと拡張して音読み/訓読み行き来自在のトランス音訓マッチをほどこすことにより
同音で埋もれやすい漢字の当て込みを訓読みや別の熟語からの代表字というのを設定してすばやくアクセスできるようにするというものであります。
重要な点は単に[よみ-変換単語]だけの対応関係=2項参照ではなく
[全体としてのよみ-訓読み可能性当て込み-音読み熟語からの代表字の可能性当て込み]=3項参照のすりあわせ
で未知語複合語を、ユーザーとの綿密なやり取りによって一からビルドしていこうというインターフェイス上の工夫です。

例として呪術廻戦に出てくる用語
「蝕爛腐術(しょくらんふじゅつ)」
というのを初見でタイプしたいときには

1.まず変換前の読み文字列「しょくらんふじゅつ」をタイプする
2.新設の②キー(登録ワンタッチキー)を押してここまでの文字列に着目・捕捉動作をする(それと同時に単語登録プロセス開始)
3.捕捉した「しょくらんふじゅつ」を読みとしてちょっと二度手間だが「蝕」「爛」「腐」「術」をあてはめていきたい
4.むしばむ[の][の]で変換すると「蝕む」ではなく送り仮名のない「蝕」が代表変換されて一文字目がタイプされる
5.けんらん[の][の]で変換すると「絢爛」のうち「爛」の字だけが代表変換されて二文字目がタイプされる
6.くさる[の][の]で変換すると「腐る」ではなく送り仮名のない「腐」が代表変換されて三文字目がタイプされる
7.じゅつ[の][の]で変換すると「術」がそのまま変換されて四文字目がタイプされる
8.「じゅつ」まで使い切ったので読みの文字列はこれ以上ない、終端部分と認識して同時に
  読み:(しょくらんふじゅつ)、単語:(蝕爛腐術)のデータが紐づけられて単語登録が終了

…以上のようなプロセスで入力していく方法です。
インターネット上あるいはビブリオ界では常に新語・造語・新概念が生み出されており特に漢語複合語のタイピング作法には常々不満を持っていましたが
個々の単漢字へのアクセスの手段を拡充しインデックス回遊性(引き出しが豊富)を高めることでわれわれのこだわりの言語欲求にも応えてくれそうな新提案ではないでしょうか。

もちろんこれに複雑に絡み合うのが三属性変換の接尾辞変換を受け持つハ万の変換キーなのでありますが
今回の形容詞語幹の問題はなにも接辞派生語の語構成ばかりではなく
冒頭の画像にもありますように
驚安(きょうやす)をはじめとしてコク旨や地味ムズ技、胸熱、甘ロリ、期待薄、懐ゲー
などなど完全には接辞的でないところでの漢字使用などもあります。
あとは
ぬるゲーマーやかゆうまなどのようにひらがな語片として保持したい表記上のわびさびを必要とする形容詞変換や、
お薄、お古、おめでた、おねむなどのように接頭辞「お」の付属した体言化した形容詞の変換など
ときに三属性変換、ときにトランス音訓変換などのように適用場面を使い分けながらタイプしていく"プランB"があってもよいと思います。
このへんの細かいチューニングはトランス音訓変換のさらなる修正が求められる懸案であるとともに互いの機能が干渉しあわないように受け持ち領域の境界を明確に定めていくことが必要になってくるでしょう。
漢字断片入力のときには形容詞終止形からだけしか当て込みピースを投げれないということにすると
「若」を出したいときに「わかい」から導くようにさせてしまうと「和解」と「若い」で衝突してしまう例もあるのでここはやはり別口入力[く]のマーキングを添える形のほうが混乱がなく賢明であるかと思います。

以上で今回の論説は終わりです。

もうそろそろ、

みたいな不合理をなくす入力方式が切に求められることを感じずにはいられないぴとてつでありました。

 

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする