P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

§3:でにをは別口入力

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

PCやスマホの誤変換ジョークに「ぎなた読み」というのがあります。
別名「弁慶読み」ともいい
「弁慶がなぎなたを持って」とするところを
「弁慶がな、ぎなたを持って」と文章の区切る場所を変えることによって
全く別次元のとんちんかんな誤読をしてしまう古くからあるジョークです。

これくらいなら笑って許せるレベルですが
「今日歯医者に行く」
「今日は医者に行く」
と、こんなことも区別できない助詞の絡んだぎなた読みなどはワープロ泣かせの頻出懸案であり
読む・話すはいいけれど入力の段となると途端に不如意さが増すトホホな有り様…。
分かち書きのない日本語が抱える"デジタルの宿痾"であります。

それなら日本語入力において
助詞を明確に分別して文字コードも完全に別物にしてしまって
かな漢字変換の文解釈プロセスから曖昧さを物理的に排除してしまえば
このような悩みを根本的に克服できるのではないか?
それを実現するような新しい試みが
ペンタクラスタキーボードの「でにをは別口入力」のシステムです。

キーボード盤面の手前側エリアには各種別口入力キーが並んでいます。
これを入力文中に各単語に混ぜながらタイプしていき、
1打鍵で文字ひと文字分のリテラル情報と
その文字が別口入力であるという文法情報とを同時にマーキングしていきます。
言い換えれば
キーストロークという文字ストリーム進度と区切り目であるというメタ情報を
同時に獲得していくインタラクションを実現しているということです。
とりあえず別口1文字打鍵すれば打鍵進度が確実に進んでいけるところがお得な感じですね。

別口入力には単文字の助詞や「だ、です」などの機能辞、活用形に埋め込むマーカーや組み合わせ動作など
ぎなた読み困難性や造語(未知語)、さらにはこだわり表記の軽便に対応できるようにするために
さまざまな誤変換の教訓から練りに練って厳選された22もの専用のキーを駆使していきます。
これから順を追って解説してみたいと思います。

別口入力画像1s

(画像をクリックすると別タブが開いて拡大します)


緑色の文字が別口入力キー画像(792)

まず「が」「を」「と」「へ」「や」「は」「も」「か」「だ」「の」「に」「で」「て」「なの」「な」「し」「でs」「○R」「×r」「く」に加えて新設の「Vん」「じゃ」
のような代表的な単文字の助詞や機能辞が採用されています。
それらを文章に混ぜ込みながら入力文字列をビルドしていきますので
構文解析上の判断材料・ヒントがおのずと増えることになり
細切れのもったいない使い方の入力・変換スタイルとは一線を画し
ユーザーにはロングレンジでの長文入力を期待できる作りとなっております。

単文字の助詞をマーカーとして使えばたとえば
*何回も見たい/なんか芋みたい
*車で待つ/来るまで待つ
*干し芋のリスト/欲しいものリスト
みたいなものも簡単に使い分けることができます。
これが「でにをは別口入力」です。
でにをは別口入力は単純明快にして強力な誤変換抑止ギミックであります。

でにをは別口入力には単文字の助詞のほかに「だ」「な」「でs」「る型動詞マーカー」「し」などの機能辞もカバーしております。
この中の「だ」「な」については
「健康だ」「ミステリアスな」などの形容動詞使いでの使用における活用語尾だ、な に注目して
健康[だ]った・健康[だ]ろう・健康[だ]からなど各活用形の様々な派生フレーズにおけるマーカーとして[だ]を使います。
形容動詞語尾[な]の別口入力は
「ハイ[な]」「異[な]」などの短尺形容動詞の切り出しに期待できるほか
「バンカラ[な]」「チル[な]」などのように「晩から」「散るな」といった本来的な変換候補との競合を回避して
「な」の前にある前置要素をソリッドに浮き立たせて絞り込むことができるうえ
データ処理的にも形容動詞の語幹としてわかったうえで認識できるというメリットがあります。
ただし「だ」については、断定の助動詞「だ」と形容動詞の活用語尾「だ」が
カタチ上は全く同じであるという偶然(必然?)も手伝ってかなかなか混同しやすいところではあるのですが
ストロークにおいては両者とも同じような感覚で入力していくという結論になりました。
「だ」については断定の助動詞と説明しましたが以後は本術語を「コピュラ」と呼称することにします。

次に「だ」とも関係の深い格助詞「で」でありますが
デアル文で使われるコピュラフレーズでの「で」と形容動詞での「で」も
先述の「だ」「な」と同様に区別せずに使っていけます。
注意しなくてはならないのは
「死んで」「学んで」「泳いで」などの接続助詞「て」の音便形に現れる濁音化のフレーズでの「で」と
混同してはならないということであります。
別口入力[で]の適用は、格助詞としての「で」のほか、デアル文や「そうで」「ようで」「みたいで」などの助動詞フレーズの「で」または形容動詞の活用語尾「で」が適用要件となっております。
*秒[で] ザギン[で]シース― ウラン[で]臨界 遅れてるみたい[で] スリリング[で]
具体的には上記ほか
場所・方法・道具・材料・範囲・期限・原因・理由
手段・様態・方法・構成要素・内容物・付着物 などの用法の
「で」だけを別口入力マーキングとして許容するものとします。
ここは間違えやすいところでありますので十分注意しましょう。

これと並行して接続助詞テ形の「て」が、別口入力インターフェースを設計する段において
異形態「て」と「で」の差異を吸収するようなコンバーチブルな設計にしなかったのはなぜでしょうか?
これは例を挙げればすぐわかる事なのですが
「書いて」と「嗅いで」の区別が原理上できないからです。
ですので別口入力でマーキングするテ形要素は[て]だけに限定し
音便形の「で」はそもそも格助詞のほうの「で」との無用な混同を避けるためこれを採用しません。
よって接続助詞テ形の濁るほうの「で」はべたかな文字列で入力し、マーキングをしない片務的な運用とします。

別口入力[て]はブログ開設当初の初期案ではコンセプトに掲げてはいなかったものの
やがてその重要性に気付き採用するに至った経緯があります。
このためこのシステムの名称を「でにをは別口入力」と少しアレンジを加えて呼称しているのも
こうした初期のアイデアの名残りであります。

ここで皆さんもお気づきかとは思いますが別口入力の[の]が二つもあって無駄じゃあないか?
と疑問をお持ちの方も多いでしょうが
これはのちのち別の解説で詳しく取り上げていきたいと思いますので今はスルーしてください。

解説を続けていきます。
ここからは助詞ではないものの表記や文解析の要員として欠かせないものをご紹介します。

別口入力画像2s

(画像をクリックすると別タブが開いて拡大します)

まずる型動詞の表記の用に助かるのではないかと期待している別口入力[○R]と[×r]です。
*タグる バズる テンパる モメる ウケる キョドる
読み方は大文字の方が"まるあーる"で小文字の方が"ばつあーる"です。
る型動詞というのは私の造語で、混同を回避するために従前からのル形動詞(ルけいどうし)の説明を今少し挟んでおきますと
*ル形動詞(るけいどうし)とは
*述語の辞書形やマス形はル形と呼ばれ、「〜た」で終わる述語はタ形と呼ばれる
*述語は動詞に限らず、イ形容詞・ナ形容詞・名詞述語文もある
*走る/高い/静かだ/学生だ[ル形(丁寧形含む)]
*テンス(ル形/タ形) 
*非過去(現在/未来)|過去
学術界や日本語教育界隈ではすでに「ル形動詞」というのが確立されておりまして
しかもこれは別に辞書形とも呼び、普通形と過去形の対立、
つまりル形とタ形のテンスの対立という文脈で使われる術語ですので
ル形は語尾に必ずルがつくとは限らず「食べる」「書きます」「高いです」「学生だ」のような一般動詞や形容詞、名詞の述語全般にもル形が使われます。

私がここでいう「る型動詞(るがたどうし)」は若者言葉やスラングで使われる
カナ語幹+る
のカタチの造語・新語に対応できるよう考え出されたものを便宜的に「る型動詞」としているものです。
ちなみに[○R]と[×r]のキーはシフト打鍵をすると入力モードに関係なく○と×がすぐに出せます。
ここでは専らる型動詞の説明に用いていきます。

[○R]は終止形・連体形に限って使われる別口入力です。
仮に「ググる」というる型動詞を引き合いに出しますと終止連体形のググるは
ぐぐ[○R]
とタイプすれば「ググる」と語幹をカナ表記に保って変換されます。これは基本で不変的な使い方です。
そして[×r]のほうは前後の文脈を読んで後付けで可変的に変化させる
ワイルドカード的別口入力です。
これはいろいろまちまちなのですがまとめて列記しますと

否定形ググらないは「ぐぐ[×r]ない」
仮定形ググればは「ぐぐ[×r]ば」
命令形ググれは「ぐぐ[×r]」(文末)
使役形ググらせるは「ぐぐ[×r]せる」
使役受身形ググらされるは「ぐぐ[×r]される・ぐぐ[×r]させられる」
意思形ググろうは「ぐぐ[×r]う」
マス形ググりますは「ぐぐ[×r]ます」
希望形ググりたいは「ぐぐ[×r]たい」
のように入力すれば自動的にらりるれろのレンジの中から適宜充てこんでタイプしていきます。

命令形ググれみたいに格助詞の展開によって用法違いで使われると「ググれと言われて」「ググりが甘いよ」のように
判定が曖昧になってしまう難点も残りますので
このへんは液晶のサジェスト候補の援助も借りまして
なんとかインターフェースとして成立させていきたいとの目論見であります。
ここでも例外処理がありまして
ググれる・ググられる等の受身可能尊敬自発の助動詞の絡むものは一律に適用範囲外であります。(使役は大丈夫)
ただでさえワイルドカードの処理でうるさいのにややこしい文法的バリエーションについていける余裕はありません。
ここは混乱回避のため、ご面倒でもベタ打ちストロークで入力していってください。
ユーザーに認知周知させていくことも大変だとは思いますが
この方策で微妙な表記のアヤで苦しんでいたカナ語幹+るの新語造語に即応できるだけでなく
もちろん従前の通常の動詞:渡る・起こる、みたいな場合は
べたかな入力でマーキングを伴わずに入力していきますのでそんなに構える必要はありません。
(してもいいのですがマーキングするとワタる・オコるみたいに語幹カナのほうが候補優先されます)
いずれにしましてもユーザーに選択肢が増えるというのは文字入力の実情にも適っていると思います。

次にサ変動詞の弁別・単語登録に役立ちそうな別口入力「し」です。
これは主にサ変動詞の活用の変化において「し」を含むフレーズに特化した別口入力です。


サ変動詞[し]でマーキングする活用形
(検討し/遣唐使 の使い分けに役立ちそうですね)

画像のように活用バリエーションはさまざまありますが
とりあえずこの中から「し」でマーキングできる部分だけ別口入力で対応する方向性でいきます。
「し」はあらゆる誤変換の例でもかな文字の中でもっとも注意しなければならないものですので
あえて「し」一文字のためだけに特別に専業的に別口入力を用意したものだとも言えます。
(特に連用中止用法対策)
もちろん肝心の「○○する」(終止/連体形)がないじゃないか、と訝しがる向きもあるかと思いますが
「○○する」のバリエーションはよりナビゲーション性の高いタッチ液晶での役割に支援を任せていますので
基本コンセプトのシリーズ解説(§5)をお待ちください。
この[し]キーと[て]キーだけはキーボード盤面の手前ではなく盤面左右の端に配置してありますので
配置図を見ながら操作イメージをあれこれ巡らせてみてください。
[し]のほうは記号交じりのクラスタキーでの提供となっておりますがちゃんとい段方向に押下しますので
少し押しにくそうですが違和感はないと思います。

次に「だ」と並んで頻用されるコピュラ、「でs」キーの解説です。
[でs]キーはすでに説明した「だ」と同様コピュラあるいは形容動詞のフレーズで使われます。
カタチの同じ両者は形容動詞のときは連体形の「な」が専属でついてきましたのでわかりやすかったのですが
「でs」のときは
○元気な時(形容動詞の連体形はつながる)
×元気です時(敬体の形容動詞のときは成り立たない)
という敬体独特の微妙な差異がみられますのでご注意ください。
「『です』の連体形」は助詞「の」「のに」「ので」(準体助詞の「の」)を伴って用いられ
一般の体言を修飾することはないのが原則です。
タイピング時は「でs」もワイルドカード可変的な別口要素ですので
「[でs](終止)」のときは「です」
「[でs]ょう」のときは「でしょう」
「[でs]た」のときは「でした」
「[でs][て]」のときは「でして」
のように後続の文字列によって自動的に変化します。

ここまでル型動詞、サ変動詞、コピュラ&形容動詞
のそれぞれについて完全とまでは言えませんがそれなりの入力の手当てをしてきました。
日本語の中枢を担う主な領域についてはカバーできているかと思います。

長くなりましたが終盤にもう一押し、形容詞連用形の「く」の別口入力です。
これは直接には誤変換の要因となることは少なさそうなのですが、組み合わせ動作で真価を発揮するので導入しました。
ただ「北区内(≠来たくない)」「三田区内(≠見たくない)」などピンポイントの誤変換は依然としてまだまだあります。
別口入力は形容詞フレーズでの各種の連用語尾にあわせて適宜マーキングをお願いします。
*(聞きた[く]なる、まず[く]ない、めんどうくさ[く]て)
こうしてみるとマーキングするほどの文法標識でもなさそうなのですが
文解析において形容詞の検出が思ったより難所であるな…との手応えから必要に迫られて導入した別口入力であります。
そして大事なところはその発展形としての入力作法に際立つ眼目がある事。
すなわち口語でよく使われる「怖っ!」とか「狭っ!」のような「形容詞のイ落ち形態」に対応できるという事です。
これはこれまでの日本語入力ではすんなり変換できず
「固い」と変換してから「い」を削除するなんていうまどろっこしいことがおこなわれてきました。
これは形容詞という品詞情報をマーキングすることによって埋もれがちな候補が一気に絞られて
タイプ数も視認の手間もすこぶる改善します。
「旨」を単漢字で出したいときには「うま[く]」と入力して変換を押すと
筆頭候補こそ「上手く/旨く」が出てきますがそのまま変換を連打して候補を送ると
次点候補以降に「く」を省いた文字列「旨」が巧みに整形されて提示されます。
これは語幹が「エモ」(エモい)のようなカナ語幹であっても入力学習によってかな整形/カナ整形を適宜おこなうこともできますし
さらには「芳しっ」(かんばしいっ)のような小さい「っ」を伴う字面であったとしても
入力の段で「かんばし[く]っ」とすればそのフレーズを見てイ落ち・促音付きの表記にもついてこられます。
これらイ落ち形態へのアクセス向上により、ドン・キホーテの店内POPに見られるような
「驚安」みたいな単漢字フラグメントもビルドしやすくなるというものですね。

そして続けて紹介する形容詞がらみのギミックとしては
*エモみ・慎重さ・非力げ
「み」「さ」「げ」(接尾辞付加)の派生にも処方箋的に力を発揮する機能です。
語幹は形容詞だけとは限らず「misage前置素材語」(ざっくりとした造語です)に付加して造語新語一般において
名詞化接辞、ナ形容詞化接辞がイメージ喚起力として便利使いされており
「コネクティングザドッツみ」なんていう遊び心に満ちた造語も生まれてきています。

説明が前後してしまうのですが後述する「タッチ液晶入力」のインターフェース「パネルフリック」についてちょっと先取り説明をしますと
予測変換時に活用や付加派生の出てくるフレーズに関しては、その候補提示のパネルに矢印滑らせてフリックするとさまざまな派生に対応できるということで
今回の「み」「さ」「げ」の補助入力にもこのパネルフリックのインターフェースを活用して手軽に補助入力をしていこうというものであります。
方法は簡単です。「misage前置素材語」のあとに別口入力[く]を入力すると「く」がマーカーとなってパネル受け付け状態がさみげ派生受け付けに変化しますので
そこのパネルを↑にフリックすると「さ」が付加され、
←にフリックすると「み」が付加され、
→にフリックすると「げ」が付加されていきます。

ついでにいうと↓にフリックすると「い」がマーキングされ、
造語形容詞(○○い)としてその場でタイピングと単語登録を兼ねてオペレーションしていきます。
なにより付加部分の「み」「さ」「げ」(末尾文字)がひらがな固定で
(「罠み」「慎重さ」「フリーダムげ」)
素材語の部分だけをカナや既知の漢字語などにするように表記の用をなすことが大きなメリットです。
このようにピボットの軸部分を不変として可変部分だけに注目して変換作用を及ぼすインターフェースというのは
先ほど説明した形容動詞語尾「な」の別口入力で横文字系の語幹がいくらあらわれようとも盤石に活かされていますし
(「クィアな」「イケズな」「納豆LOVEな」)
あとで説明する三属性変換の接辞がらみの変換プロセスで
「ゲージツ的」みたいに可変部分にだけ字種変換の作用を及ぼして
ピボット軸部分の字種には干渉せず整形してくれる
([かな][カナ][通常変換]キーを押すと該当部分だけが変換対象となる)スタイルがあり
…このようなある種の"型"をもってユーザーの目的の表記への入力アクセスをサポートし
もちろん学習辞書にも[preみ][preさ][preげ]のように文法情報/品詞情報をノートしたうえで学習・登録がなされますので
一度素材語の原形を文法情報とともに格納しておけばその後の派生的変化にも適宜出力できるよう柔軟に運用することを期待しています。
もう一歩欲を言えば
「タグい」と「類」を使い分けたり(一度「タグく」の用例を学習していれば他の活用でも察してくれる)
「紳士み」「真摯さ」「真摯げ」をさみげに応じて適材適所でワードを充てこんでいったり
「ガジェガジェしい」などのような「しい形容詞」の字種ボーダーを自動検出できたりするような使い方ができるかもしれません。

そして最後に、ここ最近になって新たに付け加えた別口入力についてです。
盤面中央部分に斧の刃キーがあってそこの2ディレクションには
「Vん」というのがあり、これは「勝たん」とか「信じんぞ」などのような動詞活用+否定形んの口語表現が変換において結構な難所であることを考慮して、また
「じゃ」についてはこれは複合助詞「では」のカジュアルな縮約形のことですが「比じゃない」などの頻出フレーズのほか「AじゃBじゃ」みたいに未知の名詞からの接続とかにも対応するのに都合がいいので思い切ってキー新設してみました。
偶然なことにこれら隣接する2つのディレクションなのですが、ちょうど「綺麗事ばっか言って[ん][じゃ]ないよ」みたいに2つが連続して接続する事も多くて同一クラスタに配置するメリットも感じられるところであります。
一応まだ試験的に導入ということなので今後のインターフェース設計の段階で撤回や変更があるかもしれませんので参考程度に捉えていただきたいです。

でにをは別口入力に関する説明は大体ここまでです。

以上のことを踏まえたうえで力説したいのは、ひとくちで言って[でにをは別口入力]には以下の利点があるということです。
まず、別口入力が行われている場合は[でにをは等]助詞が入っていることをその時点で明確に把握できます。
助詞助動詞の境界がわかれば誤った区切りの言葉の切り取りは発生せず
助詞助動詞の間を隔ててなにがしかの言葉がそこにあることがわかります。
逆にもし別口入力が行われていない場合は
語中に「に」が出てきてもこれは少なくとも助詞の「に」ではないものだと判断できます。
ひと続きの語の一部の「に」として処理することができるのです。
あるにせよないにせよ同時に他方の可能性を否定しているわけであり、
でにをはを明示的に入力させる仕組みが備わっていることで
助詞のあるなし両面において曖昧性がはっきりする構造になっています。
一般にIMEは助詞の省略された文章は苦手ですが、ペンタクラスタキーボードなら助詞の省略された文章でも
たとえば語中に「は」が出てきたとしてもとりあえず
助詞の「は」ではないことがわかるので助詞に引っ張られることなく入力文字列を変換できます。
(ここではきものをぬぐ)

 

長くなりましたが以上がペンタクラスタキーボードの基本コンセプト
「でにをは別口入力」のあらましです。
別口入力とは関係が薄いのですがキーボード盤面を広くぼーっと眺めてみると
[を]のキーが2つもあってなんじゃこりゃ、と思われたかもしれません。
「を」には別口入力の[を]とべたかな文字の「を」がありこれまで
「米ヲタク」
みたいにおコメに関するおたくを表現したくても文法標識の「を」が干渉して
うまく名詞として認識できないという問題がありました。
それを厳密に使い分けるためシンタックスの「を」とリテラルの「を」を用意したのです。
これは単に入力の便宜だけが目的ではなく、得られたデータのWeb上での運用
例えば検索ホットワードの提供などで単語境界の切り出しがうまくいかない例などもしばしば見られますが
「を」に限らずペンタクラスタキーボードの入力作法では文法情報やアノテーション情報を強く意識しているところでもあります。
このようにデータとしての利便性についても深く注意を払っている事にお気づきいただきたい次第であり
これからの説明においてもつまびらかに解説していきたいと思います。

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« §4:三属性の変換 | トップ | §2:かな英入力分離とシフト... »
最新の画像もっと見る

ペンタクラスタキーボードの基本コンセプト☆」カテゴリの最新記事