P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

これはぼくのりんごをかじったねずみをつかまえたねこのしっぽをふんづけたいぬがくわえてきたぼうをきったのこぎりをもっているおじさんのりんご

2023-12-13 | タッチ液晶部予測変換その他の挙動について

規定句の予測が…今熱い(私の中で)。
規定句なのか連体修飾なのかあまり厳密な区別がつかないんですけれど、タッチ液晶の予測変換において後続の補完がしやすいフレーズっていうのがあるんですよね。
動詞の連体形と終止形っていうのは形が一緒で扱いもしやすいですし(ただし、文語では、四段活用動詞以外の活用語に連体形と終止形との区別があることに注意してください)
というか日本語文法の6つの活用形っていう説明の仕方(国文法)じゃなくて、マス形だとかタ形だとかの用途ごとに活用形を切り出していくアプローチ手段(日本語教育での活用の分類)のほうが実際的で
それでいったら連体形と終止形は合併して辞書形かな…あとはテ形は別口入力の「て」キーがありますし規定の結句を意識するとタ形(過去形)も勘所になってくると思うわけなんですよ。
それの発展形で「ほっとけない性分」とか「回らないほうの寿司屋」とかちょっと尾ひれのついたフレーズも規定に納まるのであれば積極的にサジェストしていけたらいいな…と思っているのですがこれはまた別の話で。
要はクリシェっぽいのは手数少なくタイプしたいっていうわけですよ。導入断片だけで締めまで予測できますよーっていうのは貴重ですからなるべくチャンスを生かしたいわけですし。

というわけで規定句なんですけれどまだ全体像が見えてはいないんですけれどどんな要素があるかMECE吐いてみようかと思います。
ペンタクラスタキーボードのタッチ液晶のサジェストの中で規定フレーズでサポートしたいのは

1.一般動詞 辞書形 (嫌う):フリック派生として←しか、↑から、→(連用形補正)ながら
2.一般動詞 タ形 (嫌った):フリック派生として←たり(だり)、↑から、→たら(だら)
3.サ変動詞 スル形 (休憩する):フリック派生として↑原形、↓原形+時(じ)
4.サ変動詞 シタ形 (休憩した):フリック派生として↑原形、↓原形+後(ご)
5.イ形容詞 辞書形 (細い):フリック派生として↓かも、↑から、→まで
6.イ形容詞 過去形 (細かった):フリック派生として←場合、↑から、→ので
7.ナ形容動詞は別口入力「な」があるので介入しない
8.ノ形容詞(属性規定) (未知の):フリック派生はなし
9.連体詞(単なる) :フリック派生はなし
10.クリシェフレーズ補完(目に入れても痛くない)
11.クリシェフレーズの過去形(目に入れても痛くなかった)
12.カタカナトリガー成句の補完(コンソーシアムを組む)
13.カタカナトリガー成句の過去形(コンソーシアムを組んだ)


規定句を捕捉・サジェストしていくと都合のいい副作用があります。
それは後続の予測も首尾よくサジェストしてリズムよくタイプしていけるという事です。
活用形を限定することで体言を修飾するフレーズのみを追いかけることにより、後続は体言に限定されるので予測性が高まります。
これが用言の後続となるとそうはいきません。用言は展開をひらいていく推進力があります。どっちに転ぶかわからないので予測には不向きなのです。
「骨の折れる」とサジェストに乗っかったら結ぶや否や、そのタッチした領域にすぐさま「仕事」が表示され、ユーザーは指の移動に煩わされることなくスムーズに遷移することができます。
このプロセスで打ち始めの数文字を含めてわずか4~6タイプほどで「骨の折れる仕事」がタイプできるのです。
一般動詞ばかりではなく、サ変動詞やイ形容詞などでも同様です。

そこを出発点にして後続タイピングの補足材料としてフリック派生をつけてあります。
なにやらややこしそうな派生・分岐があるかとは思いますがあくまで二次的な発展動作なので参考程度にとどめておいてください。まだ試案の段階です。

ただそこまで万能というわけではなく細かなところで修正が必要な懸案事項もあります。
語尾上の細かなニュアンスで否定形や丁寧形への接続がぎこちなくなってしまうというものです。
「目に入れても痛くない」を「目に入れても痛くありません」に軌道修正していく例がそれです。
このへんの動作はややゲリラ的ですが
「目に入れても痛くない」がとりあえず確定→後続フレーズに別口入力「く」をタイプ→そこから「[く]ありません」のほうへ軌道修正サジェストが出てくる
そうするとタイプ進度の如何に関わらず完遂形はいったんキャンセルされ「目に入れても痛くありません」に置き換えられ新たな完遂形になりかわる
…といった算段でこなしていこうかと思います。(これをキャンセル合流と仮に名付ける)
ただしこの方法だとイ形容詞にしか使えないので一般動詞の否定形/マス形は依然として地道に逐次タイピングすることになります。
サ変動詞の否定形/マス形は結構なことにサ変別口入力「し」があるのでこれがマーカーとなり、なんならタッチ液晶で「ない」や「ます」につなげることもできますが打鍵的に盤面打鍵のほうがストロークがいいのでどっこいどっこいかも知れません。
守備範囲を広げてカタカナトリガー成句などでは
「バラエティーに富んだ」「オブラートに包む」などのような完遂形があったとして、キャンセル合流の派生を嚙ませるのなら
別口入力「で」を接続させることにより「バラエティーに富んで」にキャンセル整形したり
あるいはフリック派生で補助動作させることにより「オブラートに包み」に軌道修正させることを考えています。
フリック派生は4方向しかリソースがないのであるいは「不定形キャンセル宣言子 *」みたいので集約してしまってそこからべたかな文字を追従タイプしていき語尾変化をうまくガイドしていければいいかもしれません。
総じていえば意外にも別口入力要素の中でも単純な格助詞と違ってテ形接続の「て」、形容詞連用形の「く」、サ変便利使いの「し」は文法機能性とも相まってキャンセル合流に重宝しそうな感じです。

あと本来的には別口入力「て」と「で(音便の濁りのほう)」をコンバーチブルさせると
「書いて」と「嗅いで」の区別が難儀してしまうのであえて厳密に清音の「て」にだけマーキングするよう固執しておりましたが
こちらはカタカナトリガー成句の場合に限ってのことでありますのでそのような境界例が生じるケースも少ないだろうという事で
別口入力「て」によるコンバーチブルなキャンセル合流を許容するという結論に達しました。
こういう事情もあってのことで成句予測変換をカタカナのものだけに絞ったという事であります。
純粋に和語漢語のものを成句予測対象にしてしまうと音韻のせいなのかコロケーションのせいなのかどうやら提示候補が横溢してしまってあまり現実的ではないなというのがおぼろげな感触です。
ただ「目に入れても痛くない」みたいなロングレンジのクリシェはきちんとカバーしていくのでそれほどの痛手はないだろうと楽観視しています。


…というわけでタッチ液晶予測変換の勘所、「規定句の予測」に焦点を当ててみましたが
予測変換があるからと言ってむやみやたらになんでも候補提示をするのは筋が悪く、助詞に関しては別口入力があるので適度に変換候補が間引きされるという優位性も生かせるところもあり
しかも固有名詞の類いは文化変換でクラウドから引っ張ってきた方が別導線で安定するし、規定句・連体詞に絞れば動詞活用変化のバリエーションに振り回されることもない、
語尾ニュアンス変化はフリックの中に折り畳まれているから無数の派生に液晶領域をとられることもないですし
あと大事なのが「副詞ヴァージニティ」。副詞部分、連用修飾部分(特に文頭や成句の導入部分)は優先的に検知して通常変換に反映するので
タッチ液晶候補を押す以前に基底状態で文の流れ的に異物感のあるものを無理に採用したりしないので構文解釈が安定する「人間=機械系」のフィードバック
…などなど余分な変換候補を削減する材料が気づけば一通り揃っています。

これを糸口に変換候補のスリム化に舵を切りましょう。
一方で日本語の性質として動詞は同音カブリが多い、という特徴を十分に慮り
固有で種粒的な名詞候補は外堀の別口入力(助詞)で細密にパッチワークされているので露出機会を抑えて通常変換を信頼し、
同音カブリ対策の動詞の弁別の機微に注力していくのが本来のあるべき姿だと思います。
同音カブリの動詞の対応策は本当に厄介で今回の規定句の予測ごときの浅知恵では生ぬるいかもしれませんが
少しはまな板をスッキリさせて余力を確保し別口入力やタッチ液晶以外のファクター、三属性変換やUIの見せ方などをフル活用するなどできるだけの方策を講じて
これからも日本語入力のスタイルを模索し続けていきたいです。

余談ですが記事タイトルの「これはぼくのりんご…」は昔「ひらけ!ポンキッキ」でやっていた言葉がどんどんつながる言葉遊びの一節です。
味わいの深いフレーズなんですが、これを噛みしめていくと
いやぁ、日本語っていかに予測不可能な
「うっちゃり言語」
だなーと、つくづく感じます。
「うーん、マルコフぅ♡」

今回はこれで以上です。



  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

タッチ液晶の画面イメージはこんな感じ

2023-02-04 | タッチ液晶部予測変換その他の挙動について

歯車  | /“ ”’& , . ! ? -       ⌫
マイク |  q w e r t y u i o p 是空
記号    |  a s d f g h j k l _   伯空
草鞋    |  : ; z x c v b n m @ 粒際

現在、基本コンセプト改正に向けて頭の中を整理中。
製作したブツを見ながら、あーでもない、こーでもないと思案してみる。
今はタッチ液晶部のレイアウトイメージを作って挙動を煮詰めている段階。

液晶はアルファベット・記号を入力するための領域で、まっさらな無シフトの状態では小文字中心の配列、
オンシフトでは大文字中心で構成し数字キーの1~0までを含み配置していきます。
物理盤面と合わせてたいていの記号類はひとまず不自由のない一揃いを駆り出して、最低限のものは液晶に収めることができました。

書く人のスタイルにもよるでしょうがペンタクラスタキーボードにおける典型的な日本文では徹頭徹尾英文が続くというのを想定してはおらず、
部分フレーズ、部分単語のポイントワードとしてコラージュ的に散置していくスタイルを念頭に置いています。
つまり基底には言語をスイッチングしているという意識は薄く、英文フレーズが混ざっていたとしてももはや日本語の一部として捉えて
表記的破綻をきたさずに文構成の枢要は揺るがないとの目算で構えこしらえているものであります。

基本のモードとなる「標準入力」ではアルファベットの大文字・小文字をいちいち指定してやるという事はしません。
かな漢字変換と同じようなプロセスで解釈しタイプされた小文字のアルファベットフレーズを「未変換文字列」として読み込んで
変換後の確定時には適宜キャピタライゼーションされて「King & Prince」とか「Mr.マイペース」「ユーリ!!! on ICE」だとかに整形してくれます。
ちょっと意地悪して大文字小文字の込み入ったワード「iCloud」であるとか「SIer」「SoC」といったものでもとにかく登録辞書にあれば既知の単語はほぼサポートできます。
さすがに未知語の英単語や頭字語などの並びは最初はわからないと思うのでそのときは原則「フレーズ丸ごと大文字化」します。
「テンションMAX」であるとか「俺TSUEE」から「中山10R」までとりあえず大文字にしておけば安心というものです。
(「豆まきdeショー」みたいに小文字になるものはそれはそれとして個別に格納していけば良い)
日本語のかな文字は物理鍵盤で、アルファベットはタッチ液晶でまったく別個に入力していきますのでモードの行き来による混線を起こさないというのが自慢です。
特に和語とアルファベットの混じった複合語の表記の用に力を発揮します。
(To LOVEる、ドS、Aぇ! group、d払い、女装er、S高、Cロナ、W杯、V逸、Tシャツ、B級)

液晶面は物理鍵盤と違って刻印の制限がない、自由表示、レイアウト可変というのも大きな魅力です。
多言語への対応や液晶サジェスト変換候補のナビゲーションなども利点を大いに活かすことのできるフィーチャーです。
今回は液晶サジェストの可能性について、そして小回りの利きそうな具体的な操作イメージを画像を用いて説明していきたいと思います。
(画像は暫定のアイデアです。いろいろな可能性を模索中)
まずはこちらの画像をご覧ください↓

サジェスト液晶s

(画像をクリックすると別タブが開いて拡大します)
【ペンタクラスタキーボード タッチ液晶のイメージ】

ユーザーの打ち込んだ入力文は手元の液晶画面にも逐一表示されるので目視しながら入力しても一向にかまいません。
タッチタイピングにこだわらずとも入力デバイスそのものがナビゲーション機能を備えているので打鍵と目視が一体のものであるのに行き着くのは自然な帰結であります。
液晶レイアウトには、画面上部に現入力文の表示領域がちゃんと確保されていております。

細部の詰めはまだまだですが世にいうモバイルデバイスと同様の形式でサジェスト候補がすだれ式に表示されています。
スマホ画面に比べて横の領域幅がそこそこあるので2行程度の狭い縦幅という難点はありますがスクロール/すだれ展開等によってなんとかこなしていきたいところであります。

些末なことをメモ的に書き記していきますと
ダブルクォーテーションがあるのにシングルクオーテーションがない、という疑問に対しては
フリック入力を活用して“”のパネル部分を上に滑らせて‘’を入力します。
アポストロフィーはアポストロフィーで確保してありますので、引用符は引用符からの派生で取り回していけば運用もスッキリすると思います。
(なお、半角では閉じ/開きの区別が実質無いそうなのではありますが"ダムクォートは物理盤面の方で記号配置しておりますのであしからず)
…これで「B'z」のタイポも淀みなくできるというものですね。

フリック入力全般については終助詞頻出もの(ね・よ・わ)の付加アクションとして各上下左右方向へのフリックをするようにすれば文解析上も単語の切り出しや字種のコントラストに一役買えるのではないかと思案しているところであります。
これは打鍵キー個別の文字のものへのフリックではなくてサジェスト候補のワード部分をそのままフリック領域に見立てて付加操作をするものであります。
これとは別にたとえば規制する、規制した、などのサ変動詞部分のサジェストワードにフリックをあてて
原形の「規制」を出したければ「規制する」のパネル部分を上に滑らせて「規制」をタイプする、
そして「規制した」のパネルを上に滑らせて「規制後」をタイプするようにさせれば
判定困難な接辞「後」の付加を容易に検出できるメリットがありますし、
「きせい」には規制・帰省・寄生・規正等同音異義語が多数ありますゆえそれらめいめいにもいちいち原形の表示領域をとらなければならないとなると表示領域を圧迫しますので
○○する、○○しただけはしっかり確保すると同時に原形のバリエーションはフリックに収めることによって提示候補表示のタマ数を削減させることにもつながります。

しかし液晶面でのフリック派生はいわば"小手先"のものであってサジェストに載らないチャンクもあれば別口要素などもサジェスト部分には現れない部分ですので
全方向的に開けているフリック派生の受け皿としましては液晶左に表示してある赤い風船、これをバルーンと呼んで先程のような文法的派生やニュアンス付加に役立てていきたいとの狙いから新要素として採り入れてみたものであります。
たとえば終助詞派生をフリック4方向だけでは心許ないのでバルーン長押しで終助詞の一覧パネルがひらく…みたいにやれば終助詞以上にキャラ語尾などでも使いどころがあるかと思います。
先ほど出てきた接辞についても長押しや発火タイミングやレルムの判定とかの難所はあるかと思いますがうまくインターフェースを作って
今以上に多様な接辞、機能辞の付加派生をサポートしてやれば文法解析上もあるいは表記の美意識にも応えるうえでも良い打開策になると思います。
ちょっと抽象的過ぎて具体例がなかなか出せないところがもどかしいのでありますが引き続き取り組んでいきたいと思いますのでよろしくお願いします。

あとは入力の用、表記の用に加えて、「スフィアコントロールの用」というのも念頭に入れていまして
ネット検索やタグ検索の解像度をもっと上げるために、adobeのイラストレーターなのか絵師のイラストレーターなのか、
あるいはキーボード(楽器)なのかキーボード(入力)といったところの区別、そして
C³シーキューブをリテラルだけでなくて読みの情報もマークアップする
といったことなどを新設の「アノテーション括弧」のキーだけではなく液晶面での関与・連携もこういったバルーンからの入力でいろいろ捌いていきたいという構想も広げております。

そしてさらには液晶面で見慣れぬキー:「是空」「伯空」のキーもスフィアコントロールの一環であります。
これは検索するときに「茄子 アンダルシアの夏」「無学 鶴の間」のような空白込みの検索ワードがクエリと混同されてしまう問題を一から再構築し直して
リテラルとしてのスペース:「スペース」
セパレーターとしてのスペース:「是空」(ゼクー)
列挙セパレーターとしてのスペース:「伯空」(ハクー)
をそれぞれ峻別するための専用キーとして
もっともアクセスしやすいノンシフト:単打時の頻用キーとしてしつらえたものであります。
この仕組みが浸透していけばわれわれの検索というものの使い勝手が劇的に向上していくものだと信じております。

あと見慣れぬキーはと言えば左下のおいなりさんみたいなヤツ、あれは
草鞋(わらじ)キー
といいます。
ペンタクラスタキーボードではグローバル展開を考えていないのでよく多言語切り替えで使われる地球シンボル(多言語地球アイコン)を標榜することは分をわきまえていないという負い目があるので
アイコンには二足のわらじからくる「草鞋」キーを設定しました。
草鞋なら言語に限らず「顔文字作成用文字セット」や「⌫や⌘や検索の虫眼鏡のマークなどのシステムまわり文字セット」
など応用範囲も広がるというものですので現代のコミュニケーション事情や表記事情にもジャストフィットすると思いますがみなさんはどうでしょうか?

以上、詳しい解説は後ほどするとして画面イメージをご提示することでインターフェースのイメージ喚起も助けられたのではないかと思います。
液晶はノンシフトのときだけでなくオンシフト時、そして独自の「面シフト時」にもそれぞれ設定されたキーパネルの配置配列があります。
今回はとりあえずここまでという事でまた追っての解説はいずれ執筆していきたいかと思います。
なかなか熱の入った長文になりましたが基本コンセプトを練り上げるのにちょうどいい頭の整理になりました。
液晶でのインターフェースはまだまだ未知の領域でいろいろ検討材料もあるかとは思いますが
こうやっておぼろげなイメージをひとまずカタチにすることができてよかったです。
ご清読ありがとうございました。


  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

規定(連体修飾)フレーズはタッチ液晶サジェストと相性が良い

2022-05-29 | タッチ液晶部予測変換その他の挙動について

今回はタッチ液晶入力においての、予測変換候補サジェストについて軽めに整理していきたいと思います。
一般的なモバイルデバイスにおいては予測変換はもはや欠かせないものでありユーザーの入力負荷軽減のためにすっかり定着いたしました。
ただその候補の品詞的・語彙的な素性の傾向については主に頻度によるもの、あるいは固有名詞対応に重きが置かれており
日常使いのツールとしての使いやすさにはまだまだ改善の余地が残されているのではないでしょうか?
不満はといえば限られた液晶面のパネルだというのに提示候補がやたらに多すぎることが挙げられます。
清音濁音の揺れはわざわざ吸収しなくても良いですし、「せかい」とやったところで「世界湖沼会議」「世界同時株安」までも深追いフォローすることも良くは思いません。
下位概念のやみくもな連接は労多くして実り少なしといった感じで筋が悪いと思います。
あとは暴君ですを防寒ですにしてしまうような入力リテラルにないものまで手広くサジェストしてしまうような悪手や
ただ英語とだけ打ちたいのに永劫回帰みたいないらんおせっかいはロングレンジワードの勇み足がノイズとなって候補提示を汚染しているような気さえしてきます。

そりゃスマホ・タブレットなんだから打鍵の手間を省くのが至上命題なんだからそこはトレードオフで我慢しなよ…という声も聞こえてきそうではありますが
なにか、こうペンタクラスタキーボードの求める最適形というのはこういった携帯端末インターフェイスとはもう少し角度の違う、もっと固有の操作系を見つけるべきなのではないかというのがここまで探求してきたうえでの確かな実感であります。
模索したての頃は液晶サジェスト候補は固有名詞だけでいい!短尺で混線しやすい文法語機能語は[でにをは別口入力]があるからいらんいらん…などと短絡的な判断をもっていたこともありましたが
地道に事例を集めて、より現実的な対応策というのをまだまだ第一歩というところでありますがこうしてひとまず形にしていこうかと思います。

まずペンタクラスタキーボードの入力機構というのは二面構成インターフェイスだということが重要であります。
これはつまり、対面する正面のメインディスプレーと手元のキーボード盤面に据え置かれているタッチ液晶ディスプレーの2系統の視覚情報があるということであります。
ここで固有名詞に目を向けてみますと新語・造語の多く出そうなカテゴリーというものは手元の液晶由来のものとはせず、WEB入力フォーム由来であることがまず予想されてきますので
ここは思い切って「固有名詞のサジェストはメインディスプレー由来とする」という一大方針をここで立てていきたいかと思います。
WEB由来のサジェスト=つまり「舶来もの」のデータは外部由来であることを現実の物理配置上においても直感的にリンクさせるようにするための措置であります。
盤面液晶に来ているデータであるとこれはローカルにあるデータなのだなこの変換候補は…という線引きにしたほうが運用的にも理にかなっているかと思いますし
そうでない舶来ものの変換候補は「向こうからやってくる」構図をより自覚的に明確にするための方策であります。
そもそも新語・造語の類はもとより辞書登録されていない見込みが強いですしそこをさしおいて中途半端に固有名詞全般を併在させてしまうと無用な混乱を招きますので
たとえローカルに自前で出せる既知の固有名詞があったとしてもそこは引き算の美学でアピールを抑制したほうがよいというものであります。
そしてたとえそれが結局はWEB由来でない変換候補データの、ユーザーに委ねられローカルで完パケで自力入力するタイプのものであったとしても
住み分けの支配を浮き彫りにするために品詞カテゴリからして厳密に峻別していこうとの原理原則を立ててロジックを明快にして皆様にお示しすることとしました。

代わりに充実させたいと注目した文法カテゴリーは活用する用言のさまざまなバリエーションへの対応です。
具体的に申しますとズバリ
活用形:終止形/連体形
あるいは
サ変動詞活用形:終止形/連体形
であります。

サ変動詞で言えば
〇内蔵する/×内臓する
〇提起する/×定期する
みたいな活用に違和感のあるサ変動詞の誤変換をなくそうというのが出発点です。

なぜ終止形/連体形だけなのかといいますと
サ変動詞連用形にはそもそも別口入力[し](これは連用形)というものが既にあり十分、ほかの活用形
例えば未然形
し(-ない、-よう)、せ(-ず)、さ(-れる、-せる)
は多岐にわたり煩雑なため入力字面でもって個別に判断させるほうが無難(今のところ)との見解であり、
仮定形はすれ(-ば、-ど)…これは接続パターンがある程度決まっている
命令形はしろ、せよ
であってせよはさておき「しろ」については「白」との混線は代替回避的に三属性変換-ロ万(動作様態属性)を使ってユーザーに選んでもらう
などのファクターを勘案していわば消去法的に「終止形/連体形」の活用候補だけをサジェストしようというものであります。
消去法とはいっても都合のいいことに終止形/連体形は活用は違えど形が全く同じで、しかも頻度も高く展開配置も読みやすいというお得感がある活用だからというのも後押ししています。

これにならって一般動詞の活用においても同様に統一的振る舞いをさせようというのが発想のラインであり、確かに一般動詞には別口入力[し]のような連用形マーカーはないものの
連用形にはたいてい別口入力接続助詞[て]が後続することも多く検出しやすい、あるいは連用中止法のように
-をはるかに越え聞こえる波音
-をはるかに声聞こえる波音
のような誤変換誘発のまぎらわしい例であったとしても
最悪[Ø文字マーカー]を使ってユーザーが明示的に指定する方法も残されています。

以上のような懸案課題は残るものの一般動詞にも終止形/連体形サジェストルールを適用してやれば風通しがよく統一的にさばけるという利点が醸し出されていくと思います。

さて、理屈っぽいことはこれくらいにして以下には特に連体形に着目したいくつかの具体例を列挙していき様々な視点から掘り下げていきますのでもう少しお付き合いください。


貼る場所→春場所が出したいパターン
待つ準備するね→松潤美するね誤変換
茹でた孫→ゆで卵したいパターン
書く仕事→隠し事こっちが出したい
臭う服→二往復誤変換

これらは連体修飾=規定句を採る解釈とそうでない解釈との対立が招く誤変換の例です。
タッチ液晶サジェストでは、規定句を採る解釈のほうを検知してサジェストしていくわけでありますが
これはユーザーの選択で規定句を選ぶときでも逆にスルーするときであっても両面で変換の絞り込みに寄与しているアクションになります。
規定句でない、たとえばゆで卵単体ならタッチ液晶しない忌避行動によって選ぶ(スルーすることによって通常変換の選考候補が逆に確保される)ことが成り立つからです。

形容詞の規定句もあります。

手荒い歓迎→手洗い歓迎それちがう
思いデブかい→思い出深いこっちが出したい

規定句をとるとおかしくなったりまたその逆もあったりするので使い分けが重宝するかと思います。
あとは過去の助動詞「た」「だ」で結ぶ規定句もペンタクラスタキーボードの別口入力でカバーできなかった関係上、こうしてタッチ液晶でフォローできれば分解能がより高まります。

食べた量→給田亮(人名:たべたりょう)
死んだ医者→寝台車
見たキャンパス→三田キャンパス

こうした「た」「だ」の機能は、かならずしも過去限定というわけでもなさそうなのでありますがターゲットの属性を付加していくという点において通底する機能構造をもっているかと思います。
まあ連体修飾なのですから当然ですね。
意外にもタッチ液晶入力をあえて選ばない、ノイズになりそうな変換候補をパージしてくれそうなハニーポットの役割が(本筋ではないかもしれませんが)浮上してきたのは興味深いです。
いずれにしましてもペンタクラスタキーボードの別口入力ではこうしたすべての動詞の過去形に「た」「だ」をつけてマーキングするのは煩雑で現実的ではないとの判断から一旦は見送られていたのでありますが
こうして誤変換誘発ケースの時に代替的にタッチ液晶から回避手段を確保することがなんとか手当てできたのも冗長的なインターフェイス設計のおかげであったと胸をなでおろしています。

また規定句をサジェストすることによる大きな利点として、後続の追加発動の予測変換がピタリとはまりやすいというメリットがあります。
悪例としてひとつ、一般的に連用修飾導入からの連接というのはどうしても付加的ニュアンスを出す補完フレーズが続きやすく、
たとえば「食べ(連用形)」からの後続連接を提示するにしても
食べながら・食べ飽きた・食べ慣れた・食べれない・食べられた・食べました・食べ方・食べかけ・食べよう
…等々、連用形からの連接は無数の語尾ニュアンス・複合動詞・助動詞・接辞の接続がひらいておりそのすべてをサジェストで網羅補足するのは現実的ではありません。
その点連体修飾(規定句)の連接は
食べるとき・食べる時間・食べる場所・食べるふり・食べること
といったところでしょうか、連用修飾よりも展開が限定されている向きを感じられます。
「読む」なら「本」でしょうし、「欲しい」なら「もの」が順当ですし素直に予測に乗ったほうが捗るケースも多いかと思います。
これはサ変動詞にしても同じことが言えそうです。
確立する…しかり
ソフィスティケートされた…しかり(この際受け身使役形であっても規定句広く適用できることとする)
漢字動詞の誤用対策あるいは長尺カタカナ語サ変動詞対策にもつながって単に省力化以上のメリットをもたらしていることにお気づきいただきたいです。
受け身使役の規定フレーズに限らず、「淹れたてのお茶」みたいなクリシェの規定フレーズ
あるいは×「書く尺とした」ではなく〇「矍鑠(かくしゃく)とした」みたいにロングレンジでたとえ助詞が途中に挟もうとも大胆に規定検出する
つまり具陳ではなくクリシェの観点に立っての対応が大事・成句も含めた規定句データの格納を進めていけばより生産性が上がると思います。
うだつ、と打ったのなら当然「うだつの上がらない」までサジェストしてあげたいというのが人情というものですよね。
×行為を寄せている人(ロングレンジ規定句)
みたいな残念な誤変換を入力の段からして排除できる仕組みを持つためには「を」「が」「と」「の」等の助詞も含めたコロケーションでクリシェの名のもとに一括リーチできたほうが直観に適っていると思います。


ここからは動詞/イ形容詞から少し視点を変えて
×動揺の機能 〇同様の機能
のように連体詞的連接のいわば「ノ形容詞」について多少の考察を進めていきたいかと思います。
「の」には格助詞であるとか準体助詞であるとか一般的な分類基準というのはあるかとは思いますが、ここでは
「コンピューターの判断」(関係規定)、具陳による連接
「独自の判断」(属性規定)、クリシェによる連接
という見方を導入してみて整理してみたいと思います。

鋼鉄の心臓
更迭のシンゾウ
…例えば上記のような例
1項1項が自立的で具陳的であるもの、これはタッチ液晶サジェストの対象候補にはなれません。
つまり液晶面でサジェストされるのはよりクリシェらしい「鋼鉄の心臓」のほうだけとなります。
同様に
〇後続の作業/×皇族の作業
〇対人の応対/×タイ人の応対
〇悠久の刻印/×有給の刻印
など、個別トピック・特定性の高いワード…つまり具陳傾向のあるフレーズは忌避されます。
ここまではわかりやすいかと思いますがあえてここから一歩踏み込んでみますと
〇ほんの一息×本の一息
〇ものの1割×物の1割
〇とっくの承認×特区の承認
みたいな、通常変換と微妙に守備範囲がかぶりそうなもののクリシェの検出どうするのかということについても今後精査していかなければなりません。
このへんをうまくこなせば、
×道のウイルス
×地下の高い町
みたいなトホホな誤変換ともオサラバできるかもしれません。
こちらは直接は用言の活用とはまた違ったトピックでありますが規定句の検出運用上関連の深そうな分野ですので
引き続き意欲課題としてさらなるブラッシュアップを進めていこうかと思います。
ノ形容詞は以前言及した第三形容詞とも関連が深いので気になる方は過去記事

名詞と非名詞の境界が曖昧な例 - P突堤2

をご覧になってくださるとうれしいです。

さてそろそろまとめに入りたいところなのですが
ここで重要な規定句の番人、ナ形容詞について触れないわけにはまいりませんので、釈明(^^;)がてら現在の暫定的な見解を以下に述べておきたいと思います。
重要な点は、ここまで規定句についてさまざま考察していきましたが
同じ規定句であっても、ナ形容詞の形成する規定句には一切サジェストしません。ということ。
(↑ここ大事です)

ちょっと雑な考察になるかもしれませんがナ形容詞というのはイ形容詞・ノ形容詞よりも圧倒的に生産性が高く特に外来語由来の語句の浸透具合は驚異的であります。
このままの手ごたえではナ形容詞のサジェストを許容してしまうと提示すべき変換候補が爆発的に増えていってしまい目的の候補が埋没、あるいは競合を起こしてしまう懸念というのがどうやっても付き纏ってきてしまいます。
しかもすでに別口入力キーには[な]キーがリソースを割いてまで採用されておりこれによってカナ無干渉作用の局所変換を実現する機構:
たとえば「異なもの」「ハイな気分」など短尺で埋もれやすいナ形容詞も際立たすことができる
さらには「科学な人」「具な素材」みたいに逸脱的な用法であってもいくらかはついていける
また表記ニュアンスの美意識的な使い分けで「サイセンタンな」「イジワルな」みたいに「な」部分は不変で無干渉を保ったままカナ部分だけを適宜置換/変換できる機構
これらのさまざまなサポートが実現できているので実質ひとつの別なインターフェース体系が確立されている、という現状があります。

ここでさらにタッチ液晶がらみの規定検出のメカニズムが絡んでしまうと無用な混乱を引き起こしかねないですので
ここは慎重に規定サジェストからは距離を置く戦略を採っているのです。(一番の要因は提示候補の削減が大きいですけれど…)
ついでに言えば、動詞・イ形容詞・ノ形容詞のときには後続連接がいい具合に絞られて予測変換が連鎖しやすいという見通しも成り立っていたのですが
ナ形容詞にはあまりにもバリエーションが多すぎて予測限定性も思ったよりうまくいかないという語彙カテゴリ的な傾向も消極的に傾かざるを得ない理由の一つであります。

…そんなこんな大人の事情もありましてナ形容詞をご所望の方にはもどかしい、フレーズ完遂まで全打鍵しなきゃならないのかよ…というため息も聞こえてきそうでありますが
こちらは代わりにメインディスプレーのほうからのサジェストを手厚くしてやれば良いのではないか、と半ば楽観視しております。
実のところタッチ液晶からのサジェストばかり目が行ってしまい肝心のメインディスプレーからのサジェストに対する考察はほとんど無頓着でいました。
なのでここまでの考察で不如意なところはまたあらためて探索・検証していかなくてはならないとの展望に至りました。

紙面も気力も尽きてきてまいりましたので今回はここまでにして思考実験にもっとリアリティが出せるように、アイデアをただの観念ではなく身体性に基づいて血肉化できるように
今後もより深くインターフェイスの海にダイブしていきたいかと思います。

思いのままにつらつら書いた記事であまり構成上のまとまりというのは意識しておらず随分ととっ散らかってしまったのではありますが
ここまで乱文・悪文にお付き合いくださいましてどうもありがとうございました。
そろそろ雨の多くなる時期でありますがこれもまた風情、懐深く季節の移ろいを楽しめるような余裕を持っていきたいですね。
今回は以上です。

 


  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

タッチ液晶部予測変換カテゴリへ移植が必要な過去記事

2021-12-28 | タッチ液晶部予測変換その他の挙動について

先日タッチ液晶インターフェースについての記事を上げましたが別カテゴリでのシリーズものの記事だったので寄り道としての扱いしかなかったので
このカテゴリでメインで続エントリを書く上でのつながりがわかっておけるようにリンクを貼っておきます。

具陳なのかクリシェなのかを見定める(1) - P突堤2
具陳なのかクリシェなのかを見定める(2) - P突堤2
具陳なのかクリシェなのかを見定める(3) - P突堤2

主に(3)の記事においてタッチ液晶関連事項に詳しく触れたのですが長々と要領を得ない悪文になってしまったので
このカテゴリではポイントを適度な粒度で小出しにして、上記記事と一部重複するところもあらためて解説していきたいと思いますので
よろしくお願いします。

年内はこの記事をもってUP納めとさせていただきます。
今年もお世話になりました。


【お知らせ】
「新時代のコトバ会議」…2022年度は特番やらないみたいです!
過去記事:
細工は流々、言葉を題材にしたエンターテイメント作品[第2弾] - P突堤2

でも触れていて動向を追っていたのですが番組表を精査したところ特番はなさそうなことが判明しました。
ギリギリになってからの改筆になってすみません。当該箇所を直しておきました。
年始の動画鑑賞の参考になればうれしいのでよかったら第1弾とあわせてご覧になって下さいね。

 


  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

サ変動詞のトンチキな誤変換をなくせ!

2021-09-12 | タッチ液晶部予測変換その他の挙動について

確立すると確率するの誤変換にはいい加減うんざりしますねー。(書く率なんてのもある)
コンピュータの漢字変換ソフトウェアでは、後ろに「する」を続けることができる動作性の名詞を「サ変名詞」「ザ変名詞」などに分類し、ユーザによる辞書登録時もこれらを指定できるものがある、とありますが
ペンタクラスタキーボードの品詞管理はちょっと変わっておりそもそも品詞分けを設定せずともでにをは助詞別口入力があるので格助詞の前にあるのは名詞ですよ、「でs」「だ」マーカーのついている前にあるものは何らかの用言だよ(名詞述語文を含む)、サ変活用形「し」のマーカーのついてあるものの前にはサ変的な用言がくるよ…というように個別の因子ではなく別口パーツ配置の具合をみて決定してあるものであります。
そのため、明示的に品詞というラベルを使うのは避けて、あえてそれをぼかした「よろづ」(イ万/ロ万/ハ万)という術語を使っています。

冒頭のようなサ変動詞がらみの誤変換はまだまだ無尽蔵にあり、以下に列挙しますが
本稿ではこれを入り口にさまざまな対処策を模索・考察していきたいと思いますのでよければお付き合いください。
()内が本意のほうの正しい変換であります。


先生する(先制、宣誓)
容易されており(用意)
師弟する(指定)
状況する(上京)
内臓する(内蔵)
確率されておらず(確立)
多様される(多用)
多様して(多用)
傘下する(参加、酸化)
帽子する(防止)
軽快している(警戒)
関心します(感心)
高速され疲れますよね^^;(拘束)
俎上する(遡上)
快哉する(開催)
大化する(退化)
高尚する(交渉、考証、公称、口誦)
好例する(降霊)
格子する(行使)
雑草する(雑想)
糖分する(等分)
服装する(副葬)
天球する(転厩)
故事する(固辞、誇示)
反故する(保護)
習慣する(収監)
仕様して(使用、飼養)
重体する(渋滞)
妖怪する(溶解)
階段する(会談)
補色する(捕食)
最高神しても(再更新)
背信してる(配信)
童謡する(動揺)
痩身する(送信)
手荒いする(手洗い)
城址する(上梓)
航海する(後悔)
天災する(転載)
債権する(再建)
東洋する(盗用、登用)
名言する(明言)
親切する(新設)
蓮ちゃんする(連チャン)
気性する(起床)
最下位する(再開、再会)
覇権する(派遣)
兆候する(長考)
栄光する(曳航)
害虫する(外注)
閃光する(先行、選考、専攻)
決勝する(結晶)

上記のようなサ変絡みの誤変換においての問題原因は

1.ユーザーが細切れで入力しているがために[語幹部分]と[--する]の部分の連携を活かせずに個々で変換されているため起こる誤変換
2.かな漢字変換IMEに不備があって品詞ベースの形態素接続規則(品詞接続表)がうまく機能していない、またはそういうアルゴリズムを採用していない
3.辞書データや学習結果により悪例のほうが許容集積されノイズとして残ってしまっている

などの要因が考えられるかと思います。

-------------------------------------------
ペンタクラスタキーボードの入力機構においてサ変動詞のさばきはどのようにしているかというと
・サ変動詞連用形「し」については別口入力マーキングが付随しており解析上サ変検出の標識となって判別材料となっております。
・未然形については込み入っていて、
aし(-ない、-よう)については別口入力の「し」でマーキング、
bせ(-ず)、cさ(-れる、-せる)
については別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。(扱いが統一的でないのはご理解ください)
・終止/連体形(する)については予測変換を手元の液晶で提示し、変換の混線を回避する方策とします。予測変換を用いない場合はべた文字列解析です。
・仮定形(すれ)については同じく別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。
・命令形(しろ、せよ)についてはこちらも込み入っていて
aしろについてはちょっと違和感ありますが[し]ろ、と[し]の部分を別口入力で、ろはべたの文字列で入力してください。分解能を高める為ですのでご理解ください。
bせよについては別口入力は付随せずべた文字列からの解析推定でサ変部分を検出します。(扱いが統一的でないのはご理解ください)

とまあまだまだ模索中でありますがさすがにすべての活用形に応じて個別の別口入力を作るわけにはいかないのでこのようなモザイク含みの様相をお許し下さるよう重ねてご理解申し上げます。
割り切って言ってしまえば、「し」がらみの活用だけは別口入力で、それ以外の活用はべた文字列で御慣熟していただき、
使用場面の多い終止形・連体形「する」については液晶予測入力の手段も用意してある――これは補助的なおまけぐらいに考えておいてください。

このモザイク含みの統一的でない処理体系には異論もあるかもしれません。
ロジックを策定するP陣営側にとっても動詞とその活用形をとり回す規則のメンテナンスの面からいって常道から外れすぎているとのご批判も受ける事かと思います。
しかし私としましても決して場当たり的に散漫なルールを作ったものではないのであります。
別口パーツ「し」につきましてもこの単文字は誤変換誘発対策の帰趨を決める重要な勘所でありますし
取ってつけたかのように見える液晶パネル予測入力にしましてもこうしてサジェストできる活用形を限定することによって過剰な提示候補を絞れることにもなりますし何より連体形の方は後続に続く予測ワードの提示が流れを中断せずに継次的に表示できますので頻出動作として理に適っております。
これは連体形・連体修飾だからできることであり規定チャンクは一種のクリシェとして予測可能性の高い語句の並びになっていくことが経験的に分かっているところからくるものであります。
これが連用形・連用修飾であった場合にはそうはいきません。後続にくる用言は展開を急転させるうっちゃり力をもっているので先の予測が容易ではありませんし候補提示数も横溢してきてしまいます。
なのでこれはこれでマーカーを要求するに足る手当てが必要になってくるのです。単に「し」というリテラルだけを見るのではなく連用形形態素は後続が予測/解析しづらいという文法的傾向・語彙的傾向も加味した立体的な組み立てとなっているのであります。
しかも連用形には連用中止法というややこしい用法がありましてこれが読点なしで使われてしまうと
○近く市場調査を行う
×知覚し冗長さをおこなう
のような誤変換が起こってしまいかねず、べた文字列ではだかのサ変「し」をタイプしてしまうことの結構なリスクを無視できないものとなっているのです。
このように要所要所で分解能を制御する粒度調整が必要になってきています。
残りのべた文字列で解釈する各種活用形には、用法に固有性があって過去の助動詞を好む動詞、受身使役を好む動詞、仮定形を好む動詞など全部が全部とは言いませんがコロケーション学習・用例学習の効果が期待できるもの(先行される/専攻したなど)が多く見受けられる面もあるので個別のケースで対処していけば良い、との目算もあります。

なお、昨今取りざたされている「接種」と「摂取」の誤変換につきましては、これは一応サ変動詞各々の用法の使い分けの問題であり前段のような品詞素性の違うワードがサ変動詞変換に侵食してくる事態のケースとは別物の懸案でありますので、これはこれで別記事でのちのち触れていければよいと思っております。
今は品詞に則した厳格な分類ではなくゆるい制約の「よろづ」という概念を使って「サ変動詞」「サ変名詞」「サ変動詞っぽいもの」「名詞であるが無理くりサ変を付加できなくもないもの」などなどの境界領域を泥臭くではありますが上手く束ねて、
各種の入力ヒント:以下のモノ

・別口入力「し」のマーカーがあればあるに越したことはない
・「する」形は予測入力で液晶パネルから
・「した」は[し]た と厳密に[]別口入力マーキングをして
・「せず」「させる」「される」「させず」等は衝突する解釈も少なそうであるしある程度長尺なので楽観視
・「しろ」は白、城 との衝突も懸念されるのでここは厳密に[し]ろ と[]別口入力マーキングをして
・「せよ」は衝突もないのでべた入力で楽観視

のように、くり返しにはなりますが設計の骨格となる重要なインターフェイスですので何卒お含みおきください。(大抵の結合はよろづロ万の属性づけに+サ変活用がついたものであるとシンプルにとらえる視点です)
ネガティブにとらえると整合性のない、モザイク含みの、パッチワーク的な 頼りないインターフェイスと見えてしまわれるのかもしれませんが、
物は言いよう、「ベスト・コンビネーション」「アンサンブルの変換」「立体的粒度のさばき方」
と、好意的に受け取ってもらえれば幸いであります。

こうしてみますと、タッチ液晶操作まわりの作り込み、インターフェイスの精緻化が新たな課題としてあがってきたようでありますね。
今回はこれ以上の深掘りは諦めて次回以降に取り組んでいきたいと思います。
ちょっとだけメモ、忘れないように骨子だけ記しておきますと、

液晶予測入力で入力した確定文字列はディスプレー由来通常インターフェイスでの確定の時よりも辞書学習の重みづけが強くなるさじ加減をおこなう。
理由は予測候補は文脈全体を商量して決定するディスプレー由来入力とは違い
タッチパネル由来入力は入力文の直近の単チャンクフレーズ専用の視界での変換候補が提示されるのでより解釈の限定性を帯びている。
すなわちサ変チャンクならサ変チャンクとして決め撃ちしたうえの下ごしらえ済みの候補が定型的に選択・決定されるので
諸所の事情の込み入った解釈空間を必要とするディスプレー由来入力のもつややこしい事情に付き合わなくてもよいからである。

…今はちょっと言葉足らずでうまく噛み砕いて説明するのはやめておきますが、ここらあたりをもっと考察していって次回以降の掘り下げに向かっていこうかと思います。

あっっ!大事なことを忘れていました!!

今回の記事を期に新カテゴリ・「タッチ液晶部予測変換その他の挙動について」
を設置しました。今後も記事製作に励んでいきたいのでみなさまどうぞよろしくお願いします。

 


  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする