P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

具陳なのかクリシェなのかを見定める(3)

2021-12-19 | ジャンル横断的な問題

勇気の枝豆、絶交のタイミング…なんだかトホホな誤変換ですがいまだに散見されます。
「有機」「絶好」ちゃんと変換されてほしいですよね。
ここで具陳とクリシェの話題に絡めていきますと「有機の--」「絶好の--」っていうのは一種のクリシェであって名詞を詳しくのべたて限定するところの[属性規定]なのですが
勇気の枝豆、絶交のタイミング(残念な方の例)というのは対象にあらたな属性を付加するような機能ではなく○○の××、体言と体言の単なる結びつきであって所有や所属、動作主体などのつながりを示す[関係規定]のほうであります。
こちらはフレーズの連続性というのを纏ってはいない個々の要素の継置であるのでこのトピックで言うところの"具陳"になります。

この他には
×母型の実家       ○母方
×奇襲のカリキュラム   ○既習
×抗議のサメ映画     ○広義
×不足の大渋滞      ○不測

…などがありますがいかがでしょうか、母方にしても既習にしても形容詞的に属性付与的に倚りかかるクリシェとなっています。
ただ単に自然な言い回しか否かというのではなく、構造的な観点:単なる格助詞間の連結ではなくて「の」まで含めての活用語尾としてのフレーズなのだという形容詞的側面としての特徴に着目すべき連体修飾だと思います。
いわゆる日本語文法トピックとしての「ノ形容詞」の考え方と大筋合ってはいるかとは思いますがノ形容詞の話題にはここでは深く立ち入りませんが亜種としてノニ状詞やナノ状詞などのスペクトラムな類型が種々細密に広がってきておりますのでここで浅学の身で申せる程度の見取り図を示しますと
具陳/クリシェのニ分的な分解能をもってかな漢字変換するときにこういった形容詞規定句の変換候補提示のときに正則(慣用的に用いられやすい)をクリシェ、そこから外れた(ちょっと違和感のある)特定具陳の解釈を三属性変換にまかせてインターフェースの動線づくりをしてやる、
…こういった企図から形容詞規定を捉えなおしてユーザーに提示していこうというのがこの記事の趣旨になります。
実のところを言うと[属性規定]なのかどうかという観点は重要なのではありますが例えば「奇襲のカリキュラム」はさずがに属性規定ではないなとの感触はあるにしても「紀州の梅」みたいに[属性規定]が適用できる重複領域というのがどうしても避けられず厳密に文法的定義から分類を組み立てていくのはどうも難しそうですので
上手い具合に[具陳/クリシェ]という評価手法がどうも包括性があってなかなかよろしいのではないのかという期待も込めてこのあたりを深掘りしてみようという結論に至った次第であります。

語彙の結びつきというのをつぶさにデータ記憶していくというのは現実的ではないのでこういった[属性規定]をもつのかもたないのかという素性を使って連接をさばいていこうというのは重要な考え方になります。
[属性規定]/[関係規定]の対立があるのはノ形容詞についてまわる留意点でありますが規定フレーズというのはイ形容詞・ナ形容詞・連体詞あるいは動詞の連体形での規定もあるのでここではそういった大きな構えで語り結んでいきたいと思います。
まあアレなんですよね、ノ形容詞だけは解釈上も語法上もひとつ踏み込んだ取り扱いというのが必要になってくるのでふんどしを締めてかからねばならないのが苦労するところであります。

ここでクローズアップされてくるのは、タッチ液晶のサジェスト提示のインターフェース、つまり予測変換の作法の中心に「規定句のクリシェ」をメインに据えてやっていこうという基本方針であります。
規定句の予測変換は例えば、
いうま(数文字をタイプ)→予測候補提示[言うまでもない]→選択タッチ→予測候補提示[話]→選択タッチ→形成文字列は[言うまでもない][話]という要領を得た滑らかな連接
のように後続の変換候補も絞られた候補のものが連接しやすく、連鎖的に連続押下できるという効用があります。
語彙にもよりますが一般的に動詞/形容詞の規定フレーズというのがこの流れにバッチリハマっていてまことに都合が良いのです。
もちろんむすびの体言が予測を越えた急転話題のものに連接するケースももちろんあるのですが同じ修飾でも連用修飾の先行き予測困難性に比べれば再現性の見込みが高い、特筆すべき文法的特徴であります。

ペンタクラスタキーボードのタッチ液晶面というのは、現在入力中のテキストをメインディスプレイとは別に同期表示してやるメカニズム、入力文を手元で確認できるようにさせるため液晶面の表示スペースのリソースの大半をそこに割いていくというのを前提にしています。
つまりそれ以外の、メイン用途のオマケ添え物である予測入力には満足な表示領域を割り当ててやるだけの余裕はないのです。
つまりスマホやタブレットの入力スタイルを単に転用してしまえば済むという単純な話ではありません。
ここにP作法においての液晶サジェストの場合に限ったいわば文法的角度のついた運用、タッチ液晶サジェスト候補の「選択と集中」が必然になってきているのであります。
そもそも物理キーボードのとりまわしだけで目的の変換候補に到達していくのが理想形でありまして
それでも補えない苦手領域の変換をタッチ液晶にまかせる、という弱点克服の意味合いもあるでしょうし
苦手は物理キーボードで根性でカバーしていきそれよりも用例学習の導線というインターフェース上のメリットを伸ばす、という長所強化としての役割分担に適っているかという視点
こうしたものを横糸に織り込んでいき縦糸のシンプル化指向の風通しの良さを両立させる
…いずれにしましても乱暴に言ってしまえば予測入力のサジェスト候補は固有名詞と規定句クリシェだけあればいいのだ、くらいのいきおいで思い切ってそぎ落としていく発想が出発点となっているのであります。

設計思想についてはこれくらいにして規定句フレーズのタッチ液晶サジェストについてもっと話を進めていきます。
規定句クリシェをサポートする用言には以下のものがあります。
・イ形容詞規定句のクリシェ(薄っぺらい話)
・イ形容詞連句規定句のクリシェ(悔いのない人生)
・ノ形容詞規定句のクリシェ(作り置きのおかず)
・連体詞規定句のクリシェ(悪しき慣行)
・動詞規定句(原形)のクリシェ(かさばる大きさ)
・動詞規定句(タ形)のクリシェ(飛び抜けた実力)
・動詞規定句(テイル形)のクリシェ(ボヤけている写り方)
・動詞連句規定句のクリシェ(小股の切れ上がったいい女)
・サ変動詞規定句(原形)のクリシェ(哲学する漱石)
・サ変動詞規定句(シタ形)のクリシェ(アレンジした曲)
・サ変動詞規定句(シテイル形)のクリシェ(侵害している書き込み)
・サ変動詞連句規定句のクリシェ(いい大人のする遊び方じゃない)

…などがサジェストされると望ましいです。ポイントは句にもならない単体の規定部品だけの対応だけではなくて、主述関係や修飾関係の句がすでに前段にあって規定の一角をなすフレーズであっても当意即妙に後続フレーズを補完できるようにすることであります。
確かに小股の…と入りばなする文字自体では厳密にはただの名詞であり規定には至らないものであるとの考え方も妥当ではありますが「小股の…」ときたら「切れ上がった」と補完してやりたいというのが人情ですし別に近視眼的に叙述フレーズの完結を待つほどの遠慮などは予測インターフェイスの性質からしてもそぐわないものです。
規定フレーズという適用範疇のなかでサジェストを絞っていくのだという方針を決めたのですからここは意欲的に"投機的変換候補提示"を狙っていこうというものです。
投機という言葉を使いましたが無計画に拾えたら儲けもの、ぐらいの感覚で候補提示のロジックを組んだのでは決してありません。
一応拙案なりにタッチ液晶サジェスト提示の勘所というのを意識して作ってありますのでそれなりの裏付けは用意しているつもりです。
記事も佳境にさしかかってまいりましたがここからサジェスト提示候補の「選択と集中」について紐解いていこうかと思います。

さて、予測候補サジェストというのはスマホやタブレット端末のように入力経路がタッチパネルからだけ、というように単一経路で一貫しているのであれば単に頻度情報・コロケーション情報などをもとにして連鎖確率の推定問題として処理していくのは常識的な事であるのもうなずける話ではあります。
しかしペンタクラスタキーボードの入力ではメインはディスプレー画面から、手元ではタッチ液晶画面からと二経路からのハイブリットな入力経路となっております。
したがって予測変換においても取るべきアプローチが違ってきます。
ペンタクラスタキーボードでロングレンジのの一括変換を旨としているのは、助詞や機能語のマーキング情報を入力文字列に適宜挟み込んでいくので文章全体の統語構造、論述構造の全体像をつかんだうえで判断できるという利点があるからです。
特に副詞(連用修飾)や文法顕性語にヴァージニティーというのを設定して優先順位を過敏に判定していきますのでその構えを崩してまでタッチ液晶入力ファクターの影響力を受忍するものであってはならないのだという事情があります。
それを織り込んでいった上で全体に影響を与えない、局所的で入力ストリームの中で継起的に取捨選択できる要素という制限をクリアしたP作法においての予測サジェストの様式というのを挙げていきます。

まず第一に、ノ形容詞に関しては属性規定に着目してピックアップをすることで余計な提示候補を減らすことができるということです。
地下の○○ / 地価の高い町
道の○○ / 未知のウイルス
家庭の○○ / 仮定の問題
のように、具陳の候補とクリシェの候補の両方の可能性があったとしてもはじめに属性規定のものだけを提示するのだと決めてしまえば期待を裏切られることがありません。
ユーザーは具陳でひらかれた連接、不特定の語彙に急転する関係規定のフレーズの探索をあきらめ素直にメインディスプレイの候補提示に従うという行動様式を獲得していくことになります。

第二に現代日本語ではイ形容詞、動詞においての連体形と終止形は同じ形であること、これを取り入れることにより最大公約数的に扱いやすくなるという利点もあります。
一部漢語のサ変動詞においては
(文語で)
未然形: せ
連用形: し
終止形: す
連体形: する
已然形: すれ
命令形: せよ
のように連体形/連用形が一致しないケースもあるのですがおおむね一致すると言ってもよく二形態で共通する活用ですので提示経済性もいいです。
また未然形はれる/られるの扱いがあるので通常変換(メインディスプレイでの候補表示)との混線を避ける意味で慎重にならなければなりませんし、未然形なら後続する品詞も助動詞等機能語に限られてくるのでサジェスト運用するうまみも欠けてきています。
連用形は逆に後続の連接がひらかれすぎているので予測変換候補が横溢してしまうリスクがあります。
命令形は特殊なので判断は保留しておきますが文末にくることで切り出し困難性に悩む場面も少ないかと思います。(あるいは引用の機能辞を伴うくらいなので)
仮定形は「ば」の連接しかありませんしこれとは別に助動詞の「た」の語形変化としての「たら」については動詞連用形からの派生フレーズなのでここでは適用外です。
…そういった諸事情を勘案すると連体-終止のラインを利用していくことが穏当ではないでしょうか。
もちろん「振られた案件」みたいに受け身であっても規定が語彙化しているものは見逃せませんし「売れない芸人」みたいに打ち消しの助動詞を介した未然形の規定句もありますのでこのへんは柔軟に対応していきたいかと思います。
文字どおり規定というのを軸にして組み立てていくとこのカタチに落ち着くしかない、というか連体修飾は連体形ですので活用形を選ぶに及ばずこうなるよりほかになく、規定以外で文法的に魅力的な範疇があるのかどうかは私には見当もつきません。

そして第三に重要なのですが同じ規定であってもナ形容詞のフレーズは除外するということがあげられます。
ナ形容詞の語尾「な」にはすでに別口入力でマーキング標識が用意されています。
それ以外のサジェスト範疇についてはタップ選択をもってひとチャンクが結節するシグナル性を持っていますがこれがナ形容詞では別口入力シグナルがすでにあるのに冗長的ではないか、無駄な操作ではないかという配慮からのものであります。
少なくともタッチ液晶面/メインディスプレーでの変換候補提示の両にらみでの運用には無理が伴います。メインディスプレーで事足りるのなら無理に越境することもないでしょう。
それでも効用はあります。それは変換候補の大幅な削減につながるということです。
ここまでイ形容詞や動詞の規定句、それに少し拡張して受身形や未然形がらみの規定句も取り込んでしまったので有限な資源であるディスプレー表示領域の確保にもすこし心許ない面もあります。
すだれ式にスクロールさせてやればどうとでもなると言ってしまえばそうではあるのですがやはりP様式ではあくまでも物理キーボードが主、タッチ液晶面は従なのですからやたらと変換候補を並べるのはあまり好みません。
なのでナ形容詞からの候補が除外されるとなれば幾分は余力が生まれますので自由度が断然違ってくるのです。
もともと外来語・漢語由来のナ形容詞は無数にありその便利さとは裏腹に文字連鎖としての先の展開予測性というのが困難になってきています。
これと比較すると(感覚的でしかありませんが)形容詞の語彙は予測収束性がそちらよりは絞れそうだとの感触があります。
適切な例かどうかはわかりませんが「荒っぽい手口」、「気まずい雰囲気」みたいにクリシェ連結としてのイ形容詞が限定性を高めている暢句はあるのですが、
ナ形容詞で「アンビバレントな感情」というのはもちろん支配的なクリシェではあるものの「アンビバレントな状態」「アンビバレントな感性」みたいに他の可能性もどうしても拭い去れない開放性がつきまとっているように思えるのです。
なかなか例が浮かばずではあるものこれでも相当に限定的なナ形容詞を選んだのですが全体的な傾向としてナ形容詞は予測が発散してしまう構造はあるかと思います。

そのほかにも、もともとイ形容詞は新語造語も生産されにくいのでサジェスト蔵出しできる余地というのが非常に大きいのですが、ナ形容詞は生産性が高くサジェストでも及ばない新語への対応が難しいというのもあります。
ちょっと置いてきぼりにしてしまいましたが、動詞の規定についてはとりあえず新語の心配はしなくても良さそうということは言えます。
それというのも、別口入力で[末尾ル型動詞の語尾標識:○R/×r]というのがあるからで新語造語の動詞はほぼ「--る」の形をとることで規定形・終止形への対応はとりあえず間に合う見込みですので出すとすれば既知の動詞の中から適宜規定派生の変化形をあてていけば良いかと思います。
ただ動詞には「過ぎ去りし日」とか「憂うるべき問題」のように活用バリエーション以外にも(古典語を含めた)機能辞や助動詞を巻き込んだ規定というものがあるのでどこまでサジェストで拾ってあげるのかの見極めについてはまだ検討中であります。

以上、長々と書いていきましたが予測サジェストとはいっても入力デバイスの特性を適切に見極めてペンタクラスタキーボードにあった独自の最適形というのを目指していかなければならない、そのためにはさらなる材料を集めて吟味してもっとブラッシュアップしていきたいと思います。
この記事はタッチ液晶対応へのとっかかりとしての導入ですので自分でも消化不良で決して納得のいくものではありませんが未踏の一大体系にぶち当たったんだ、という前向きな課題としてとらえて今後も継続的に追求していくつもりであります。

なお記事のカテゴリとしましては具陳-クリシェという雑多な視点から入ってきたというのもありますので「ジャンル横断的な問題」としますが
追記事等でタッチ液晶について深く考察・提案していくにあたりましては「タッチ液晶部予測変換その他の挙動について」のカテゴリに移行させてUPしていきたいと思いますのでよろしくお願いします。

 

 


この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 具陳なのかクリシェなのかを... | トップ | タッチ液晶部予測変換カテゴ... »
最新の画像もっと見る

ジャンル横断的な問題」カテゴリの最新記事