P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

アルファベット/日本語混在入力に強い(2)

2017-08-06 | アルファベット液晶入力+テンキー部
Tシャツ、Uターンなどような混在語をスムーズに入力できたらいいだろうな…というわけで
以前の記事、アルファベット/日本語混在入力に強い(1)-で列挙した混在語について今回は追加の語句例とミニ考察を交えながらの追記事を書いてみようかと思います。
ペンタクラスタキーボードの利点であるアルファベット/日本語完全分離入力のお陰で以下のような日常目にするパターンの語句の入力も曖昧にならず変換文字列として投げ込むことのできそうな例もいくつかあるかと思います。
早速まずは例をあげてみようかと思います。

(例)T字カミソリ Tシャツ Yシャツ U字工事 Uターン Iターン Eメール Jリーグ O脚 イッテQ みるみるUPっぷ↑↑ トイレへGO!
テンションMAX ラジオDEショー! いつもNAVI Wワーク Bックをオフにしている店  Mッフィー Mステ アンタってツッこみどころ多いWAね
ゆるゆるうんP A応P TVッ子 S高 福PがMXに ポケモンGO スポーツch Mac風 攻略wiki

まずこのブログの基本コンセプト2017ver.のタッチ液晶部の解説にも書いてありますが先に挙げたような混在語におけるアルファベットは、デフォルトでは大文字と捉える事とし、Macやwikiのように小文字交じりあるいは全小文字のアルファベット語は個別例としてネガティブリスト的に記憶させれば良いかと思います。
異論はあるかもしれませんが入力時Shiftキー同時押しなどによって大文字小文字を区別するなどの厳密な指定を必要とするものよりは「まず入力したアルファベット片は大文字のものである」ということが決まっていればシンプルでわかりやすいと思うのです。
そもそも「yしゃつ」と入力したところで大文字の"Y"が小文字の"y"になってしまうのはトホホな現状です。従来のかな漢字変換の入力文字列中においてのアルファベット部分の分別・切り出しは完全であるとは言えずペンタクラスタキーボードのように字種担当がそれぞれ独立・分離して初めて「理想的な未変換文字列」が完成するのだと考えます。
なにやら「y」というアルファベット部分を感知したとしても後続の文字に母音が来ると「や・ゆ・よ」と日本語の字種として読ます方が妥当だとしてアルファベットの一打鍵とはみなされにくいという「遠慮」のような作用が働いているかのようです。
それを如実に表す困った例として「Uターン」「Eメール」「O脚」などが出てきますがこれらの語を素でプレーンに入力しても「うたーん」「えめーる」「おきゃく」となるだけで全く埒があきません。
ならば最初から「これとこれは違う字種だよ」というのが自明な仕組みにした方が間違いがなく、ややこしい煩わしさもありません。
これがわかっていれば先ほどのような「遠慮」的現象も起こらずアルファベット混成語=デフォルト大文字のような決め事の導入も諸事情が絡むことなく大胆に設定できるかと思うのですがどうでしょうか。

このような仕組みの本筋にあるものはまずは「U字工事」などのような語がそもそも単語辞書に登録してあればすんなりと変換できるという当たり前のことを申し上げたいところなのですが、ひとつ突っ込んだところを言うとペンタクラスタキーボードにおける未変換文字列というのは混成語であっても字種の違いに揺るぎがないということが確定しているということを強調しておきたいと思います。
従来の標準的入力方式での未変換文字列-特にアルファベット/日本語混在文字列は前述の「うたーん」「えめーる」などのように母音が来てしまうとアルファベットのままにしておきたい文字片もかなに変換されてしまう現象が起こってしまい、これを回避するためには細切れでその都度入力確定していくか、Shiftキーを適宜押してモードの遷移を操作していかなければなりません。
従来方式のモード遷移・字種さばきの境界はあいまいであり単語登録の段に入ってもなお不確定性が忍び込んでいくことになります。
これを最初から物理的に字種分離が明快なキーボードでおこなえば通常の変換時はもちろんの事、単語登録時のよみの文字列にも字種情報がしっかり反映しているのであいまいさが入り込む余地がありません。当然、よみの文字列も多字種混成のものとなり混成語の入力に望まれる完全な形での未確定文字列の要件が整うことになります。
重要なところはかな漢字変換のプロセスよりもひとつ前の変換前のベタ文字列の決定の段階からアルファベットの扱いにあいまいさが残るということであり重ね重ね言いますがこの問題を解決するには字種を兼任させない字種完全分離のキーボードでもって構造的・原理的な策を立てるのが一番シンプルな答えだと思います。


…ミニ考察のつもりがずいぶん長々と書いてしまいましたが言いたいことは少しは言えたと思いますので、記事をお読みの皆さまにはあとちょっとお付き合いをお願いしたいと思います。

そもそも単語登録に入っていれば具合が良いということは申し上げたかと思いますが、登録がされていない単語、初めて入力する単語、未知語の類にも混在入力における強みを発揮するためにはやや発展的な考察になりますが以下で述べるような処置が有効であるかと思います。
たとえばT字という語句が登録されていなかったとして、T時・T次・T地などの間違った変換候補がでない・あるいは下位順位に提示されるようにするためには連結規則の特徴として[アルファベット1字]+[じ]の配列のときには[字(じ)]の字が優先される…のようなルールを各々整備していくことでユーザーの利便性が向上するのではないかと思います。(すでにこのような仕掛けは常識かもしれませんが)
加えて言うと「SAN値」「F値」のように「ち」に続くときも同様です。これらの配慮があるかないかの有無は使い勝手の意味では大違いになります。
「じ」のような1文字語への連結だけでなく「IT用語」のときには「擁護」は来ない、「TL感想」のときには「乾燥」は来ない…などの2文字以上の語にも接続特性を考慮した変換候補の提示があればより利便性は高まっていくでしょう。
さらに言えば「福PがMXに」のような場合「P」はプロデューサーの「P」であることを理解して「服」や「副」は来ない…(他の人名でも同様)という意味属性情報の参照/推論-的な処理も高度ではありますが考えられます。
この辺は発展的内容として心づもりぐらいはしておきたいところです。フレーム論的な事や意味解析的なトピックも今後避けて通れない話題かと思います。

…これで大体言いたいことは言及しましたが、もう少し挙げるなら
「みるみるUPっぷ↑↑」「Bックをオフにしている店」「Mッフィー」などのような[アルファベット]+[っ]とつながる言葉とかでしょうか。かな入力にしてもローマ字入力にしてもモード移行でShiftキーを押す場面がせわしない入力かと思いますが、ペンタクラスタキーボードならShiftキーを一切使わずに思ったままのリズムで素で入力できます。
これは地味に便利なところで使う場面も多々見られるポイントなので大きなセールスポイントと言ってもいいのではないでしょうか。

このように細かなところではありますがアルファベット/日本語かなの完全分離入力の仕組みはコツコツとユーザー本位の理想的な入力へ近づいていくのに知らず知らずと寄与しているのがわかってもらえるかと思います。
最後にいま一度文頭で挙げた便利な混在入力の語例をもう一度見てみてください。特に初めて入力するときにこのような変換がきちっとうまく変換できるとするならば、ちょっとうれしいと思いませんか?

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 転ばぬ先のでにをは-別口入力... | トップ | 日本語の特徴を再認識させら... »
最新の画像もっと見る

アルファベット液晶入力+テンキー部」カテゴリの最新記事