P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

入力モードの切り替えとその時の文字セットの遷移の仕方

2018-07-15 | アルファベット液晶入力+テンキー部
まずはこの図をご覧ください。

<図1 入力モードの切り替え>

前回に引き続いて、今回は入力モードの切り替えとその時にデフォルトで提供されるタッチ液晶の文字セットがいかように遷移していくかの詳しい挙動について解説していきたいと思います。

タッチ液晶の英アルファベット・記号・数字などの配列は2種類あってこれはセットと呼んで英数主体の[セットA]と数字を省いて記号類を充実させた[セットB]とがあるのは前回解説した通りです。
セットは英数記号部分を入力するときの英数記号まわりに限った用途においてセット文字群が選択できるといった位置づけですが、入力モードの移行は従来的な"日本語入力""英語入力"といった言語による分け方ではなく
「日英混在文の入力1」と「日英混在文の入力2」との2つパターンを念頭に置いて入力モードを使い分けるものであります。
ちょっと根本に戻って説明させて頂きますと、かなクラスタキーを押せばそれはほぼ(記号以外で)かな文字でありますし、何かの間違えでアルファベットをクラスタキーから入力できるということは絶対にないというのはお分かりかと思いますが、
さらに他方タッチ液晶の面からかな文字が入力できてしまうということも原理上ありませんので打った字種分の揺るぎなき文字列がそのまま反映されるだけであるので日本語字種(かな)⇔英記号字種(液晶)のモードを意識する壁がそもそもないのです。
なので「日本語」/「英数」のモード分けという考え方はもとよりなく、常に日英混在文であることを前提にしているのであとは英語部分を含んで混在変換をさせるのか、あるいは英語部分をソリッドに解釈し混在変換のサポートを手つかずにして変換させる、との違いであります。
それでも英語部分はそれはそれとして日本語交じりの断片として混在的に処理するのであくまでも混在変換前提の中でのサポート関与度合いの違いとして「日英混在文の入力1」と「日英混在文の入力2」が存在するわけです。
詳しい説明にうつる前にまずは図でモード遷移について示したいと思いますので下図をご覧ください。

文字セットトグル遷移と入力モード切替
<図2 英直接入力/標準入力の切り替えと液晶文字セットのデフォルトと遷移>(クリックすると新しいタブが開き拡大します)

文字セットについては後で説明します。まずはモードは2つと先程申しましたが、例外的に入力フォームで受け付け字種が英数に指定されている場合があるのでこれを加えて想定するモードは3モードとなります。
まず一番の基底状態と言えるのが中段にある英数混在の[標準モード]です。
ペンタクラスタキーボードの日英混在入力(標準モード)では利便性向上のために、以下の機能の実現を提案しています。

・AdobeやiPadやIotのような語を特にShiftキーで大文字指定することなく
 [標準モード]においてadobe・ipad・iotのように入力して混在文の中で変換すると
 コンピュータが大文字・小文字部分を適宜変換して省入力してくれる「英文字イニシャライズのサポート」
・W杯・A応P・スポーツch・用賀ICのような日英混成語の小文字大文字の微妙な違いも酌んで変換してくれる「日英混成語の変換サポート」

の2つの課題を掲げてあるのですが、これらはもちろん辞書登録単語にもともとあるから、といってしまっては元も子もないのですが、ペンタクラスタキーボードの日英字種完全分離の設計を大いに生かして変換前文字列でも入力字種の部分部分が曖昧でなくハッキリしていることが力強い支えになります。
単語登録に際しても混成語として文字列字種そのままに入力して事足りるという面があります。これは大きな強みです。
イニシャライズにおきましても手動で大文字化したいというのであればShiftキーを使って意識的に表記づけをすることもできますしおまかせもできます。
たとえ登録単語に入っていない場合でも未知語は原則全大文字に変換する、あるいは変換候補リストの中で頭文字イニシャライズのものを次点以降にもってくるなどのルール作りを整備したうえでユーザーにとって定常のルーチンを乱さないように挙動を定めておけば英文字の扱いもずっと道理にかなったものになるでしょう。
以上のようなサポートに加えて英単語部分の予測入力も(どこまでできるのかはわかりませんが)積極的に機能させていきたいと考えております。
単に英単語つづりの予測提示だけではなく、「Back to the future」みたいにいくつかのスペースを挟んだ形のものも提示候補として出せたらなお良いとおもいますし、ペンタクラスタキーボードでは別口入力マーカーでなにがしかのチャンク区切りが認識できるようになっているので、
スペースが入ったからといって安易に終端要素と捉えるのではなく、別口入力や日本語かな文字列が新たに出てくるまでは英文の一節が続いているのだな、と適切に判断して文字列を解釈していくことができれば気の利くインターフェイスに一歩近づけるのではないでしょうか。
基本状態として混在入力の中でこのように常に盛りだくさんのフォローしてくれるのが[標準入力]になります。

次に補佐的・サブ的な用途として設定してあるモードが[英直接入力]です。
まず大前提としてログインフォームやパスワード入力などで英数単語つづりを学習させたくないオプションとしての用途がこのモードの一番の意義であります。大事な文字列が数文字打ち始めただけで全部補完されてしまってはたまったものではありませんのでこれはマストです。
標準入力での英文字は未確定状態のときはアンダーライン付きで表示して、英直接入力のときの英文字部分はアンダーライン修飾をさせないようにすればモードの違いも明示的に分かるかと思います。
現在入力中の文字列の画面表示に配慮すると同時にタッチ液晶面にもわかりやすい現在モードの表示が必要になってくるかもしれません。
あと補足的には「英文字イニシャライズサポート」で予期せぬ大文字小文字違いが起こるのを回避するためにあえて大文字化のShiftキー同時押しを必須化したものとして使いたいとき、またそのように使えば間違いないとの意図のもとでの入力としてハッキリさせたいときにこのモードが役に立つかと思います。
一応日英混在文として日本語部分の変換は従来通り行われますが受け取った英文字部分の文字列には一切手を加えず、モザイク的に変換していきます。構文解析的にも特段の影響はありません。
ただし冒頭でも申し上げた通り、英文字部分の予測変換は機能しない挙動となっております。日本語部分は解釈の限り予測変換は変わらず機能していくものとします。
この辺りどのような副作用が現れるかどうかは未知数ですが善処していければよいかと思います。

そして[英直接入力]とも重なってきますが、入力フォームなどで特に直接入力/英数(日本語入力OFF)がむこうから指定されているときは特別なケースとなってきます。
日本語入力OFF指定のときは直接入力ですので英数記号のみの受け付けとなり、この場合に限っては日本語かな文字の入力は遮断というか未認識であるとみなされて、入力があったとしても反映はされません。
これはこれで特殊なケースであるので[標準入力][英直接入力]に続く第三の入力モードと位置づけられます。
ただ直接入力とは言うものの文字セットがA、Bと切り替えられるのを想定していますがこれはキーアサインの関係からこのような使い分けが現実的に可能なのかどうかについては浅学なため理解が及ばないので、ダメならダメでそこは「理想の入力形態を追求する」との大義名分のもとコンセプトだけは先行させていきたいのでどうかご容赦頂きたいかと思います。

…これで3種のモードについて説明していきましたが主要2モード間の移行は[英直接入力]/[標準入力]の各キーを押すことで順次即切り替え対応となっておりますし、「テキストフォーム内において日本語入力Offが指定されている場合」についてはその場で直接入力受け付け状態となりカーソルが出ている場合は他の2モードへの切り替えも不可逆的に受け付けない仕様とすべきかと思います。
ここでようやく出てくるのがその時の文字セットはどうなるのか、という問題で標準モードとその他の入力モードのそれぞれに細かな違いがあります。
まず[英直接入力]と「テキストフォーム内において日本語入力Offが指定されている場合」のケースにいるときには最初の変わりっぱなの状態では英数中心の文字セット<文字セットA>がデフォルトにくることになります。
<文字セットB>への移行はそこからタッチ液晶内のセット切り替えボタンでトグル式に変更できるようになっております。
それとは対照的に、[標準入力]へモード変更した直後はこれとは異なり記号中心の<文字セットB>がデフォルトとして出てくるようになっており、こちらは各種記号へのアクセスを重視した構えとなっておりますのでデフォルトセットもあえて変えてある仕様です。
こちらの場合もそこからタッチ液晶内のセット切り替えボタンで<文字セットA>へ移行していきさらにはもう一度セット切り替えボタンで<文字セットB>へトグル循環していきます。


以上で入力モード移行とセットトグル切り替えについて整理していきましたが、あと一つだけ、各種モードの略称について触れておきたいかと思います。
図にもあります通り、ちょっと砕けた言い回しですが「素っ気ないモード[素]」「標準モード[混]」「頑ななモード[頑]」の略称がそれぞれのモードにつけられています。
機能に基づいたセオリー通りの名づけからすれば「英直接入力[直]」「標準入力[標]」「テキストフォーム指定[指]」などのようにすればいいかもしれませんがあまり字面から機能イメージを感じることができません。
[直]に関して言えば英直接入力のものでも日本語入力Off状態のものでもどちらも直接入力の色合いが濃いですし微妙に混同して勘違いの元にもなりますので何かうまい呼称を考えなくてはいけません。
そこで英直接入力=「混在入力を保持しつつ英数部分は直接入力・英単語予測入力はなし」…という予測サポートやイニシャライズのサポートがないというニュアンスを感覚的にあらわした「素っ気ないモード[素]」というのがもっともさらっと特徴を捉えていてベストな表現ではないかと思います。
そして標準というくくりよりも日英混在入力のベース状態としての存在感を強く打ち出した「標準モード[混]」という名称の[混]という部分により特質があらわれていてこちらの方が固有的で良いかと思います。
「標準」という言葉は他の機能の説明のくだりでもひょっとしたら出てくるかもしれませんし抽象的な言葉であるので明確に混在を意識させる[混]のほうが扱い的にも意味カブりを避けられるのでベターかと思います。
最後のテキストフォーム内において日本語入力Offが指定されている場合=「頑ななモード[頑]」は「かな部分は受け付けない」というところがどこか素っ気ないを超えてより限定入力的であるのでちょっと強い言葉にしていますがよりマッチしているかと自負しているのですがどうでしょうか。
どれも比喩的というかイメージ付随のまなざしからくるワードではありますが限られた字数で要点を捉えた言葉をチョイスするにはやはりこうしたヒネリも必要だとは思います。
画面下部のタスクバーに表示されているスペースも1文字分がやっとでありますので[素][混][頑]とやってしまうことも決して思いつきではなく数々の考慮をとりまわした上での合理的な解決策だともいえるのです。

たとえが適当であるかわかりませんが、近年テレビの災害報道などで初動対応が迫られている場面などで「決してあきらめないでください!」「助けは必ず来ます!」といった心情や励ましの心理に訴えかけた呼びかけるようなアナウンスを見かけるようになりました。
テレビ報道は事実だけを淡々と伝えればよい…といった方針を転換して、コミュニケーションに重きを置いたこの手法はさまざまな試行錯誤のうえ考えられたメッセージ機能をもっているかと思われます。心情的であるというよりは、むしろ合理的な手法なのです。
ちょっと後付けかもしれませんが、ペンタクラスタキーボードの入力モード名称についてもこういった心理的機能をユーザーへの認知向上に役立てていこうという意味で先述の報道手法の例にならっているものだと力説したいところです。
ネーミングにもいろいろな可能性を視野に入れてこのような方策をとるのもご納得いただけるのではないでしょうか。


以上で説明を終わりたいと思いますがごく端的に要点を述べると
・Macのように即押しで入力モードを変更する
・モードによってデフォルトの文字セットが異なる
ここだけは押さえてもらいたいところであります。
入力字種完全分離による日英混在文の入力スタイルの最適形に少しでも近づけるよう、有意義な提案になっていれば良いなと思います。

タッチ液晶文字セットの採用文字を一部変更

2018-07-09 | アルファベット液晶入力+テンキー部
当ブログ開設以来、ペンタクラスタキーボードではタッチ液晶パネルを採用して日本語かな/英数アルファベットが完全分離をする…と謳ってあります。
モード移行のごちゃごちゃからくる変換行程の不具合を物理的に完全分離してしまえば、キーの数は増えますがローマ字入力のように日本語なのにアルファベット音素を用いてかなを表すという二度手間がなくなりますし、
従来のかな入力でも日英混在の変換はいろいろと煩わしいものでしたがこちらは完全に役割を分けて、日本語かなクラスタキーは日本語だけ、タッチ液晶部は英数だけ、と住み分けが鮮明ですから何より字種の兼任ということがないので原理上も非常にすっきりします。
ただ液晶面は限られてきますし採用する文字をどうするか、あるいは液晶外のクラスタキーでの記号の取り扱いとなるべく被らないように必要な文字を広くカバーすることが重要になってきます。

それはそうと今まで日⇔英のモード移行について肝心のところを決めていなかったので今回配置図を用いて軽く触れておこうかと思います。

ペンタクラスタキーボード 入力モード切替 キー配置
図1<標準入力モードと英直接入力モード切り替えのキーの位置>(クリックすると別タブが開き拡大します)
上図黄色く塗ってあるのが入力モードの切り替えのキーになります。
今までのキー形状に少し変更を加えて、ソリッドなキーであった[Enter]キーを斧の刃キーに替えて[英直接入力]/[Enter]の上下2方向に増置したのが大きな変化です。
これはMacの入力切り替え方法に倣っておりトグル式ではない即押しモード移行の仕方が直感的に分かりやすいのでこれと同様の非トグル切り替えにしました。
ネット各所でも自分が今どのモードにいるのかがわかりやすくWindowsよりも合理的だと好評でしたのでペンタクラスタキーボードとしてもこれを取り入れた形です。

今回の記事では切り替えの詳細を説明する前に準備のためにタッチ液晶部の文字セットがそもそも今のままでいいのかという見直しをこの際やってみるということで、
いわばメインの説明に入る前の地ならしという形で記号関係の取り扱いを根本から見直していこうかと思います。なのでここではモード切り替えについてはあえて次回の記事に回したいところですのでご留意ください。


さて現在改定後の定義によればタッチ液晶の文字類は、上段が
["][#][‘][’][-][^][~][|][逆スラッシュ]の「標準モード(仮)」と
[1][2][3][4][5][6][7][8][9][0]の「英数モード(仮)」としておりましたがいろいろ検討した結果「モード」は入力モードとの混乱をきたすもとになるのでまずは名称を改めて文字セットからとった「セット」の呼称を使っていこうかと思います。
あとは逆スラッシュの使用も言語環境の特殊性から色々と取り扱いの難しい記号ですのでこれをあきらめ、代わりになにか使い出のありそうな記号を新たに採用したいと思います。
ここは文章であれやこれや説明していくより配置画像をお見せする方が早いのでとりあえずそれをご覧いただいて後ほど説明をしていこうかと思いますのでどうぞ。


図2<液晶英数の文字セットA>


図3<液晶英・記号の文字セットB>
まずはモード名を混同するとややこしくなるので[文字セットA」と[文字セットB]という呼称を使います。
上段に数字キー1-0までの配列を持つ文字セットAにおいては元となった配列の採用文字から一部入れ替えを施して若干変更があります。
変更箇所は下段両袖にあった[€][¥][$]のキーをやめて、[@][-][_]を配置しました。¥や$は物理キークラスタキーにもありますし本当に必要そうな記号を吟味していったところ、
メールアドレス・ID・パスワードの入力でよく使われるであろう[@][-][_](アットマーク/ハイフン/アンダーバー)を優先した次第です。
こちらもクラスタキーと一部かぶってしまいはするのですが、重要度から鑑みて利便性に資すると判断したものです。

次に上段に各種の記号を配置してある文字セットBですが
["][#][‘][’][-][^][~][|][℃]と元から若干変えてあります。下部両裾は[@]-[;][:]と変更はありません。
逆スラッシュは現実的ではないので、何か他の頻出のものでいいものはないかと考えを巡らせましたが熟考の結果摂氏温度の記号[℃]を採用することとしました。
日本語話者では摂氏は一般的ですし、何よりもひとつ℃とキーを決めてしまえば、同じ音の記号の角度の[°]のときにはこちらは変換から出すときに突出候補となることで液晶入力[℃]との住み分けが自然にできていく…といった図式が期待できます。
漢数字の[度]は直前の文字がかな入力のものであればおそらく数字部分も漢字表記ですから後続も[度]にするのが推察できますしまたアラビア数字の数値の場合も[°]がくることが自然で収まりも良くなってきています。

セット間の移行は[123_]をタッチすれば([123\]改め)数字主体の「セットA」に移行し、(現セットはB)
[ABC#]をタッチすれば記号主体の「セットB」へと移行します。(現セットはA)
液晶を介してはいますが基本挙動はトグルで変わっていきます。
外部物理キーで移行するのではなく、液晶内の問題は同じ液晶内での変化にした方が意図がわかりやすいのではないか、との考え方です。


このようにして液晶・アルファベット/記号入力の基本形をリメイクいたしましたが、いずれは改訂版の基本コンセプトにも反映させていきたいかと思いますのでしばしお待ちください。

アルファベット/日本語混在入力に強い(2)

2017-08-06 | アルファベット液晶入力+テンキー部
Tシャツ、Uターンなどような混在語をスムーズに入力できたらいいだろうな…というわけで
以前の記事、アルファベット/日本語混在入力に強い(1)-で列挙した混在語について今回は追加の語句例とミニ考察を交えながらの追記事を書いてみようかと思います。
ペンタクラスタキーボードの利点であるアルファベット/日本語完全分離入力のお陰で以下のような日常目にするパターンの語句の入力も曖昧にならず変換文字列として投げ込むことのできそうな例もいくつかあるかと思います。
早速まずは例をあげてみようかと思います。

(例)T字カミソリ Tシャツ Yシャツ U字工事 Uターン Iターン Eメール Jリーグ O脚 イッテQ みるみるUPっぷ↑↑ トイレへGO!
テンションMAX ラジオDEショー! いつもNAVI Wワーク Bックをオフにしている店  Mッフィー Mステ アンタってツッこみどころ多いWAね
ゆるゆるうんP A応P TVッ子 S高 福PがMXに ポケモンGO スポーツch Mac風 攻略wiki

まずこのブログの基本コンセプト2017ver.のタッチ液晶部の解説にも書いてありますが先に挙げたような混在語におけるアルファベットは、デフォルトでは大文字と捉える事とし、Macやwikiのように小文字交じりあるいは全小文字のアルファベット語は個別例としてネガティブリスト的に記憶させれば良いかと思います。
異論はあるかもしれませんが入力時Shiftキー同時押しなどによって大文字小文字を区別するなどの厳密な指定を必要とするものよりは「まず入力したアルファベット片は大文字のものである」ということが決まっていればシンプルでわかりやすいと思うのです。
そもそも「yしゃつ」と入力したところで大文字の"Y"が小文字の"y"になってしまうのはトホホな現状です。従来のかな漢字変換の入力文字列中においてのアルファベット部分の分別・切り出しは完全であるとは言えずペンタクラスタキーボードのように字種担当がそれぞれ独立・分離して初めて「理想的な未変換文字列」が完成するのだと考えます。
なにやら「y」というアルファベット部分を感知したとしても後続の文字に母音が来ると「や・ゆ・よ」と日本語の字種として読ます方が妥当だとしてアルファベットの一打鍵とはみなされにくいという「遠慮」のような作用が働いているかのようです。
それを如実に表す困った例として「Uターン」「Eメール」「O脚」などが出てきますがこれらの語を素でプレーンに入力しても「うたーん」「えめーる」「おきゃく」となるだけで全く埒があきません。
ならば最初から「これとこれは違う字種だよ」というのが自明な仕組みにした方が間違いがなく、ややこしい煩わしさもありません。
これがわかっていれば先ほどのような「遠慮」的現象も起こらずアルファベット混成語=デフォルト大文字のような決め事の導入も諸事情が絡むことなく大胆に設定できるかと思うのですがどうでしょうか。

このような仕組みの本筋にあるものはまずは「U字工事」などのような語がそもそも単語辞書に登録してあればすんなりと変換できるという当たり前のことを申し上げたいところなのですが、ひとつ突っ込んだところを言うとペンタクラスタキーボードにおける未変換文字列というのは混成語であっても字種の違いに揺るぎがないということが確定しているということを強調しておきたいと思います。
従来の標準的入力方式での未変換文字列-特にアルファベット/日本語混在文字列は前述の「うたーん」「えめーる」などのように母音が来てしまうとアルファベットのままにしておきたい文字片もかなに変換されてしまう現象が起こってしまい、これを回避するためには細切れでその都度入力確定していくか、Shiftキーを適宜押してモードの遷移を操作していかなければなりません。
従来方式のモード遷移・字種さばきの境界はあいまいであり単語登録の段に入ってもなお不確定性が忍び込んでいくことになります。
これを最初から物理的に字種分離が明快なキーボードでおこなえば通常の変換時はもちろんの事、単語登録時のよみの文字列にも字種情報がしっかり反映しているのであいまいさが入り込む余地がありません。当然、よみの文字列も多字種混成のものとなり混成語の入力に望まれる完全な形での未確定文字列の要件が整うことになります。
重要なところはかな漢字変換のプロセスよりもひとつ前の変換前のベタ文字列の決定の段階からアルファベットの扱いにあいまいさが残るということであり重ね重ね言いますがこの問題を解決するには字種を兼任させない字種完全分離のキーボードでもって構造的・原理的な策を立てるのが一番シンプルな答えだと思います。


…ミニ考察のつもりがずいぶん長々と書いてしまいましたが言いたいことは少しは言えたと思いますので、記事をお読みの皆さまにはあとちょっとお付き合いをお願いしたいと思います。

そもそも単語登録に入っていれば具合が良いということは申し上げたかと思いますが、登録がされていない単語、初めて入力する単語、未知語の類にも混在入力における強みを発揮するためにはやや発展的な考察になりますが以下で述べるような処置が有効であるかと思います。
たとえばT字という語句が登録されていなかったとして、T時・T次・T地などの間違った変換候補がでない・あるいは下位順位に提示されるようにするためには連結規則の特徴として[アルファベット1字]+[じ]の配列のときには[字(じ)]の字が優先される…のようなルールを各々整備していくことでユーザーの利便性が向上するのではないかと思います。(すでにこのような仕掛けは常識かもしれませんが)
加えて言うと「SAN値」「F値」のように「ち」に続くときも同様です。これらの配慮があるかないかの有無は使い勝手の意味では大違いになります。
「じ」のような1文字語への連結だけでなく「IT用語」のときには「擁護」は来ない、「TL感想」のときには「乾燥」は来ない…などの2文字以上の語にも接続特性を考慮した変換候補の提示があればより利便性は高まっていくでしょう。
さらに言えば「福PがMXに」のような場合「P」はプロデューサーの「P」であることを理解して「服」や「副」は来ない…(他の人名でも同様)という意味属性情報の参照/推論-的な処理も高度ではありますが考えられます。
この辺は発展的内容として心づもりぐらいはしておきたいところです。フレーム論的な事や意味解析的なトピックも今後避けて通れない話題かと思います。

…これで大体言いたいことは言及しましたが、もう少し挙げるなら
「みるみるUPっぷ↑↑」「Bックをオフにしている店」「Mッフィー」などのような[アルファベット]+[っ]とつながる言葉とかでしょうか。かな入力にしてもローマ字入力にしてもモード移行でShiftキーを押す場面がせわしない入力かと思いますが、ペンタクラスタキーボードならShiftキーを一切使わずに思ったままのリズムで素で入力できます。
これは地味に便利なところで使う場面も多々見られるポイントなので大きなセールスポイントと言ってもいいのではないでしょうか。

このように細かなところではありますがアルファベット/日本語かなの完全分離入力の仕組みはコツコツとユーザー本位の理想的な入力へ近づいていくのに知らず知らずと寄与しているのがわかってもらえるかと思います。
最後にいま一度文頭で挙げた便利な混在入力の語例をもう一度見てみてください。特に初めて入力するときにこのような変換がきちっとうまく変換できるとするならば、ちょっとうれしいと思いませんか?

アルファベット-かな混在入力時のセキュリティの問題その他の考察

2017-01-31 | アルファベット液晶入力+テンキー部
各種ログインや認証・登録などのとき入力フォームの記述によっては自動的に入力モードが切り替わり、受け付ける文字種を誘導的にフィックスするという処理をしばしば見ますが、ペンタクラスタキーボードにおいてはモードの種類や移行遷移などの仕組みがまだよくわからないので技術的な見地からの考察は避けるとしても各種モード時の挙動の大筋の見通しは立てておきたいところです。
セキュリティ上重要なことはログインIDやメールアドレスなどの情報がブラウザの自動入力の機能などのレイヤーではあるにしても、IMEの学習単語レベルのレイヤーでやたらめったら記憶させてはいけないということです。
ペンタクラスタキーボードでは普段からアルファベット-かな混在入力をしており英文単体を入力するモードを使う機会が限られると想定しているため、フォームなどでの英数字入力を通常どおり[通常変換]キーで決定してしまいうっかり秘匿性のある文字列を入力してしまうことも十分考えられるので取り扱いには注意が必要です。
第一義的には半角英数モードでの語句記憶や何らかのモニタリングはまずあってはならない事ですが、ペンタクラスタキーボードの変換特性もアタマに入れつつ、適切な入力単語学習の有効範囲の設定について手探りではありますが考えてみたいと思います。

<セキュリティの観点から>
・英数入力モードのときには単語登録・学習をしない
・半角英数モードに指定されたフォームからの入力のときには単語登録・学習をしない
・[英・無変換]キーによる変換で得られた英・かな混在文のうちアルファベット・数字のみで構成され完結したもの(かなが混在しない)の入力があったときには学習をしない

ここで[英・無変換]キーという言葉が出てきますが、これは過去記事 アルファベットを未変換文字列とみなして変換に役立てる - P突堤2
において提案された新設のキーで使いどころがわかりにくいのではありますが、通常変換が全・半角の指定やShiftを押さずともアルファベット語句の大文字化を適宜行うなどのちょっと好都合的?なお任せ仕様を想定していたため、逆に何の加工も調整を施していない素のアルファベット文字列を敢えて出したいときにどうしても必要になるのとの結論でひねり出したのが[英・無変換]キーという機能です。
通常変換の中でアルファベット語句を融通して使おうとするとアルファベット単語の学習によりTOYsrusやUSAgiみたいに大文字小文字や半角全角が部分的にいびつに局所変換されてしまう問題があるので、学習や登録単語の反映を抑制してプレーンな英数文字列を出力する手立てを確保する必要があるのです。(入力モード変更の操作をせずに気軽に即応したい)
この考え自体は便利なもので[英・無変換]が後に控えているおかげで通常変換においては日常使うさまざまなアルファベット語句を表記の細かい手間に煩わされることなく使うことができて非常に助かる機能だとは思うのですが、前述のセキュリティ上の懸念があるので純・英数の入力文字列のときは慎重を期して学習を拾わないように配慮した設計にしなければなりません。
学習はせずとも、アルファベット単語として単語登録したいときは[英・無変換]キーで決定する際にユーザーからの能動的なアクションで適宜登録メニューを選択させるようなオルタナティブな構造が求められるのです。

通常変換でのアルファベット混在入力の良いところは、別口入力の助詞などが間に挟んでいようが「GETする」などのサ変動詞がくっつこうが、「~でR」などのように自由に使っても[通常変換]キーひとつで全体をひとかたまりの日本語文として変換するのが良いところなのでこの基本方針は変えずに、付随する細かな問題をケースバイケースで個別的に対処するのがいいと思います。
[英・無変換]についてはF9、F10キーとの機能がカブる部分がありますが両者の微妙な違いとは何なのかを検討していく必要がありますし、
学習・登録のプロセスについても入力の流れで付随的に登録していくような仕組みはできないか、前置きを置いて登録処理をするものなのかきちんとイメージ像を膨らましていかないとこのテーマにおいてはアルファベットの予測変換という難題まではとても言及できそうにもありません。

今後もさらに考察を進めていこうと思います。

スペースは切れ目と認識しないで分離しない方が変換に使える

2016-09-29 | アルファベット液晶入力+テンキー部
前回アルファベットを含む文も普通の日本語と同じように変換することを提案しましたが、アルファベットにはスペースがついて回るので入力文の解析の際には切れ目とみなされてしまいよく使われそうなタイトル名や施設名、商品名などスペースを含むものが大文字小文字の使い分けなど細かいところで思った通りに表記されないケースが考えられることに留意しなくてはなりません。
構文解析的にもひとまとまりの単語なら途切れることなくひとかたまりの単語として認識しておいた方が運用上都合が良いと思います。ペンタクラスタキーボードにはでにをは別口入力があるので区切り目の把握はこれらの助詞・助動詞などのパーツや句読点・!?・括弧あるいは改行・確定などで区別すればこれで事足りると思われますが今後検証が必要になってくるかと思います。
ローマ字入力と日本語入力の境目がなくモード切替をしないで良いのはいいのですが、英文を入力していても未確定の文字列として変換プロセスが完了していないというのはなんだか連続入力中だと少し不安になってしまいそうな感覚もあります。しかし少々面倒ですが一連の英語の入力文の後にも日本語入力と同じ手続きで[Enterキー]で確定していくのが良いだろうと吟味の結果思い至りました。
.(ピリオド)や,(カンマ)、!?(感嘆符・疑問符)などが現れた時点でいったん自動確定させるなどの措置はあり得ると思うのでその辺はユーザーの設定などで動作を指定できればいいかと思いますが、それ以前にでにをは別口入力でも逐次確定処理はしていないので(記号ではないが)日本語文の入力時と同じように最後の変換・確定が済むまで未変換文字列としてふるまうほうが統一的で良いと思います。
ではありますが例えばやたらと長い未変換文字列がずらずらと続いて適当な変換・確定のタイミングがつかめないなどの場合は処理の負荷の問題も関わってくるので句読点・ピリオド・カンマなどを目印に適宜変換させるなどというのも考慮に入れておきたいところです。

スペースだけにとどまらず、各種記号も未変換文字列の中に組み込むことが実現すれば「価格.com」や「Re:ゼロから始まる異世界生活」なども普通に通常変換からの1変換でタイプできることになり、構文解析上も「○○を見た」「きっと○○だ」などで使用し文中でも途切れなく名詞として識別されてスッキリすると思います。
ただ記号・スペースの類も単語辞書に含めるとなるとメモリ消費・処理の煩雑化などリソース負荷をどのくらいかけてしまうのか未知数で、私は技術的な事にはあまり専門的な事を言えないのでこれ以上深く言及するのは避けたいと思います。
一つだけ言えるのはペンタクラスタキーボードの利点を生かしてアルファベット混在文もマルチに使えるようにアルファベット単語の扱いも拡張して定義しなおして、でにをは別口入力となじむようなしくみにしていくことが大事だと思います。
スペースや記号類の扱いはそのための足場固めの一環であるということであり細部をよく煮詰めていくことでアルファベットまわりの利便性を高めていくことにつながるだろうという思いがあります。

これと関連してペンタクラスタキーボード配置図には[半角/全角]のキーは一応あるものの、これは日本語入力のON/OFFのためにあるものではなく、文字通りアルファベット入力の半角/全角を指定するために存在するキーとしておく方が元々の目的を果たしており収まりも良いと思います。
ただフォーム入力時や普通に英文だけを入力しておきたい用途のためには日本語入力のON/OFF切り替えも残しておかなくてはならないので例えばタッチ液晶面に「英数入力ON」、ペンタクラスタキーボード盤面上に「日本語入力ON」のキーを別途設置しておく方がいいのかもしれません。
(日本語入力ONの方はかな等を入力した時点で日本語入力が始まったと認識できるのでいらないかもしれませんが(^_^;))
この辺はApple JISキーボードなどがスペースキーの両脇に「かな」キー、「英数」キーが配置されていて半角/全角のトグル式切り替えと違って即応的に押せば切り替わるので混乱が少なくわかりやすいと思います。
この例を大いに参考にして日本語入力(アルファベット混在含む)に切り替えるキーをどこかわかりやすいところ、例えばペンタクラスタキーボード上の左側のTabキーの隣、「半/全」のところに成り代わって設置するのも一策だと思います。「半/全」はそこまで重要な機能ではないと思われるのでどこか端っこやタッチ液晶部へ転置するのも致し方ないでしょう。

なおこの記事ではスペースや記号がいかなる場合でも単語のつながりを分断し、ひとつながりの単語であることを認識できないようになっているかのように書いていますが実際のところ個別の単語の認識にどれだけ影響しているのかを正確に把握してはおりません。
完全に思い込みで書いたものでありいらんお世話となるようなものかもしれませんが一つご勘弁のほどをお願いします。どなたかアルファベット混在文まわりの構文解析に詳しいWebサイト・書籍をご存知の方がいらっしゃいましたらメッセージフォームからどうぞ知らせ下さい。