P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

スペースは切れ目と認識しないで分離しない方が変換に使える

2016-09-29 | アルファベット液晶入力+テンキー部
前回アルファベットを含む文も普通の日本語と同じように変換することを提案しましたが、アルファベットにはスペースがついて回るので入力文の解析の際には切れ目とみなされてしまいよく使われそうなタイトル名や施設名、商品名などスペースを含むものが大文字小文字の使い分けなど細かいところで思った通りに表記されないケースが考えられることに留意しなくてはなりません。
構文解析的にもひとまとまりの単語なら途切れることなくひとかたまりの単語として認識しておいた方が運用上都合が良いと思います。ペンタクラスタキーボードにはでにをは別口入力があるので区切り目の把握はこれらの助詞・助動詞などのパーツや句読点・!?・括弧あるいは改行・確定などで区別すればこれで事足りると思われますが今後検証が必要になってくるかと思います。
ローマ字入力と日本語入力の境目がなくモード切替をしないで良いのはいいのですが、英文を入力していても未確定の文字列として変換プロセスが完了していないというのはなんだか連続入力中だと少し不安になってしまいそうな感覚もあります。しかし少々面倒ですが一連の英語の入力文の後にも日本語入力と同じ手続きで[Enterキー]で確定していくのが良いだろうと吟味の結果思い至りました。
.(ピリオド)や,(カンマ)、!?(感嘆符・疑問符)などが現れた時点でいったん自動確定させるなどの措置はあり得ると思うのでその辺はユーザーの設定などで動作を指定できればいいかと思いますが、それ以前にでにをは別口入力でも逐次確定処理はしていないので(記号ではないが)日本語文の入力時と同じように最後の変換・確定が済むまで未変換文字列としてふるまうほうが統一的で良いと思います。
ではありますが例えばやたらと長い未変換文字列がずらずらと続いて適当な変換・確定のタイミングがつかめないなどの場合は処理の負荷の問題も関わってくるので句読点・ピリオド・カンマなどを目印に適宜変換させるなどというのも考慮に入れておきたいところです。

スペースだけにとどまらず、各種記号も未変換文字列の中に組み込むことが実現すれば「価格.com」や「Re:ゼロから始まる異世界生活」なども普通に通常変換からの1変換でタイプできることになり、構文解析上も「○○を見た」「きっと○○だ」などで使用し文中でも途切れなく名詞として識別されてスッキリすると思います。
ただ記号・スペースの類も単語辞書に含めるとなるとメモリ消費・処理の煩雑化などリソース負荷をどのくらいかけてしまうのか未知数で、私は技術的な事にはあまり専門的な事を言えないのでこれ以上深く言及するのは避けたいと思います。
一つだけ言えるのはペンタクラスタキーボードの利点を生かしてアルファベット混在文もマルチに使えるようにアルファベット単語の扱いも拡張して定義しなおして、でにをは別口入力となじむようなしくみにしていくことが大事だと思います。
スペースや記号類の扱いはそのための足場固めの一環であるということであり細部をよく煮詰めていくことでアルファベットまわりの利便性を高めていくことにつながるだろうという思いがあります。

これと関連してペンタクラスタキーボード配置図には[半角/全角]のキーは一応あるものの、これは日本語入力のON/OFFのためにあるものではなく、文字通りアルファベット入力の半角/全角を指定するために存在するキーとしておく方が元々の目的を果たしており収まりも良いと思います。
ただフォーム入力時や普通に英文だけを入力しておきたい用途のためには日本語入力のON/OFF切り替えも残しておかなくてはならないので例えばタッチ液晶面に「英数入力ON」、ペンタクラスタキーボード盤面上に「日本語入力ON」のキーを別途設置しておく方がいいのかもしれません。
(日本語入力ONの方はかな等を入力した時点で日本語入力が始まったと認識できるのでいらないかもしれませんが(^_^;))
この辺はApple JISキーボードなどがスペースキーの両脇に「かな」キー、「英数」キーが配置されていて半角/全角のトグル式切り替えと違って即応的に押せば切り替わるので混乱が少なくわかりやすいと思います。
この例を大いに参考にして日本語入力(アルファベット混在含む)に切り替えるキーをどこかわかりやすいところ、例えばペンタクラスタキーボード上の左側のTabキーの隣、「半/全」のところに成り代わって設置するのも一策だと思います。「半/全」はそこまで重要な機能ではないと思われるのでどこか端っこやタッチ液晶部へ転置するのも致し方ないでしょう。

なおこの記事ではスペースや記号がいかなる場合でも単語のつながりを分断し、ひとつながりの単語であることを認識できないようになっているかのように書いていますが実際のところ個別の単語の認識にどれだけ影響しているのかを正確に把握してはおりません。
完全に思い込みで書いたものでありいらんお世話となるようなものかもしれませんが一つご勘弁のほどをお願いします。どなたかアルファベット混在文まわりの構文解析に詳しいWebサイト・書籍をご存知の方がいらっしゃいましたらメッセージフォームからどうぞ知らせ下さい。

この記事についてブログを書く
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« アルファベットを未変換文字... | トップ | 語と語のつながり方を考慮し... »
最新の画像もっと見る

アルファベット液晶入力+テンキー部」カテゴリの最新記事