P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

インフォメーション

2017-07-07 | ペンタクラスタキーボードの基本コンセプト
この記事は予備エントリです。
何かお知らせしたいことがあったらここに随時追加していきます。
・7/1に別運営のブログからリンクを貼りましたのでそこから新たな訪問者さんがみられるかもしれません。
 はじめてお越しの訪問者様、どうぞよろしくおねがいします。

この記事をはてなブックマークに追加

ペンタクラスタキーボードの基本コンセプト 2017改定ver.

2017-07-07 | ペンタクラスタキーボードの基本コンセプト
私たちが普段使っている日本語の入力には様々な方式が存在し、各種用途に合わせて今日まで大変な発展を遂げてきました。それでもまだ改善の余地があり入力方式も進化していくものと思われます。
ここでそれらの新しいもののひとつとして是非検討して頂きたいアイデアがあります。
日本語入力をより使いやすいものにするために従来の方法を根本から見直し、キーボードの配列に工夫を凝らして入力の最適化を図り、それに合わせてIMEのあり方やはたらき方もキーボードの特質を生かしつつ掘り下げげていったもの、それがペンタクラスタキーボードとその周辺コンセプトです。
入力には独自の配列のキーボードを使用します。このペンタクラスタキーボードは風変わりな見た目をしていますがさまざまな工夫を凝らした結果この形状に至ったものであり、一つ一つに意味があります。これから順を追ってそれらを説明していきたいと思います。

まずはキー配置図を見てみましょう。
ペンタクラスタキーボード キー配置図 2017
*図1 (画像をクリックすると別ウインドウが開き拡大します)

キーの押下方向
*図2
まず全面に五角形のキーが並んでいますがこのキーを各頂点方向に押下することにより、かな文字や記号などを入力していきます。ひとかたまりの五角形(これをクラスタと呼びます)に各行のaiueo五段に分かれたかな文字が配置してあります。
指示方向の特徴として、「あ」段は上方向に、「い」段は盤面外側方向に、「う」段は盤面中央方向に、「え」段は盤面外側やや下方向に、「お」段は下方向に押下方向が設定されています。
その他盤面下側に左右に並んだ斧の刃型のキーがあり、左に配置したものでは「ー(長音)」は上方向に、「っ(促音)」は下方向に押下します。同様に右に配置したものでは「スペース(空白)」は上方向に、「ん(撥音)」は下方向に押下します。
さらに盤面下部右側のキー群の中に「ゃゅょ(拗音の構成要素)」[注2]が配置してあり、それぞれ上、内側(左)、下(やや外向き)各方向へ押下します。これらのキーの場合は丸型四角形のキーのため、押下方向も四方向です。

次に盤面中央部に搭載しているタッチ液晶部分の解説です。
タッチ液晶1
*図3
タッチ液晶2
*図4
このタッチ液晶入力部ではアルファベットのほかにクラスタキーでは担当しきれなかった各種の記号類が配置してあったりやモード変換により数字・通貨記号なども取り扱えるようになっています。
図3のモードではアルファベットと上段の各種記号類の混成した構成のモードとなっております。下段にもいくつかの必須記号を配置してあります。上段の「‘」「'」は左右シングルクォーテーションであり下段の「'」はアポストロフィーであります。間違えやすいので注意が必要です。これらの配列を仮に「標準モード」とでも呼んでおきます。
図4のモードではアルファベットと上段の1-0の数字類に加え先述の下段の必須記号類も加わった構成になっており、下段二段目の記号も一部変更して「\」「$」「€」の通貨記号が配置してあります。こちらの方も仮に「英数モード」と呼ぶことにしておきます。
両モードの下段左隅の「123\」と「abc#」はそれぞれのモードへ移行するためのボタンです。あとは右隅にBS(削除)ボタンがあります。

ペンタクラスタキーボードでは日本語-アルファベット混在入力文の境界の曖昧性を回避し字種を明確にするためタッチ液晶部を用意して日本語とアルファベットの入力を完全に分離してあります。
限られたスペースのタッチ液晶であるため長文の英文の入力には向いておりませんが標準的な日本文における横文字語をコラージュ的に使用していく分には困らないかと思います。
あと[ctrl]+cなどのショートカットキーを入力していくことも不便なため盤面左にショートカットキー群という領域を配置してありますのでそこでいくつかのショートカットキーをワンタッチで入力できるようにしてあります。
タッチ液晶部による日本語-アルファベット完全分離のメリットとしては、日-アルファベット混在文においてアルファベットの語成分の混じった入力文であってもそれを一律に「未変換文字列」として捉えることができることです。例えば「Cはドから始まる和音」といった混在文を特にモード移行等の処理を伴わずに変換することができます。
また未変換文字列とみなすことで「cdらじかせ」「かくやすsim」といった入力でも適宜「CDラジカセ」「格安SIM」などのように大文字に変換して、かな漢字変換の拡張的なはたらきとしてアルファベット部の大文字化(イニシャライズ)もおこなえるようにすることを念頭に置いています。
この変換時の利点を利用すれば学習・登録の状況にもよるかもしれませんが「ITpro」や「microSD」などの部分的に大文字の語句などにも応用範囲が広がってくるかと思います。


「でにをは」別口入力 2017改定ver.
*図5
次に使用頻度の高い助詞、助動詞、形容動詞の活用語尾など(特に一文字のもの)をあえて別入力し、文章の区切りをコンピュータにあらかじめ指示・マーキングして誤変換を防ぐ仕組みについて説明します。
キーボード下部に配置してある[は・が・も・の・や・へ・を・だ・と・に・で・な・の・か・でs]の各キーは未変換文字列中に例えば助詞の「の」が出てきたら、通常の文字キーからではなく下部に配置してあるキーの中から「の」を入力してこれは助詞の「の」だよ、通常の単語の中の「の」ではないよ、とIMEに明示的に理解させるために押すキーとなっており、このとき通常のかなを入力したときと同じように自然に「の」がタイプされていきます。
この仕組みを「でにをは別口入力」と呼び、単に文節/語句の区切りを指定するだけではなく、同時にその文字を入力してしまおうという一石二鳥のシステムを目的として考案しました。
ちなみに「てにをは」ではなく「でにをは」となっているのは接続助詞「て」は[学んで・転んで・軋んで]等のかたちのときには濁って「で」になり、すでにある「で」の別口入力と混同してしまってわかりにくいため、接続助詞「て」の採用は見送られたことによります。
このような「でにをは別口入力」によって
きょうはいしゃにいった。→今日は医者に行った/今日歯医者に行った…のように区切りの捉え方で複数の解釈のある入力例でも使い分けることができます。
他にも胃が/伊賀、何回も見たい/なんか芋みたい、車で/来るまで…等助詞の区切りがはっきりしないことで起こる間違いは枚挙にいとまがありません。

そして[な]や[だ]のキーですが、例えば:不自然な(漢語系形容動詞)、パワフルな(外来語系形容動詞)、クレイジーだ(形容動詞終止形)のように形容動詞の活用語尾の「な」や「だ」を別口入力することによって語句の区切りをはっきりさせて変換ミスを防ごうという狙いがあります。
「異なもの」「ハイな気分」など短い形容動詞の語句に特に有効ですし[注1]、カタカナ形容動詞の場合「な」だけひらがなで語幹の部分はカタカナにするように書き分けるのをこれ一つで簡単に行うことができます。
「な」は形容動詞の連体形の活用語尾の一部「な」の場合にのみ使いますが、別口入力「だ」は形容動詞の終止形の活用語尾「だ」で使われるほか、断定の助動詞「だ」においても使われます。
さらに今回の基本コンセプト改定による見直しで各活用形の「だ」(終止形)のほかに「だろ」(未然形)、「だっ」(連用形)へ続くかたちのときにも別口入力を使用しクラスタキーの通常かなキーと組み合わせて入力していくことにしました。
(例)
静かだった→しずか+[だ]+った          ※[だ]は別口入力
アオリイカだろう→あおりいか+[だ]+ろう     ※[だ]は別口入力
なおナ行・バ行・マ行・ガ行五段活用の動詞がタ形《連用形+助動詞タ・ダ》につながるときに音便形で濁った「だ」となる場合の「だ」は混同しやすいのですが別物です。ペンタクラスタキーボードでは<形容動詞-活用語尾だ><名詞+断定の助動詞だ>のときの「だ」のみを別口入力の適用範囲とします。
(例)
×読ん[だ]
×学ん[だ]
×騒い[だ]

続いてちょっと特殊な[でs]のキーですが、これは上記で挙げた形容動詞あるいは断定の助動詞の丁寧な形の場合の「です」を基本とする表現について使われるキーです。
ただキーの刻印が[でs]のように不定形になっているのは「です」の活用による変化「でしょ」(未然形)、「でし」(連用形)に対応するためワイルドカード的に機能し語尾変化に合わせて表記を追従させるためにあえてこの形にしてみました。
要は後に続く文字によって柔軟に形を変える語素を入力する機能のキーというわけです。
(例)
でしょう→[でs]+ょう
でした→[でs]+た
です→[でs]

さらに最初の方では述べませんでしたが、盤面下部のキー群の中には[○R]キー・[×r]キーというものがあり、これもある働きをするために作られたキーです。
これらは若者ことばや口語で砕けた言い回しのときに使われる「ル形動詞」において使われることを目的としており、例えばDisるやトラブるなどといった語をDis[○R]やトラブ[○R]などのように入力してカタカナ部(あるいはローマ字部)と語尾「る」(ひらがな)の字種をそれぞれ書き分けて反映させるためのものです。
注意点としてル形動詞の活用例:ググる において ググる(終止形)→ぐぐ[R]、ググれ(命令形)→ぐぐ[R]×のように[R]一種の文字だけでは区別のつかない例が出てくるので別口入力を[R]と[r]二系統にしてル形動詞の活用に対応しています。
これによって
ググる→ぐぐ[○R] <終止形>
ググらない→ぐぐ[○R]ない <未然形>
ググろう→ぐぐ[○R]う <未然形>
ググります→ぐぐ[○R]ます <連用形>
ググった→ぐぐ[×r]た <連用形>
ググるとき→ぐぐ[○R]とき <連体形>
ググれば→ぐぐ[○R]ば <仮定形>
ググれ→ぐぐ[×r] <命令形>
のように入力すれば若者ことば[ル形動詞]のカタカナ部(あるいはローマ字部)とひらがな部の字種書き分けがスムーズにできるようになります。[○R][×r]一文字が複数の活用の変化によって臨機応変に変わるので先ほどの例と同じようなワイルドカードのようなものですね。
ただし活用の「ぐぐ[○R]ます」、「ぐぐ[×r]た」が同じ連用形なのにRrで揃っていないとのご指摘がありそうですが、これは[r]を少数派の入力としてあまり適用範囲が広がらないようにした方がわかりやすいのではという判断に基づき、ググった・ググれの2パターンに絞りました。
このように口語文の入力に多少の効果があるかもしれない「○R/×r」入力ですが、Rの前についている○×は[Shift]キー同時押しで入力したときに記号の○と×がすぐに出せるように刻印を施して機能を担うことにしたところからきています。○×は標準的な日本語の入力時にもよく使いますし、[ル形動詞]の砕けた言い回しを万人が必要としているわけでもないので少しは補欠的・代替的になる機能を入れておいた方がいいだろうとの判断です。


最後にこのペンタクラスタキーボードのコンセプトにおいても最も特徴的なアイデアの一つ、三属性による変換について解説していきたいと思います。

三属性の変換
*図6
日本語入力において最も頭を悩まされるものとして挙げられるものに同音異義語の最適な変換がしづらいことがあると思いますが、特に「捨て石」/「ステイし」のようにまったく意味機能の違う語が突然現れて困惑することがしばしばあります。
微妙なニュアンスの違いのある変換候補、例えば「悲しむ」/「哀しむ」、「機械」/「器械」のような変換間違いだったら流石に仕方ないなとあきらめもつきますが、上記のような次元の違う誤変換はなんとかしたいものです。
そこで、意味機能・変換したい意図の違いを3つの属性に分けてユーザーが選択して求める変換のタイプに近づけようとする工夫がこの「三属性による変換」です。
この三属性はかな漢字変換するときに通常の変換キーに加えて別の3種の変換キーを使って目的に応じた変換候補を選択・表示して同音異義語の区別・使い分けを飛躍的に向上させるためのアイデアで、3つの変換キーはそれぞれの性質に基づいてそれぞれ3つの属性を受け持っています。
大まかに説明すると名詞全般・事物概念のものは属性イに、用言全般・名詞述語文・サ変名詞は属性ロに分類され、その他の抽象的概念や接頭語・接尾語で使われるパーツを含む語句などは属性ハに分類されます。

図中の【かく】の変換時の流れを説明すると、まず核、角のような普通の名詞は属性イ、同じく人名等固有名詞である賀来、加来、郭も属性イに入り、すぐれた俳句の意味を持つ佳句も名詞ということで属性イに分類されます。

次に書く、描く、掻く、欠く、画くの5つは用言全般の変換ロに入ります。このような動詞に限らず、動作様態情動などを表す言葉はこのカテゴリーに分類されます。
それらに加えて、寄生や催促などのようなサ変動詞の語幹となる名詞(サ変名詞)も用言に深く関係するので変換ロに、天才や好評など名詞+だあるいは名詞+ですのかたち(名詞述語文)を構成する単語も同じく変換ロに入ります。
また厳密に定義が決まっているわけではありませんが、哀惜・愛惜(あいせき)や慚愧(ざんき)のように定型句で使われる語も情動イメージが豊富なため名詞属性には加えず様態情動の属性ロで処理した方が使い勝手が良さそうです。

そして第三極の属性としている変換属性ハは前記2種とは違う第三の属性として分類され単に名詞的・動詞的などと指定する以前の言外のニュアンスに対して適宜割り当てられたものであり、単に名詞や動詞などの枠とは別に機能的にみて特徴的なはたらきをする言葉をあえて選択したいときに使います。
その適用条件はさまざまですが、図中の例において順番に説明すると、
・各は各車両・各メンバーなどの言葉につく接頭語のため
・格については所有格・リーダー格のような言葉につく接尾語であることのほか、「格が違う」で使われる格のように構造的ありかたを示す抽象的なものであるため通常の具体性の高い名詞とは違うニュアンスをくみ取って
・覚については痛覚・味覚のような言葉につく接尾語であるため
・欠くについては書くのような人間の動作を表す種の動詞とは違って全体性・構造性からみた変化を捉えた動詞なのでひと味違うため
・斯くについては事物指示的な機能をもつ言葉であるため
・郭については五稜郭・原了郭のように施設・店舗名につく接尾語のため
・閣については閣議・組閣のように内閣に関する語につく接頭語・接尾語のほかに飛雲閣・冷泉閣ホテルのように建造物・ホテルにつく接尾語のため
となっており接頭語・接尾語まわりの言葉以外のものは適用条件が抽象的であいまいなものとなっています。しかしながら難しいことにこれらに統一した評価軸というものが見いだせずもともと第一第二の属性に収まりきれなかったものを少々強引に受け皿にまとめたものでありあくまで便宜的な理由で作られたものであることに留意しなければならないと考えます。
要は第一、第二の属性では表せられないもの複数を寄せ集めたものが第三の属性ということです。

図中の変換ハの枠の中に通機的・接辞まわり・第三極の属性というのが書いてありますが、この「通機的」という言葉は全くの造語でざっくりいうと「機(メカニズム)が通じている、またはその瞬間をあらわす言葉」ということで
◆欠く・利く・矯正・結審・断つ・経つ・逸れ・撒く・伺う・委嘱(属性ハ)などの言葉が通機的な言葉の範疇に入るものとします。抽象的で説明しづらいのですが、単に人間の動作・意志を表す言葉と違い存在・ありかた・構造などが本質的に変化する・あるいは認識・評価において新たな局面があらわれるときに使われます。
上記の音の言葉が第二の属性ロとして使われる(人間の動作としての意味合いが強い)場合と対比してみると微妙なニュアンスの違いがわかると思います。↓
◆書く・聞く・強制・決心・立つ・建つ・反れ・巻く・窺う・移植(属性ロ)
この「三属性の変換」は未だはっきりとした定義が定まらず模索中ではありますが同音異義語の使い分けはまずは音ありきによってケースバイケースで分析・判断されるものなので具体例を個別的にこの先の記事で丁寧に説明していきたいと思います。
これまで考察していった具体例について詳しくは「変換三属性の検討例」「変換三属性+通常変換のシステム考察」のカテゴリをご覧ください。

なお以上の三属性で必ず変換しなければならないというわけではなく、特に困難な変換でなければ[通常変換]のキーを入力すればできる範囲でプレーンな変換結果を返すものと想定しています。
さらに単漢字の変換候補をずらずらと表示するのもこの[通常変換]でおこなうものとします。

以上で大まかな説明は終わりです。IME動作の考察やインターフェイスがどのようなものになるのか、あるいは文法的な面での説明etc…その他のトピックは追ってこれから解説していきたいと思います。


補足事項:

[注1][異なもの]若干の補足修正
[注2]拗音の定義に問題があったので訂正します。
「ゃゅょ(拗音)」→「ゃゅょ(拗音の構成要素)」


この記事をはてなブックマークに追加

補足情報

2016-07-10 | ペンタクラスタキーボードの基本コンセプト
この記事は予備エントリです。
何か補足情報があったらここに随時追加していきます。

・最初の記事はここにあります。時系列を追ってご覧になりたい方ははじめからどうぞ。起ち上げ当初の記事には重要な情報が比較的多いと思われます。
・2017年4月時点でのこのブログの大まかなポイントをまとめました。ここからご覧ください。
・2017年7月に基本コンセプトを最新のものに改定しました。ブログ起ち上げ当初の、旧「ペンタクラスタキーボードの基本コンセプト」の記事はここにあります。そちらの方は未分類カテゴリに移動しました。

この記事をはてなブックマークに追加