P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

コンセプトが大事 単にアイデアだけであったとしても、それには価値がある

2017-06-12 | 当ブログの基本的な考え方・方針・見解
このカテゴリの中でも以前触れていましたが、このブログで書かれている解説・考察はまっとうな技術的知識にもとづいて書かれたものではなく力量不足を露呈しつつも不完全な知識でこうであろう、こう機能するであろうと言った推測、憶測をもとに書かれております。
しかもコンセプトを説明していく体においては当然のように~になります、~であるから…などの断定口調を用いておりいささか不誠実であるかもしれませんがコンセプトの筋を際立たせたいがために精一杯背伸びをしてこのような言い口になっていることをどうかご理解いただきたいと思います。
もちろん根本的なことで技術的な誤解があれば早急に訂正したいと思っておりますし、プログラミングに関して微に入り細に入った解説は自重したい…もとい話しようがないのであまり深入りはしないように努めております。
ただこうしたインターフェイスがいい、こんなデータでやりとりすればいい、などの使い勝手に関して色々と想像していくことは決して安易な考え方からきているのではなく、ユーザーの利便性の向上に真剣に向き合ってのことだと認識していただきたいと思います。

こんなブログ主ぴとてつではありますが、ペンタクラスタキーボードのコンセプトを現実に実装・製造も含めた「開発」プロセスとして実行していくのは今の段階では非現実的だとは重々自覚しております。
たとえ私じゃない誰か優秀な人がいたからといってこのような広範にわたるコンセプトを「個人レベルで」実現できる人物はどこにもいないでしょう。
このような状況では頼みになるのはひとえにコンセプトがどれだけ練られているか?の完成度に懸かっているのだと思います。
まるで夢想のように思われる方もおられるかもしれませんが力強いコンセプトやビジョンには現実の事業を引っぱりだす力が備わっていると思うのです。

レオナルド・ダ・ヴィンチのヘリコプターのように優れた洞察から生まれた空想の産物は、たとえそのままの形で実現しなかったとしても確かにその後の機構装置開発に多くのインスピレーションを与えています。
現代の流体力学・航空力学の知識のある人から見ればこんなの飛ぶわけがない、と一蹴されてしまうこのアイデアですが、この500年以上も前に描かれた一つのスケッチがこうして時を経て現代に花開くなんてロマンあふれる話ではないでしょうか。そこには普遍的な「原形」のもつ価値が宿っていたことを物語っているのだと思うのです。
つまりアイデアが大事なのです。ペンタクラスタキーボードの基本コンセプトには「かなとアルファベットの完全分離」「でにをは別口入力」「三属性の変換」の3つが謳ってありますが、この要件を満たすものなら何もぴとてつの考案した多少運指に難のある、筋の悪いキーボードのカタチにはこだわらずとも何か同等の機能のある別の機構で実現されても良いのです。
コンセプトのもつ力が人を動かし、その時代の要請する機能基準を満たすカタチにいくらでも変化をしつつ具現化されていったとしても、原形のもつ価値は揺るがないものです。

あくまでも想像ですがこのペンタクラスタキーボードの製品としての形態は何かタブレット端末みたいなものに付属する形になるのか、あるいはデスクトップパソコンのメインキーボードとして独立したものになるのか、さらにはノートパソコン単体の中で組み込まれていくのかは現時点では全くわかりません。
何が最適な形態としてどう完結していくのかは未来の話として任せるにしても、コンセプトの原形のアイデアル(理想形)なものが具体化を推進する源泉となって人々が「使ってみたい」という関心を惹くためのきっかけになると思うのです。
何かまるでこのコンセプトが実現化されて、やれ事業化されたらこうなる…やれ製品形態はこうなる…などとさも現実のように書いてはおりますが、実現を信じずに夢見るものなどいません。ブログ主ぴとてつは至って本気です。
人間の想像力が、現実の科学技術の制約に後れをとっては情けない話です。想像の力は型にはめられてしまうことなく、つねに現実に先行していなければなりません。
ペンタクラスタキーボードのコンセプトも今後どう転がっていくのかまだわかりませんが、技術の最前線をいく方たちにとって少しでも示唆を与えられるものであってほしいと思います。

この記事をはてなブックマークに追加

ブログポリシー:P突堤2

2017-06-10 | 当ブログの基本的な考え方・方針・見解
1.P突堤2(以下 当ブログ)へのリンクについて

当ブログは完全リンクフリーです。
トップページ、記事など、正規に公開しているページであれば、どのページにリンクしていただいても問題ありません。
ただしインラインフレームの使用や、画像への直リンクなどは禁止させて頂いております。


2.当ブログが使用しているアクセス解析ツールについて

当ブログでは利用状況の把握や改善のため、Googleアナリティクスを利用してアクセスログの収集を行っております。
このGoogleアナリティクスはトラフィックデータの収集のためにCookieを使用しています。
このトラフィックデータは匿名で収集されており、個人を特定するものではありません。
この機能はCookieを無効にすることで収集を拒否することが出来ますので、お使いのブラウザの設定をご確認ください。
情報が収集されるのを避けたいお客様は、Google社の提供するプラグインhttp://tools.google.com/dlpage/gaoptoutをインストールすることによりcookieやIPアドレスの収集を防ぐことも可能です。

Googleアナリティクスの詳細につきましては下記のリンクを参照ください。
Googleアナリティクスサービス利用規約
データ保護について
Google社プライバシーポリシー


3.アフィリエイトプログラムについて

当ブログ P突堤2 は、amazon.co.jp を宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、Amazon アソシエイト・プログラムの参加者です。
このプログラムにより、第三者がコンテンツおよび宣伝を提供し、サイトの訪問者から直接情報を収集し、訪問者のブラウザにクッキーを設定したりこれを認識したりする場合があります。

プログラムにおいて情報の扱いについては下記のリンクをご確認ください。
Amazon.co.jp プライバシー規約


4.免責事項

当ブログの提案している日本語入力のコンセプトの一部は、その後の検討などによりブログ起ち上げ当初のものとは異なる変更・訂正をすることがございますので、読者様・関係各位におかれましては、何卒事情をご賢察の上、最新情報をご確認いただけますようお願いいたします。
また、当ブログに掲載している情報については正しいものを提供するよう充分な注意を払っておりますが、提供している情報、リンク先などにより、いかなる損失や損害などの被害が発生しても当ブログでは責任を負いかねますのでご了承ください。
リンク先の商品は当ブログが販売しているのではなく、各リンク先店舗での販売となります。購入方法、その他お問い合わせは各店舗までご確認ください。商品購入に関するトラブルに関しては、当ブログでは責任を負いかねますのでご了承ください。


5.著作権について

当ブログに掲載されている情報についての著作権は放棄しておりません。
当ブログ記事からの引用に関しましては「引用元の明示」によって無償で引用頂けます。ただし、全文転載はお断りいたしております。
引用許可範囲についても、事前予告なくこれを変更する事があります。


(初出掲載:2017年6月10日)

この記事をはてなブックマークに追加

手続きを伝えるのではなく意図を伝える日本語入力

2017-05-17 | 当ブログの基本的な考え方・方針・見解
かな漢字変換の変換の使い勝手を良くするための手段として、特定の文法的カテゴリの語を専用のキーに割り当ててしまえばいいという考えは何もこのブログだけの提案というわけではなく日本語入力について考えておられる方なら誰しも一般的にもつ定見のようです。
2chのとあるスレッドで
609:04/13(水) 02:50 pLPiKaDd0
動詞変換と名詞変換をわけて変換できるようにすれば日本語もっと楽になるのに
……というレスを見つけたときはやっぱりこう考える人がいたんだ、と合点がいったものです。
誤変換の看過できないようなタイプ、想定している誤変換の斜め上を行く、品詞すら違う誤変換に出くわしたときの違和感を何とか解決できないかという思いには切実なものがあります。

また、前回のDVDレビューで日本初のワードプロセッサー機器JW-10について調べているうちに気づいたのですがこのマシンのキーボードに「固有名詞キー」というキーが盤面左手前に配置してあるのを見つけました。
こちらのケースはメモリリソース的な事情からで、固有名詞は無数にあるため全てを辞書に持つことは不可能であり、頻度の高い普通名詞と同じ辞書にすると、頻度の小さな固有名詞のために大きな辞書を引くことになり処理時間が増大してしまうという問題によるものです。
結局これらは複数の変換器を用いて文節分析をおこなう中で機能して、通常文節と固有名詞文節とは入力時にオペレータが区別して入力する方式となっています。
当時のマシン性能の事情とはいえこのように一筋縄ではいかない問題をアドホックに解決するというスタイルは技術の延長性という観点から決して好ましものとは言えませんが現に市場に投入する商品のパッケージとしてはこのような諸事情を織り込んだモノに落ち着いたというのは十分に理解できます。
こうして日本語入力の創成期にも先人たちが手探りながらも行き着いた答え――結果的に、「固有名詞キーで変換」というアイデアはもうとっくにあったことがわかりました。

アドホックというと目的達成の手段として有用かとも思うのですが「特定の目的のための」「その場しのぎの」という意味をもつため決してポジティブな意味ではありません。
ならペンタクラスタキーボードの三属性変換も結局はアドホックな解決策の最たるものであると言えなくもないですが、このコンセプトはアドホックどころかこれらを拡大・展開して一大体系まで押し上げようと目論んでおり三属性キーも限定的・付属物的な扱いなどにとどまらずむしろメインイシューとして論を立てているのですから立場の違いは大きいと言わざるを得ません。
しかし少し考えてみればわかるのですが変換エンジンを鍛える・機械学習をさせる際には読みが振られたテキストを与えればよいのですがこの論でいくと静的プロセスでのデータのやりとりというものから甚だ逸脱しているのでせっかくの巨大なデータをかな漢字変換器のブラッシュアップに生かすことができません。
それに三属性に分けると言っても従来の品詞体系と呼応させづらい問題はどうするか、いまだに解決の目途が立っていないのです。なにしろ大雑把に3つ(+通常変換)に語句のカテゴリを分類してしまおうというのですから少々乱暴な話ではあります。
ルール・データ・メンテナンスの評価を客観的・定量的におこなう見地からみてもその都度ユーザーが関与する不測の要素の介入は定型的なデータ処理にそぐわないということから敬遠されるのだと思われます。

そんな問題を抱えつつも言葉の意味属性・文法的機能に着目し三属性にわけて同音異義語の困難を解決しようとする試みは検討の価値がありただの雑論として斬り捨てるにしては惜しいものがあります。
その理由は人間と機械との絡み合う相互作用を俯瞰して捉えた人間-機械系という一つのシステムとしての視点です。
単に機械にデータを与えた・流し込んだうえでの変換は単に機械系と位置づけられますが、人間側の関与、しかも変換キーを押して一括で変換するプロセスの完了以前のユーザーとの密なやりとりから生まれる動的な決定性は、変換文確定までに幾多のメタ情報を随時盛り込んで役立てることで可能になるのです。
でにをは別口入力のはたらきもそうです。形態素解析の足を引っ張る助詞まわりの弁別から解放され構文解析、係り受け解析などの文法的・意味的分析により注力できるようになることは日本語入力の思考世界にも新たな地平を切り開く呼び水となると思います。
さらにはネットにある情報とのリアルタイムなやりとりを念頭に置いたポスト人間-機械系なども考えられますし現に一部では実現されています。これらの「系」の視点変換の恩恵を十二分に活かした設計というのは末端的なユーザーインターフェースではある程度考慮されているにしても、変換プロセスの根幹から意図的に構築した類のものは未だ聞いた事がありません。

それらはエージェントと対話的にやり取りするインターフェイスというよりはむしろ認知・思考過程も範疇に入れたうえでの「身体の拡張」と言った方がいいのかもしれません。でにをはマーキングや三属性の取りさばきといったアクションは言語活動における身体的所作と言い表すことができ、機械が行う各種の言語処理や画面への反映の状況とまさに一体となって一挙一動しているのです。
応答的なエージェントというのは人間と機械との間にある種の距離感を生みますがコンピュータの深層ににあるデータ処理・判断の核心的なレイヤーにまで入り込んで意図を反映させる営みはまさに人機一体と呼べるものです。
ただそれらを実現させるためにはユーザーの側にもIME動作への全般的な理解が求められることになります。ペンタクラスタキーボードというのはなぜこんなややこしい事をして入力しなければならないのかというユーザーの疑問に答えて、わかりやすい誤変換の例などを提示してその回避策の有効性をひとつひとつ丁寧に説明していくことがブログ主ぴとてつに与えられた大事な使命だということを自覚していきたいなと思っています。

この記事をはてなブックマークに追加

立ち位置

2017-03-31 | 当ブログの基本的な考え方・方針・見解
このブログではペンタクラスタキーボードというものとそのキーボードの特性にもとづいたIMEが一体どんなものになっていくのかをあれこれ考察しているわけですが、何らかの開発用件・ビジネス的な具体的計画があるのではなくあくまでコンセプトのみを提案しているものであり色々不備もあるかと思います。
ですから真っ当な技術的知識にもとづいて一本筋の通った論説を展開できないのが己の力不足を痛感して歯がゆいのですが、ペンタクラスタキーボードのコンセプト自体の広がりがデバイス的なところからIME・自然言語処理のフィールドであったり日本語の文法的な面からの考察も必要になってくるなどさまざま広範にわたるのでこれらを有機的に俯瞰する視点もまた重要になってくるかと思います。
できることは限られていますがなにぶん多岐にわたるような提案なので新たなコンセプトの全体像を示していくことを意識しつつ今後も考察・解説に注力していきたいと思います。

ブログ主ぴとてつはただの好事家とありますがこのようなブログを開設した割には力量不足というのがありこのコンセプトの趣旨を破綻なく紹介できているか自信が持てないのですが、アイデアの核である[かな・アルファベット完全分離のキー入力、でにをは別口入力、三属性の変換]のパッケージをまがりなりにも示すことができたのでそれ以上は多くを望まず後の説明はオマケなんだというくらいの気持ちで書き続けていこうかと思っています。
しかし書いているうちに技術的・専門的な領域に触れることも避けては通れないですし文法的見地からの検証も欠かせません。できる範囲で調べられることは調べていきたいですが自らを専門家だと称して不見識を振りまくのは適当でないと考えるので考えを述べるに当たっての自分の立ち位置というのをはっきりさせる必要性が生じてくると思います。
自分にはこうして確固たる「伝えたいもの」があり現代ではネットの恩恵で沢山の人たちに届けるということが当たり前のようにできる時代だからこそベストな伝達方法を模索していくことが求められていますし、思わぬ角度から個人としてアイデアを出せる環境ではコミットする役割というかスタイルもその当人なりの向かい方があるのだと思うのです。
そうやって考えた結果、以下のものがこのブログを綴っていくうえでのスタンスであると定義したいと思います。

<発信者としての立ち位置>
・創作者として
・モノ言う顧客として
・日本語入力の啓発者として

最初の創作者としてというのはこのブログで提案しているペンタクラスタキーボードというものが五角形キー(クラスタキー)のメカニカルな機構も実在しているわけではないのにもかかわらず、仮に実現していればの前提で話を進めていることをはじめとして、三属性変換を用いないときの通常変換の動作は適宜プレーンに変換しことさらに属性イ(名詞)や属性ハ(接辞のつく形)の語句をとりあげないような穏当な変換結果を返すものとするなど具体的な説明を伴わないまま結論ありきで根拠に乏しいなどの問題点があげられることで、
これは正しい知見に基づいて仕様を制定・構築しているというよりもむしろ理想とする入力ガジェットを勝手流に書き散らかした一種のフィクションのようなものであると言ったほうが正確であるということからきています。
しかし闇雲に創作の産物を一段低く見ているわけではなく、新しいコンセプトを生み出すうえでは世界観を提示してはたらきかけるという点で有用であると思いますし出発点である素朴な視点・「でにをはを別入力して文の区切り目を示すのはどうか」「用途・意図に応じた複数の変換キーを設けるのはどうか」ということをわかりやすく伝えるアプローチの一形態としてむしろ「創作物である」と言い切ってしまったほうが分かりやすいかと思います。
確立されたものを構成して見せるのではありませんし不確定のものを織り交ぜつつ提示していくのである意味創作としての色が出てくるのも当然の帰結といえます。

次にモノ言う顧客としてというのは至極当たり前なようですが「こんなものが欲しい」という全くストレートな欲求によるものからきています。
自動車産業を興したパイオニア、かのヘンリー・フォード氏が言ったとされる言葉に「もし顧客に彼らの望むものを聞いていたら、彼らは『もっと速い馬が欲しい』と答えていただろう。」というものがあります。ちょっと皮肉めいた言葉ですが顧客は自分が真に欲するものをうまくイメージできないから供給側が顧客を引っ張って先進技術の旗振りを進めていくのだ…という気概が感じられます。
しかし昨今の商品事情などではビッグデータの解析による消費行動の解析手法により「観察することからニーズが見えてくる」というのに重きが置かれていて新提案は企業側からお膳立てするものだという風潮が生まれているのではないでしょうか?
そんな中では愚見かもしれませんが今では一般の者であっても情報の集積やアクセスのし易さも当時とは桁違いですのでもっと消費者側からの主体的な関与も見直される余地があってもよいかと思います。
特に日本語入力はまだまだ改善の余地のある分野であり世界標準のキーボードの制限から離れ根源的に理想のキーボードを追求するという試みもあってしかるべきです。
ペンタクラスタキーボードのコンセプトは入力機器としての側面をもつ一方さまざまな目的のキーをIMEと連動させて日本語の特質にフィットするよう機能させたものであり、分野横断的な視点のもとで構成されたものですのでとかくタコツボ化しやすい産業社会では生まれにくいものなのかもしれません。
しかし決して奇をてらったものではなくあくまで本筋・がっぷり四つの正攻法とブログ主は自認しつつ提案しているのであり理想のプロダクトを求めているのは企業だけではなく個人でも充分に寄与する可能性があることを見せていけたらいいかと思います。

そして最後に日本語入力の啓発者としてというのは自分にはとても及ばないものでありますし数多の関係者にも申し訳ない気持ちもあるのですが意を決して勝手ながら意識させていただきたいと思います。
というのはそもそもペンタクラスタキーボードの発想が、「人間の側が機械に歩み寄る」要素を多分にもっているからです。
従来のIMEでは入力された文の文法情報(助詞などの切れ目)や語義情報(よろづ)などをいちいち入力・選択することなどなくシンプルな手続きでかな漢字変換プロセスが行われていましたが、このキーボードではコンピュータと入力文以外のメタ情報を密にやりとりします。確かにでにをは別口入力では配置を工夫して親指打鍵を活用するなど入力リズムが狂わないように図っておりますが慣れるまでは助詞の別個入力は異質に感じてしまうかもしれませんし、三属性変換では通常変換も用意してはおりますが素早く目的の変換語句にたどり着くには三属性変換を駆使しなくてはなりません。
それでも従来の方法では誤変換が生じて結局は手直ししなくてはならない場合の困難を見据えれば、より"用心深い"やりかたとして正確な変換をするための手掛かりを随時ユーザーの側から提供していくことは誤変換をなくすという一大命題に取り組む手段としては甚だまっとうで理にかなったアプローチではないかと思います。
入力文をリテラルに読み込んで、単一の変換キーで変換候補を提示する…こういったわかりやすさも良い事は良いのですが正直ユーザーの側からやれることが少なすぎて意図の汲み取り不足や早合点で微妙なちぐはぐさを露呈する事態に何度も悩まされてきました。
目配りする要因が増してインプットの負荷は増えるかもしれませんが打鍵数自体はさほど変わりません。こういったディティールへの即応性をもたせたことにより「覚めじゃないサメだ」「お母さんにじゃなくてお母さん似だ」というのをカーソル移動訂正や愚直に変換候補がでるまでキーを連続押しするなどの手間をとらずに直接意図・文脈を意思表示してはたらきかけるというの現実に試みているのです。
もちろんこういった意思疎通を実現するうえではユーザーにIMEの動作としての文脈は今どういったものなのかを把握したうえで各種入力して頂くと、「これは通常変換してしまうと『無効』じゃなくて『剥こう』が出てしまうから気をつけよう」といった判断が先読みできますし、文法知識が求められるこんな場面…「『この』は連体詞だから別口入力『の』は付けずに『この』のままで入力しよう」といった判断が可能になるのです。
拙ブログではユーザーにもこのような背景知識・前提知識をIMEの動作との兼ね合いも掘り下げながら丁寧に解説していく義務があると認識しておりますし技術上のハイコンテクストなメカニズムをユーザーと共有することが望ましい関係性であると感じておりますので時には細部にこだわって解説していきたいと思います。

以上の3つの立場を掲げつつ、各界の先人達に導いていただけるよう視野を広げていきながら論述を進めていきたいと思います。
今後ともお付き合いのほどよろしくお願いいたします。

この記事をはてなブックマークに追加

書いてみてはじめて分かることもある

2017-02-09 | 当ブログの基本的な考え方・方針・見解
前回、英数モードやフォーム入力時のセキュリティについて書いたまではよかったのですが、[英・無変換]キーというのを持ち出してきてあれやこれやと説明してしまい、試しに盤面上に配置させてみた図を作成したところ、何かしっくりきません。


明らかに失敗でしたね。
無理やりとってつけたような配置の仕方も違和感がありますが、そもそもファンクションキーのF9・F10のはたらきにちょっと変更を加えれば済む話でした。
(日本語部無干渉型半角英数・全角英数)とちらっと書いてありますが、アルファベット・かな混在文を入力したところでかなの部分をあえてローマ字つづりに直すことなど考えなくてもよく、ローマ字で入力された部分だけに作用してF9・F10のような英数変換と同様に変換すればよいのであって、何も難しく考えることではなかったのです。
ペンタクラスタキーボードではかなとアルファベットの入力が完全に分離していますから"たんご"を"TANGO"のように変換するまでもなくタッチ液晶部からアルファベットを入力して注文どおり"TANGO"と書くこともできるわけですから。
ですので、結論として従来のF9・F10キーの機能の延長上として(日本語部無干渉型半角英数・全角英数)が機能するようにすればいいのです。

あとは通常変換においてTOYを学習してしまうとTOYsrusみたいになってしまうと懸念を表しておりましたが、これも杞憂で"toysrus"ひとかたまりとして一単語として抽出することは前後の字種の違いやスペースが入るなどの区切り情報から容易に判定できそうなのでそんなにクローズアップするところではなかったようです。

文字列処理の基本がわかっていない一端を覗かせてしまったみたいで恥ずかしい話ですが、書いている段階ではこういうものなんだと本気で思っていたりします。
でも完全に全体像を把握したうえで考えをまとめて書くなどということは到底できるものではありませんしそんなことをしていたらいつまでたっても考えがまとまらずにこうして記事のアップもままならなくなってしまいます。
人間、書いてみてはじめて分かるということもあるのです。草稿を書いている段階であとからいろいろと考えも浮かんできますし、図を作成している段階でも盲点に気づくことが少なくありません。
でもこうやってあとから振り返る記事をあげて修正していけばよいことなので亀筆になるよりかは少し前のめりにアウトプットしていくスタイルでいくほうが開拓的な分野には合っているかと思います。
静的均衡よりも動的均衡を目指す、ということです。

まだこのキーボードの事で誰かと突っ込んだ議論をしたわけでもないので議論のたたき台としてこうした失敗例が役に立つかもしれませんし、
数々の失敗目線の軌跡が後から談義に加わる人のための良き道しるべになることもあるかもしれませんので懲りずに頑張っていこうかと思います。

この記事をはてなブックマークに追加