P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

アルファベット-かな混在入力時のセキュリティの問題その他の考察

2017-01-31 | アルファベット液晶入力+テンキー部
各種ログインや認証・登録などのとき入力フォームの記述によっては自動的に入力モードが切り替わり、受け付ける文字種を誘導的にフィックスするという処理をしばしば見ますが、ペンタクラスタキーボードにおいてはモードの種類や移行遷移などの仕組みがまだよくわからないので技術的な見地からの考察は避けるとしても各種モード時の挙動の大筋の見通しは立てておきたいところです。
セキュリティ上重要なことはログインIDやメールアドレスなどの情報がブラウザの自動入力の機能などのレイヤーではあるにしても、IMEの学習単語レベルのレイヤーでやたらめったら記憶させてはいけないということです。
ペンタクラスタキーボードでは普段からアルファベット-かな混在入力をしており英文単体を入力するモードを使う機会が限られると想定しているため、フォームなどでの英数字入力を通常どおり[通常変換]キーで決定してしまいうっかり秘匿性のある文字列を入力してしまうことも十分考えられるので取り扱いには注意が必要です。
第一義的には半角英数モードでの語句記憶や何らかのモニタリングはまずあってはならない事ですが、ペンタクラスタキーボードの変換特性もアタマに入れつつ、適切な入力単語学習の有効範囲の設定について手探りではありますが考えてみたいと思います。

<セキュリティの観点から>
・英数入力モードのときには単語登録・学習をしない
・半角英数モードに指定されたフォームからの入力のときには単語登録・学習をしない
・[英・無変換]キーによる変換で得られた英・かな混在文のうちアルファベット・数字のみで構成され完結したもの(かなが混在しない)の入力があったときには学習をしない

ここで[英・無変換]キーという言葉が出てきますが、これは過去記事 アルファベットを未変換文字列とみなして変換に役立てる - P突堤2
において提案された新設のキーで使いどころがわかりにくいのではありますが、通常変換が全・半角の指定やShiftを押さずともアルファベット語句の大文字化を適宜行うなどのちょっと好都合的?なお任せ仕様を想定していたため、逆に何の加工も調整を施していない素のアルファベット文字列を敢えて出したいときにどうしても必要になるのとの結論でひねり出したのが[英・無変換]キーという機能です。
通常変換の中でアルファベット語句を融通して使おうとするとアルファベット単語の学習によりTOYsrusやUSAgiみたいに大文字小文字や半角全角が部分的にいびつに局所変換されてしまう問題があるので、学習や登録単語の反映を抑制してプレーンな英数文字列を出力する手立てを確保する必要があるのです。(入力モード変更の操作をせずに気軽に即応したい)
この考え自体は便利なもので[英・無変換]が後に控えているおかげで通常変換においては日常使うさまざまなアルファベット語句を表記の細かい手間に煩わされることなく使うことができて非常に助かる機能だとは思うのですが、前述のセキュリティ上の懸念があるので純・英数の入力文字列のときは慎重を期して学習を拾わないように配慮した設計にしなければなりません。
学習はせずとも、アルファベット単語として単語登録したいときは[英・無変換]キーで決定する際にユーザーからの能動的なアクションで適宜登録メニューを選択させるようなオルタナティブな構造が求められるのです。

通常変換でのアルファベット混在入力の良いところは、別口入力の助詞などが間に挟んでいようが「GETする」などのサ変動詞がくっつこうが、「~でR」などのように自由に使っても[通常変換]キーひとつで全体をひとかたまりの日本語文として変換するのが良いところなのでこの基本方針は変えずに、付随する細かな問題をケースバイケースで個別的に対処するのがいいと思います。
[英・無変換]についてはF9、F10キーとの機能がカブる部分がありますが両者の微妙な違いとは何なのかを検討していく必要がありますし、
学習・登録のプロセスについても入力の流れで付随的に登録していくような仕組みはできないか、前置きを置いて登録処理をするものなのかきちんとイメージ像を膨らましていかないとこのテーマにおいてはアルファベットの予測変換という難題まではとても言及できそうにもありません。

今後もさらに考察を進めていこうと思います。

この記事をはてなブックマークに追加

文末表現の記事からもれた雑多なこぼれ話

2017-01-30 | 変換三属性+通常変換のシステム考察
毎度読みにくい文章で本当にすみません(^^;
前回にUPした記事において誤変換例をいろいろ検討した際に、論旨に沿わず横道に逸れそうなためあえて挙げなかった語句・文例にスポットを当ててとりあげてみたいと思います。
せっかく議論の材料になりそうなのにお蔵入りさせるのはもったいないですからね。

主なテーマであった文末表現云々のくだりでまだ挙げ足らなかった例を列挙します。今回は特にこれといった問題提起をするような記事ではないのでまとまりのない・とりとめのない列挙ですがよければお付き合いください。

誤変換の例:私魔性→渡しましょう    動詞「渡す」の連用形である「渡し」に丁寧の助動詞「ます」の未然形+意思の助動詞「う」がついた形
誤変換の例:掘った層だ→掘ったそうだ  動詞「掘る」の連用形である「掘っ」+過去の助動詞「た」+伝聞の助動詞「そうだ」がついた形
誤変換の例:変化死相→変化しそう    そう:様態の助動詞「そうだ」の語幹
誤変換の例:向こう→剥こう       う:推量・意志の助動詞

助動詞・ニュアンスのついた文末は明確に分ける必要があります。
※「掘った層だ」の誤変換は断定の助動詞「だ」のついた文末ですが後者の「そうだ」のついた文末の方がより長いため派生の度合いがより強いとの判断から通常変換においては「掘ったそうだ」の方を採ります。
助動詞「だ」は別口入力にも使われるほどの基本辞であり、「そうだ」はそれよりもより派生色の強いことがうかがえます。
それに加えて、「層だ」のほうは名詞が主なので属性イで変換するのが筋というものでしょう。

誤変換の例:噛んだら→寒鱈       完了の助動詞「た」(だ)の仮定形
この例は逆で寒鱈のほうが変換しにくいレアケースの場合ですが寒鱈くらいは変換して欲しいというぼやきも込めて挙げておきます。


補助動詞は通常変換で対応、複合動詞は属性ロで…この方針もしっかり認識しておきたいところです。
「ない・よい・ほしい」補助形容詞も同様にひらがな表記のほうを配して変換します。

使い分けの例:並べておく⇔並べて置く  「ならべておく」通常変換(文末派生)⇔「並べて置く」属性ロ(複合動詞または動詞の並立)

*ちょっと微妙なニュアンスですが、通常変換・属性ロ・属性ハにまたがった使い分けもあります。
使い分けの例:乗っとり(口語)⇔乗っ取り⇔則り    通常変換⇔属性ロ(複合動詞)⇔属性ハ(則りには基準に従うの意があり、通機性のある語とみなす)


続けて
助詞が付加したものや定型句的なものも多くあります。

誤変換の例:見よ→身よ         「見よ」は上一段動詞の命令形なのに対して「身よ」は詠嘆的な間投助詞「よ」が付加したもの
誤変換の例:ドコモダケ→ドコモだけ   「だけ」は限定の副助詞
誤変換の例:見た回→見たかい      「かい」は疑問と念押しの終助詞
誤変換の例:見た頭→見たかしら     「かしら」は疑問の意の終助詞
誤変換の例:同化してる→どうかしてる  「どうか」呼応の副詞☆やや定型句的

あとは古文由来の例を2つあげます。
誤変換の例:イワンとする→言わんとする 「言わん」は「言う」に意志や意図を表す助詞「む」が付いた語
使い分けの例:イカれる⇔怒れる     「イカれる」は先を越される・用をなさなくなる・考え方がおかしくなるの意/「怒れる」は完了・継続の助動詞「り」の連体形「る」が接続したもの
「イカれる」は属性ロ、「怒れる」は通常変換です。

最後に方言・口語表現から例をあげます
誤変換の例:タイタン→炊いたん     「ん」は「の」の転で、「のもの」を表す。


以上、雑多でまとまりのない記事でしたが通常変換のもつ指向性をこれらの例から読み取れることにつながればいいと思います。

この記事をはてなブックマークに追加

文末表現・付加表現の種々派生したものなどを通常変換に誘導する

2017-01-23 | 変換三属性+通常変換のシステム考察
通常変換の誤変換抑止力 - P突堤2でも少し触れましたが、語形変化、助動詞、補助動詞、助詞の介在などによりさまざまに派生した文末表現のかな漢字変換を通常変換によって対応するという記事であまりうまくまとめられずに消化不良気味だったので、論点を整理して再考察してみたいと思います。

テーマの前置きとして、アスペクトとモダリティ、この2つの文法用語について少々説明が必要だと思われるので触れておこうと思います。

<アスペクトとモダリティ>
事象の完成度や時間軸からの視点で、出来事や行為の進行具合・結果などの局面を細かく言い分けるのに使われる概念をアスペクトといい、一般的な分類として完成相・継続相・結果相とがあります。(例:-てある、-つつある、-終える(終わる)など)
誤変換の例:所だ→ところだ  今それが行われている最中または完了したばかりの場面をあらわします。
誤変換の例:て置く→ておく  厳密にはアスペクト表現ではありませんが、文法的な意味としては対象を変化させその結果の状態を持続させること、あるいは必要性・目的性に因って対象をそのまま放置することであり、状態の持続というプロセスが念頭にある概念です。
誤変換の例:て終い→てしまい 実現のアスペクト的機能と意にそぐわない事が起こるというモダリティ機能とが併存している例

発話や認識・叙述において、話し手の主観的な判断・態度をあらわす言語表現をモダリティといいます。モダリティの表現範囲はさまざまで、広く判断認識捉え方に関わるもの(評価・可能性・推量推測・適しているか・必要性・認否見解・様態・伝聞・説明)と発話態度・伝達態度(述べたて・意向・働きかけ問いかけ・命令依頼・丁寧・終助詞で付加されたニュアンス)などがあります。
誤変換の例:位相だ→いそうだ      動詞「いる」の連用形である「い」に、様態の助動詞「そうだ」がついた形
誤変換の例:腹痛い→払いたい      動詞「払う」の連用形である「払い」に、希望の助動詞「たい」がついた形
誤変換の例:渡す麻衣→渡すまい     動詞「渡す」の終止形である「渡す」に、否定の意思の助動詞「まい」がついた形
誤変換の例:明けて暮れ→開けてくれ   動詞「開ける」の連用形で「開け」に、接続助詞「て」が続き(テ形)がつき、さらに授受補助動詞「くれ」の命令形がついた形

さらにこれらの表現は助動詞のほかに補助動詞・複合動詞を多く用いて使われます。これらも必要性があるので説明します。

<補助動詞・複合動詞>
補助動詞とは元の意味から離れて別の動詞に後続することにより補助的な機能をもつ形式的な動詞です。同様のものに補助形容詞があります。
例:ある・いる・おく・みせる・みる・いく・いただく・くる・あげる・もらう など

複合動詞とは言いよどむ・開き直る・ひしめきあうなど2つ以上の動詞が組み合わさったものや名づける・巣立つのように名詞と動詞が組み合わさったものがあり、要素が対等に結合したものから本位的-補助的に結合した組み合わせもあります。同様に口惜しいのような語は複合形容詞と呼ばれます。
複合動詞には決まった組み合わせの結合した種のものだけでなく多種の動詞要素との結合可能性をふんだんに有する汎用性の高いパーツをもつ種もあり補助動詞との類似点があります。典型的な複合動詞を語彙的複合動詞といい自由度の高いパーツを含む文法的な複合動詞を統語的複合動詞といい区別します。

誤変換の例:髪切ったよ→噛み切ったよ  切った(普通の動詞)ではなく噛み切った(複合動詞)まで認識する
誤変換の例:マキナ推し→巻きなおし   推し(推すの連用形転成名詞)ではなく巻きなおし(複合動詞)全体でひとかたまりと捉える・このとき「なおし」の部分はひらがなを使うことに着目
誤変換の例:醜い→見にくい       動詞「見る」の連用形「見」に困難表現の補助形容詞「にくい」がついた形
誤変換の例:気安い→着やすい      動詞「着る」の連用形「着」に容易表現の補助形容詞「やすい」がついた形

ここまで説明してきてわかることはこれらの誤変換(あるいは望まない方の変換)は<属性イ/属性ロ/属性ハ⇔通常変換>間の変換方針の対立が際立って起こるものだということです。
概括してみると通常変換においてはソリッドな動詞・形容詞などの表現よりもより込み入った、モダリティ・アスペクトの味付けの入った、あるいは補助動詞・複合動詞を使ってきめ細かく叙述されたものにより重きを置いて捉えるという傾向があります。
また当然文字数的にも大きなレンジで網を張っている変換にしようとする意識があります。「ならべておく」一つをとっても準備のニュアンスの「並べておく」なのか置き方に焦点をあてた「並べて置く」などの微妙な違いも通常変換/その他の三属性変換で使い分ける事が可能になります。


さらに説明を続けます。口語表現や短縮省略形の表現の変換も悩ましげなことが多く対処が望まれています。どこまですくい取れるかわかりませんが例をあげておきます。
<口語表現>
誤変換の例:無事に遺憾→無事にいかん  「いかない」の口語形
誤変換の例:比肩→弾けん        可能動詞「弾ける」+打ち消しの助動詞「ん」 ※「ない」「ぬ」の口語形
誤変換の例:危険→聞けん        可能動詞「聞ける」+打ち消しの助動詞「ん」 ※「ない」「ぬ」の口語形

そして語尾の語形変化ばかりでなく、接続助詞や終助詞、単語の一部として接辞を含むなど付加含意した文法構造のものもあります。これらも適用範囲は多そうですが思いつく例をあげます。
<付加派生的なもの>
誤変換の例:錯視→咲くし        し:並列・対比・理由をあらわす接続助詞
誤変換の例:操作→そうさ        そう+モダリティの終助詞「さ」
誤変換の例:竹材配りの→竹細工ばりの  名詞+似ているものをあらわす接尾語「ばり」

これらの例で属性ロの用言全般との分別が求められますが、語形変化や付加による文法的な派生にも通常変換で対応します。
終助詞は種類も多く、現代口語においても多彩なバリエーションがあるので順次対応せねばなりませんが、モダリティなどの文法的機能を付加する派生には特に押さえておきたいところです。

さらに深掘りすると日本古典由来の古文形式や中国古典由来の漢文形式などからも今なお使われている表現が残っていたりしますのでこれにも言及しておきます。
<古文・漢文からの表現>
誤変換の例:生える→這える       蛇の這えるがごとし:完了・継続の助動詞「り」の連体形「る」が接続したもの ☆同様のものに、生ける屍、怒れる男などがある
誤変換の例:わすレジ→忘れじ      否定の意思の助動詞「じ」
誤変換の例:叱り→然り         ラ行変格活用の動詞。そのようである、そのとおりである。然りながらの形のときは通常変換候補は自重して叱りながらを優先する方が好ましい。

これらの語句は格のとり方や助詞との接続の仕方に傾向性が見られる語もあるので"でにをは別口入力"との連携も視野に入れたいところです。

最後に口語表現の延長として方言も取り上げてみたいところですが、基本語彙から叙述の末端まであまりに多くのバリエーションが考えられるので解析的な風呂敷を広げるのは断念しようと思います。
一部のIMEでは各種方言の変換に対応したものもあるようです。


長々と続きましたが、全体を通してみて少し認識を改めないといけないとの結論が浮かび上がってきました。
万能でプレーンに見えた通常変換でしたが、こうして文末派生表現の差異の受け皿として使っていくうちにある種指向性をもった第4の機能を有しつつあるのがわかってきました。
特に第2の属性ロとの対立を回避するのに非常に有効であるアプローチだと思います。
3属性+通常変換としていましたが、機能上は属性イ(体言)・属性ロ(用言)の2種がありそれプラス便宜上は属性ハ(接辞)・通常変換(文末派生)の2種が備わっていて厳密には4属性をたててとり捌く構えで臨むのだと実感しました。
属性変換のシンプルなモデルとしては完成形が見えてきたと思います。


この記事をはてなブックマークに追加