P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

7[あやまる][うかがう][あう][あずかる]

2016-11-18 | 変換三属性の検討例
7[あやまる][うかがう][あう][あずかる]

<誤る・謝るを三属性で使い分ける>

誤る…属性ハ(第三の属性)
謝る…属性ロ(用言全般)

ポイント:誤るは正誤の概念があるので第三の属性とします。謝るは人間の動作の側面が誤るよりより強いので属性ロになります。

もう一例

<伺う・窺う・覗うを三属性で使い分ける>

伺う…属性ハ(第三の属性)
窺う…属性ロ(用言全般)
覗う…属性ロ(用言全般)

ポイント:窺うには一部分から察して読み取る、様子をみる、機会を待つ、覗うにはひそかにのぞいて様子を見る、の意味があり一行動として完結している観があります。
属性ハの伺うには何度でも伺う可能性があるのがその都度的であり謙譲語でもあることから特徴性があるので属性ハの第三の属性に分類します。

もう一例

<合う・会う・逢う・遭う・遇うを三属性で使い分ける>

合う…属性ハ(第三の属性)
会う…属性ロ(用言全般)
逢う…属性ロ(用言全般)
遭う…属性ロ(用言全般)
遇う…属性ロ(用言全般)

ポイント:合うはマッチング・合一・適合のメカニズムがあって事象のトポロジカル性があります。他の動詞の連用形を受けて接続する、-し合う・殴り合うなどの語はこの限りでなく通常変換の範疇とします。
他の「あう」は人と会う・たまたまあう・不運にしてあう・巡りあい惹かれあいの中であうなどそれぞれニュアンスがありますが人間存在が主体の動詞ですので用言全般の属性ロで対応します。

もう一例

<与る・預かるを三属性で使い分ける>

与る…属性ハ(第三の属性)
預かる…属性ロ(用言全般)

ポイント:与るは関与する・関わるの意または目上の人から好意・評価の表れとして受け取るの意がありやや抽象的な概念であり、預かるの方はより個人本意的で行為としての側面が強いのでそれぞれ「与る」を属性ハ(第三の属性)、「預かる」を属性ロ(用言全般)に分類したいと思います。

☆4例通して個々の人間の具体的な動作・行為のニュアンスが強いとき属性ロとなり、存在のありよう・状態の叙述は属性ハとなる基本則があります。
これらは統一・一貫した判断基準によって分類されるものではなくその時その時の同訓異字との場当たり的な比較によってなされるもので局所的ではありますが、同訓異字の衝突による問題を回避する用においては有効な手段だと思います。
ただ属性ハ(第三の属性)の語の場合よく使う表現でも通常変換を回避してわざわざ個別属性を入力しなければならないのかという懸念があり判断の分かれるところです。もしもともと変換判断の苦手な種の同訓異字であれば大ざっぱながら区別して変換できるのはやる意味が少しはあると思います。

この記事をはてなブックマークに追加

通常変換の属性決め撃ち問題

2016-11-09 | 変換三属性+通常変換のシステム考察
別口入力の導入によって、助詞に関してはぎなた読みのような区切り間違いによる誤変換はほぼ解決したとは思いますが、三属性変換の解釈の違いのエラー要因はさまざまありいくつか誤変換の例文をあたってその傾向を考察してみました。
公式の比較例のほかに笑える系の誤変換サイトでのものも見ましたが昔はそんなまさかな誤変換も実際にあった時代も存在するわけで、ひとつの誤変換の裏側に広がっている背景的な広がりを考えるとあながちシャレとばかりは言っていられないものです。
ペンタクラスタキーボードは従来のIMEの蓄積を一旦スクラップ・アンド・ビルドするわけですから変換精度の悪かった昔の変換例でも役に立つ部分はあると思います。

(誤変換例)
幸せって余分だな:IME 2003
幸せって呼ぶんだな:IME 2007    (マイクロソフト資料)
だいぶ使った→大仏買った
うさぎ追いしかの山→うさぎ追い鹿の山

これらの例では「余分」「大仏」「鹿の山」のように突飛な感じで名詞が浮いていますが、「呼ぶんだな」のようにだ+終助詞でひとり言で詠嘆のニュアンスを出しているのが汲み取られず「余分」が優先されていますし、程度の副詞「だいぶ」が汲み取られず「大仏」が切り出されています。
古文表現の「うさぎ追いし」では助動詞「き」の連体形「し」で過去の回想の意がありますがこういった基本動詞の口語的や古文的なバリエーションにはあまり対応しておらず予想外の「鹿の山」が変換されてしまいます。

(例 続く)
ちょっと様子を見たい件も→ちょっと様子を見た意見も
去年に比べた海水順だ:ATOK 2007
去年に比べ高い水準だ:ATOK 2008
恥メッカらもって毛羽いいのに:ATOK 2007
はじめっから持ってけばいいのに:ATOK 2008   (ATOK 2007と2008の比較)

続く例では希望の助動詞「たい」のついた「見たい件も」が素通りされシンプルな「見た意見も」が選ばれています。こういった例ではより込み入ったモダリティのある表現に重きを置くように通常変換を作りこんでいった方が一見妥当そうに見える変換に流されなくてよいと思います。
「見た意見」というのはかたまりでは名詞なので属性イの名詞の変換で済むと思いますがどうでしょうか。(「見たい件」もかたまりでは名詞ですが「見たい」というモダリティもあり混然的であると思います)
「去年に比べた海水順だ」は「比べた」(用言)-「海水」(体言)の接続ですが、「去年に比べ高い水準だ」のほうは「比べ」(用言)-「高い」(用言)-「水準」(体言)となっており修飾関係がより込み入った後者の方が優先されるべきです。
「恥メッカらもって毛羽いいのに」ではどうも名詞が悪影響を及ぼしているのがうすうすわかってきました。「はじめっから持ってけばいいのに」の口語表現に追いついていないのもありますが、名詞全般が安易に確定化され過ぎているような気がします。

これらの全体像を考察してみるとまず第一に口語的な派生表現や含意・モダリティのついた用言などを具体化しやすい名詞・体言に幻惑されずに浮かび上がらせることが重要だということが前提にあります。
不自然な・あるいは無理のある叙述構造は局所的に見るのではなく文の言い口がなんであるかをわかっていれば適切な認識につながると思いますし、込み入っているところにより具体性・固有性の鍵が秘められているのだと勝手な経験則を当てはめたくなります。

そのうえで三属性変換の観点からみると、先述の派生的表現に対応しつつも三属性の判断の分かれる場面では名詞属性イ・第三の属性ハはちょっとバイアスをかけて抑制していって結果的に属性ロの用言全般の属性が指向されるようなスタンスで臨むのがひとつのアイデアだと思います。
ステイし→捨て石となるのは避けたいですし、あまり使われる場面があるかどうかわかりませんが、咲くし→佐久市・佐久氏となってしまい急に絞られた特定の話題に入ることはリスキーであり違和感のもとになります。
こういった特定的な手掛かりはまずは通常変換では一発で出ないプロセスを経てその後ユーザーから明示的に体言なら体言と入力・指定する方がそれ以降学習により特定的な語が頻用されるということが明確に分かって具合がいいものです。
それに叙述的・関係描写的な言い回しは同じ言い方をそうそう重複して使用するということがないであろうと考えられますが、固有名詞みたいなものはその話題においてはしばしば何度も使われるものです。

こういった三属性を選択できるからと言って平等に扱うのではなく、どちらかというと属性ロの用言全般に重きを置いて構えることを「属性決め撃ち問題」と名付けることにします。
三属性には単に意味機能の違いを分別するだけではなく、話題の特定性を割り振ろうとする思惑を含んでいる機能があるものだといえます。

この記事をはてなブックマークに追加

通常変換の誤変換抑止力

2016-11-04 | 変換三属性+通常変換のシステム考察
~すること、そういうものだ…などのように事、物と漢字にはあえてせずにすっきりみせようとする意識がはたらく例が日本語文章の中には多く見られます。
ペンタクラスタキーボードではそういった意図を反映させるために[通常変換]を活用していきたいと思います。あえて個別の属性に絞り込んで指定していくのではなく、第一義的な通常変換のキーを押したときにでてくる”標準的な”変換で出てくるのはこういったひらがな表記のものを指向することによるものです。
これからそういったさまざまなケースについて列挙していきますが、はじめに断りをいれておくと変換をするうえにおいては同音異義語の衝突を回避するために通常変換・各三属性変換で使い分ければよいかとは思いますが、順次的に変換できる単語の配置であったり適切な構文解析により同音異義語の衝突を問題としない場合もありつつも語の意味・ニュアンスに焦点を置いて話を進めていきたいと思います。

例えば副詞の「あまり」「たえず」の場合、「余り」と書くと余分な余りを意味する名詞としてとらえられやすく程度や評価のニュアンスのある副詞としての機能が失われるように感じます。こんな時に通常変換を用います。
つづいて「たえず」(いつも、常にの意の副詞)の場合動詞の「絶える」の未然形にずがついたもの(例:絶賛の声が絶えず)と意味上区別したいときに通常変換で変換してひらがな表記の「たえず」が出てくるようにすればいいと思います。このとき属性ロの用言全般のカテゴリーになる「堪える」「耐える」などとも住み分けが自然にできていてあしらいもよいかと思います。

次に連体詞「来る」(きたる)についてですがこれは動詞の「来る」と全く同じかたちであり混同しやすいので最近では「来たる」と書く趨向もあるようですが、厳密な書き分けの例として引用すると
「来る11月23日」-この場合、まだその日は来ていません。これから来るのです。│「英国より来たる客人」-もう既に来ているのです。
(参照)「来たる」と「来る」の違いを教えてください。選挙があってるとき「菅総... - Yahoo!知恵袋
上記の例のように使い分けたいときは連体詞の来(きた)るにしたいときは通常変換で、自動詞ラ行四段活用(古典)の来(き)たるにしたいときは属性ロの用言全般で区別すれば機能の違いをあらわすことができると思います。
ひらがな表記の書き分けの話とは微妙に違う例ですが関連事項なのでとりあげてみました。

次に「こと」「もの」「とき」に代表される形式名詞の例です。詳細な使い分けの解説はここでは割愛させて頂きますが公文書や教材、新聞記事などではひらがなで書く規範がはたらいておりセンシティブなところであります。
これらも通常変換による使い分けが役に立っていくことと思われます。ただ実際の変換の注目単語へのフォーカスと選択の問われ方は変換文字列によって一概ではないためどの程度役立つ場面があるかは不明です。

さらにこれらと同じようなものに動詞の後ろに接続する補助動詞がありひらがな表記に留意する必要のある言い回しが多数あります。例として、
いえる
済ませておく
実現してみせる
やってみる
走っていく
していただく
説明できる
してほしい
腹が立ってくる

などがそれにあたるでしょう。

以上、ひらがなで書き表したい語や言い回しをとりあげてみましたが、通常変換と属性変換の細かな守備範囲の違いは未だ(これも同音異義語の区別が生じる副詞なので通常変換の出番ですね)さまざまなケースが考えられて定まってはおりませんが、ひらがな書きの用法はとりあえず通常変換で対応すればよい、との指針ができたのでまずはよかったと思います。
誤変換を抑止するというよりは、美意識を体現するための機能もしっかりと充実させていかなくてはならないと思います。

この記事をはてなブックマークに追加