P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

通常変換の属性決め撃ち問題

2016-11-09 | 変換三属性+通常変換のシステム考察
別口入力の導入によって、助詞に関してはぎなた読みのような区切り間違いによる誤変換はほぼ解決したとは思いますが、三属性変換の解釈の違いのエラー要因はさまざまありいくつか誤変換の例文をあたってその傾向を考察してみました。
公式の比較例のほかに笑える系の誤変換サイトでのものも見ましたが昔はそんなまさかな誤変換も実際にあった時代も存在するわけで、ひとつの誤変換の裏側に広がっている背景的な広がりを考えるとあながちシャレとばかりは言っていられないものです。
ペンタクラスタキーボードは従来のIMEの蓄積を一旦スクラップ・アンド・ビルドするわけですから変換精度の悪かった昔の変換例でも役に立つ部分はあると思います。

(誤変換例)
幸せって余分だな:IME 2003
幸せって呼ぶんだな:IME 2007    (マイクロソフト資料)
だいぶ使った→大仏買った
うさぎ追いしかの山→うさぎ追い鹿の山

これらの例では「余分」「大仏」「鹿の山」のように突飛な感じで名詞が浮いていますが、「呼ぶんだな」のようにだ+終助詞でひとり言で詠嘆のニュアンスを出しているのが汲み取られず「余分」が優先されていますし、程度の副詞「だいぶ」が汲み取られず「大仏」が切り出されています。
古文表現の「うさぎ追いし」では助動詞「き」の連体形「し」で過去の回想の意がありますがこういった基本動詞の口語的や古文的なバリエーションにはあまり対応しておらず予想外の「鹿の山」が変換されてしまいます。

(例 続く)
ちょっと様子を見たい件も→ちょっと様子を見た意見も
去年に比べた海水順だ:ATOK 2007
去年に比べ高い水準だ:ATOK 2008
恥メッカらもって毛羽いいのに:ATOK 2007
はじめっから持ってけばいいのに:ATOK 2008   (ATOK 2007と2008の比較)

続く例では希望の助動詞「たい」のついた「見たい件も」が素通りされシンプルな「見た意見も」が選ばれています。こういった例ではより込み入ったモダリティのある表現に重きを置くように通常変換を作りこんでいった方が一見妥当そうに見える変換に流されなくてよいと思います。
「見た意見」というのはかたまりでは名詞なので属性イの名詞の変換で済むと思いますがどうでしょうか。(「見たい件」もかたまりでは名詞ですが「見たい」というモダリティもあり混然的であると思います)
「去年に比べた海水順だ」は「比べた」(用言)-「海水」(体言)の接続ですが、「去年に比べ高い水準だ」のほうは「比べ」(用言)-「高い」(用言)-「水準」(体言)となっており修飾関係がより込み入った後者の方が優先されるべきです。
「恥メッカらもって毛羽いいのに」ではどうも名詞が悪影響を及ぼしているのがうすうすわかってきました。「はじめっから持ってけばいいのに」の口語表現に追いついていないのもありますが、名詞全般が安易に確定化され過ぎているような気がします。

これらの全体像を考察してみるとまず第一に口語的な派生表現や含意・モダリティのついた用言などを具体化しやすい名詞・体言に幻惑されずに浮かび上がらせることが重要だということが前提にあります。
不自然な・あるいは無理のある叙述構造は局所的に見るのではなく文の言い口がなんであるかをわかっていれば適切な認識につながると思いますし、込み入っているところにより具体性・固有性の鍵が秘められているのだと勝手な経験則を当てはめたくなります。

そのうえで三属性変換の観点からみると、先述の派生的表現に対応しつつも三属性の判断の分かれる場面では名詞属性イ・第三の属性ハはちょっとバイアスをかけて抑制していって結果的に属性ロの用言全般の属性が指向されるようなスタンスで臨むのがひとつのアイデアだと思います。
ステイし→捨て石となるのは避けたいですし、あまり使われる場面があるかどうかわかりませんが、咲くし→佐久市・佐久氏となってしまい急に絞られた特定の話題に入ることはリスキーであり違和感のもとになります。
こういった特定的な手掛かりはまずは通常変換では一発で出ないプロセスを経てその後ユーザーから明示的に体言なら体言と入力・指定する方がそれ以降学習により特定的な語が頻用されるということが明確に分かって具合がいいものです。
それに叙述的・関係描写的な言い回しは同じ言い方をそうそう重複して使用するということがないであろうと考えられますが、固有名詞みたいなものはその話題においてはしばしば何度も使われるものです。

こういった三属性を選択できるからと言って平等に扱うのではなく、どちらかというと属性ロの用言全般に重きを置いて構えることを「属性決め撃ち問題」と名付けることにします。
三属性には単に意味機能の違いを分別するだけではなく、話題の特定性を割り振ろうとする思惑を含んでいる機能があるものだといえます。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする