P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

別口入力キー候補[Ø文字マーカー]の補足追記その1

2018-05-20 | 別口入力にまつわる諸問題
補足というにはおこがましい(かもしれない)のですがとりあえず雑記です。
内容もとびとびでまとまりのないものではありますが、別口入力キー候補で提案した[Ø文字マーカー]に関していくつか感じた考察点について述べていきたいかと思います。

Ø文字マーカーの代表的な用例、「装定」について、「古文ではどう適用されるか」という軸と「品詞は何か」という軸から
・形容詞の装定(古語/現代語)
・動詞の装定(古語/現代語))
の各場合にマーカーを適用していくケース分けをおこないましたが、これには形容動詞(ナ形容詞)の場合は考えられていません。
なぜかというと形容動詞の装定=連体形ではすでに別口入力の[な]が使われているためそれ専用のマーカー配置の手立てがもう済んでいるからです。
なので文の切れ目をあえて明示するØ文字マーカーの出る幕はなくユーザーは一連の打鍵の流れで適宜[な]の別口入力を自然に入力していきます。
ただしナ形容詞の元になった古語の形容動詞(ナリ活用・タリ活用)の連体形ではマーカー指定が役立つ例もあるかもしれません。
とはいえ「なる」は断定の助動詞「なり」とラ行四段活用動詞の「なり」に加えて伝聞・推定の「なり」など複数用例がありここで意識されるナリ活用の形容動詞の活用語尾(…それぞれ連体形の場合)
のほかにもさまざまな用法での「なり」が使われるのでその性質・背景の吟味が必要です。
ナリ活用形容動詞以外の、例えば「男もすなる日記といふものを~」における「すなる」は「す」+伝聞の助動詞「なり」連体形の形ですのでこちらも性質的には装定の機能をもっているわけで、
これらにもいちいち律儀にマーカー配置をしなければならない可能性をもっています。ただ、末端部が「--なる」と2文字で、しかも例えば「かい」とか「よう」などといった衝突しやすそうな2文字とは違い割と固有性の高そうな2文字「なる」であるので誤変換を誘発しにくそうだと考えることができます。
同様にタリ活用の連体形も「--たる」2文字で、この句には繰り返し畳語の漢語が多くみられることから語句切り出し上のヒントも多くこちらも誤変換を避けやすいのではないかと推測できます。
もちろん畳語でない「確たる」「際たる」「異なる」などの短い文字数でのナリ活用・タリ活用の語があるのでこれらは境界をはっきりさせるためにマーカー受け入れ態勢を整えた構えをとっておくことも有効かもしれません。
ただそれら特殊例以外では古語ナリ活用タリ活用の装定についてはそれほど綿密にカバーしなくても良さそうな気がします。(ちょっと迷走していますがスミマセン)

そして懸案事項であるØ文字マーカーの認識を前置(予告や宣言)でやるのか、対象文字列の直後の後置(注釈・確認)でやるのかの問題については、最善の答えは見えてはいないもののやはり後置スタイルの方が適切であると判断しました。
理由はそれまでの別口入力や特に装定に関わる[な]の入力が実質後置でおこなわれているのでそれにそろえる形でしたほうが統一性があるのではないか、と考えたからです。
もちろん前置のほうのメリットとしてはマーカー配置後の対象文字列の開始位置が後続の直後の文字列であるということがはっきりしているという点が大きいですし、対象範囲のレンジもそこから最短で意味のある語を切り出していけばよいということで認識の厳密性から言うと前置のほうが優位そうですが
後置スタイルに統一していくという手続き的な便宜に加えてユーザーの入力意識の動きからみても唐突に前置しなくてはならないということには強い違和感もあったり対象文字列をすでに打ちかけのところでもマーカー配置が間に合うという意味からもメリットが大きいかと思われます。
それに予告の前置では切れ目に先立ってマーカー入力が行われるため実際の切れ目とのズレが必ず生じてしまいますが後置注釈の場合はマーカーのタイミングと切れ目の伝達が一致して起こるので違和感も少なくより自然な感覚ではないでしょうか。
なのでとりあえずの方針としてはマーカー配置は後置で、ということにしたいと思います。

つづきましては些事になりますが「隠し事がしたい」を回避するための「書く仕事がしたい」のほうを出したいとき、「書く」の装定を確定させるためにはこの位置(かく[Ø]しごと)でのマーカー配置をおこなって使い分けをするということも付け加えたいと思います。
なおこの例で気づいた点としましては使い分けの構図が、<装定句+名詞>(マーカーあり)⇔<対象文字列全体で名詞>(マーカーなし:通常変換)のケースがほとんどで特に長いチャンクの通常変換の対象文字列としてはほぼひとかたまりの名詞の場合しか思い浮かびません。
もしかしたら名詞以外のものもあるかもしれませんがちょっと苦しい例としては「行く清掃」(装定句+名詞)と「幾星霜」(広義の形容詞的?叙述用法)などがあるかもしれませんがあまり自信をもっては言えません。
あとは既述した「停滞前線」を良しとしない「手痛い善戦」の場合では「ていたい」を装定句と解釈・配置がおこなわれるのと同時にその装定句を受けて「ぜんせん」の連結候補に「善戦」をもってくるという判断も重要な点であり、装定という指定に基づいて適切な語をマッチングしてくるという何らかのデータ処理が求められるカラクリになっているところも見逃せません。
あまり詳しい事は想像つきませんが<装定><一体句分離><予述>各用法ごとにそれぞれ別個立てた構文解析を走らせなければならないのか、とりあえず区切りマーキングされたものを包括的に処理していくものなのか浅学なものなのでじっと考えあぐねている状態です。

そしてこちらも微妙な解きほぐしの求められる一例になりますが、「接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき」に関わる以下のような例がぶちあげられました。
「小夜なら夏の日」・「伊刈さえ押さえておけば」・「カモシカ食べません」
これらは<非組み込み化され分解された複合物>(マーカーあり)⇔<接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>(マーカーなし:通常変換)の対立を使い分けるのを念頭としているところですが、
マーカーありの結果として生じる「小夜+なら」のほうは一見分解された複合物にみえますがそもそもの定義からするとまごう事なき <接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>=名詞+なら(接続助詞)+名詞 の形なので本来通常変換に該当するケースを横取りする格好になっています。
対してマーカーをつけなかった通常変換では「さよなら」と4文字の分解されないひとかたまりの語として認識されます。これは品詞としては感動詞だとされていますが、はじめに立てた<接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>を通常変換にするという触れ込みは蔑ろにされ、「でもこの場合は4文字でひとかたまりの最長の構成物をより優先する」とするにしてもどこか場当たり的にお茶を濁しているだけのように見えます。
とにもかくにも「さよなら」に楔を打ち込んで2パーツに分離することは達成しているので、川向こうの対岸に「なら」付きの「小夜」が無事に分離させましたがこの「小夜」というのがいきなり飛び出る固有名詞=いわば「特定個別的」なふるまいをもつ語としてのワード片をもつと感知しているのではないでしょうか。「異物感」ゆえの分離だといえます。通常変換でこれは出せませんね。
これと付随して「伊刈さえおさえておけば」の例ではもっと微妙で、マーカーなしの通常変換の「怒りさえおさえておけば」のほうもマーカーありの「伊刈さえ押さえておけば」のほうも 名詞+さえ で形こそ同じで大差ないように見えるのですが
「怒りさえ押さえておけば」のほうは順当・頻出・淀みない連語的につながった 名詞+さえ(副助詞) で結ぶ一体句とみなしているので通常変換により適合すると捉えて、
「伊刈さえ押さえておけば」のほうは伊刈がやや特定個別的にみえるので一体句としては散漫で結びつきが弱い…と解釈し組み込み化から少し距離を置いている…との見立てによって[マーカーあり]の範疇に組み入れているのです。
これはとても微妙な違いですがこの違いによって「~さえ」の典型一体句と捉えず、特定個別的なもののなかで「いかり」に相当するもの…この場合は人名/地名の「伊刈」の方をあえて選択する、というマーカーの有無でどちらを選好するかというところの違いが明確になっていくプロセスにも留意していかなければなりません。
これを踏まえた「カモシカ食べません」の例はマーカーありの変換例としてはおりますがこちらはより細分化された複合物ではなく、どーんとした長いカタマリの「カモシカ」のほうが非組み込み化(マーカーあり)としている一方「カモ」と「しか食べない」のようにスプリット化している方が通常変換を受け持っています。カタマリと複合物…対極のはずの両者が噛み合わない交差を起こしていますね。
この例では両者の区切り位置が全く同一であるので一瞬混乱してしまいますが、4文字の「カモシカ」を主題名詞のきりだしの一種とみてその文字列の末尾で切り離したと考えるのが適当と捉えます。
2文字「カモ」+2文字「しか」のほうは2パーツを一体句=<名詞+助詞や形式名詞で結んだ複合物>と捉えて純粋ないち名詞ではなく混合構成物的であるこちらを通常変換のテリトリーで処理するという捌き方は慣れるのに時間がかかるかもしれませんが理に適った処理ではないかと思います。
もともと通常変換では「モダリティ(-そう等)・アスペクト(-たて等)の込み入った表現の派生形をより優先して変換させる」といった性質があるためこれに近しい作用のこちらの用例においても通常変換は同じようなはたらきをするほうが原理・原則に合っているのです。
「一体句を非組み込み化したいとき」という言い方がミソで先ほどから前面に出しているような「分離物」「一体物」という物言いにあまりこだわることではなく、「組み込む」「組み込まない」の観点で再理解して頂ければ誤解は氷解していくと思います。
もっと本質的な事を言えば「特定個別的」であるのかそうでないのかが意外とこの問題のキーを握っているのかもしれませんね。

そして若干の軌道修正なのですが、「副詞のきりだし」のところのくだりで
辞書の副詞とマッチした場合は名詞よりも優先してとりたてるような方針にするのと同時に(糖分摂ってないからよりも当分とってないからを優先)
と記述してしまった箇所がありましたがこちらの場合は主題・標題の「糖分」のきりだしはマーカー配置が受け持って、特定個別ワードの入っていない「当分」、文意がニュアンスづいている副詞込み成分を広義の一体句とみて通常変換に受け持たすというふうに若干修正したいかと思います。
記事中にあげた「だいぶ」と「大仏」、「今なら」と「今」(-奈良)のように区切り位置のずれる例では使い分けも意識できて明快ですが、「とうぶん」のように区切りに差がなく混同しやすい場合はレンジ辞書引きの違いを利用できないので、前後の文脈であるとか<主題名詞のきりだし>などといった当該部分がどの用法なのかの立脚視点を勘案して構文解析していくことが求められる場面だと思います。

さて、最後にここではお伝えしきれないことなのですがこれまで掘り下げてきた一連の別口入力候補[た][い][し]のそれぞれについて、
[た]は過去形の装定、[い]は形容詞の装定、[し]は動詞の連用中止の切れ目としてそれぞれØ文字マーカーの機能で集約できるのではないか、といういわゆる上位互換の可能性についてはこれまたひとつ大きなトピックではないかと思うので[補足2]とする別の記事で近いうちに見解を述べていきたいかと思います。


ここまでの記事を概観してみますと大きなトピックであるØ文字マーカーの用法、<装定><一体句分離><予述>の捉え方の解釈が競合するときはどの用法のものを優先していくのか、そのルール作りと判断基準の根拠は何なのかについてはほとんど触れずにきてしまいました。(対通常変換での捉え方はそれなりに言及しましたが)
近くあげるであろう補足記事でも特に言及するほどの材料がまだそろっていないのが実情でこの方面にはまだまだ情報の整理と典型例の収集が必要であるかと思います。ですのでおそらく触れることはありませんがもっと先の材料が出そろった段階でいつか発表していければよいなと思います。
Ø文字マーカーについてはいろいろと掘り下げ甲斐のある大きなテーマだと思いますので今後も多角的に考察していきたいかと思います。

この記事についてブログを書く
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« きよしこの夜 うまし国 けだ... | トップ | 別口入力キー候補[Ø文字マー... »
最新の画像もっと見る

別口入力にまつわる諸問題」カテゴリの最新記事