P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

デス太郎の罠

2017-10-31 | 別口入力にまつわる諸問題
ペンタクラスタキーボードの基本コンセプト 2017.ver を上げてからそれほど経っていないというのに何なんですが、別口入力「でs」に細かな不備が見られたので早速修正しなければなりません。
当初、下記の語をひと続きで入力しようとするとき
でしょう→[でs]ょう
でした→[でs]た
です→[でs]
のように入力します。
…のように解説しておりましたが、いくつかの例外が思い至らなかったケースがあり、これの対応策を考えねばなりません。

例外ケースを以下に列挙したいと思います:
(例1)口語のネットスラングなどで「-ですた。」と書く例もなくはない
(例2)九州弁で「-ですたい」ということがみられる
(例3)「次はあなたの番です太郎さん聞いているの?」などのようにひと続きでいうこともある
…これらは[でs]た=でした のように変換することが定められているせいで「ですたい」も「でしたい」になり
「です太郎さん聞いている」も「でしたろうさん…(太郎の変換タイミングを見失う)」のようになってしまう危険をはらんでいます。

このような現象に対しての解決策として「です」の一旦確定操作としてキーボードでにをは部にある[○R]キーと[×R]キーを活用したいと思います。
要は「ですたい」を[でs]→[○R]→たい のように入力したり、
「ですたろう」を[でs]→[○R]→太郎 のように入力するというものです。
「です」に後続する言葉の入力の前に、一旦[○R]キー打鍵を挟んで後に続ける方式で、ちょっとまどろっこしくなりますが一度確定(≒Fix)というステップを踏んでいるため間違いがありません。
あらゆるかな文字との接続が考えられますが助動詞「です」に絡んだ変換不全要因は[でした]⇔[ですた]の齟齬に関するものだけなのでこれで対応できているものだと考えます。
逆にいえばこれらの限られたケースの為だけに別口入力[○R][×r]キーを贅沢使いしている、と表現しても良いかもしれません。
同様に一応念のため「でし。」(終助詞的調子のある語尾)という使い方もなくはないので他にも見落としがないようにするため
「でし(※末端部)」を[でs]→[×r]の要領で入力するものと定めます。(でしWAAAAAN!!なんていうのもあるかもしれない)

これで、盗んだハートはココです隊♡ なんて洒落たグループ名も安心して表記できますね(笑)。
ただし、「御徒町ですた丼を食べた」のときは別口入力「で」を使えば事足りますし、「です体(文体の基調スタイルをあらわすことば)」などのようなときは律儀に[でs]を置かなくてよい=ベタ打ちのかな入力文で対応
…と捉えることができます。「です」がそのもので文法範疇ではないパーツ化している例ですね。

このように[でs]→[○R]で「です」確定 / [でs]→[×r]で「でし」確定 としてありますが、この「確定」はかな漢字変換の一文としての確定ではなく助動詞「です」の活用変化がひとまず仮Fixしているという意味であり、本来の意味でのIME変換の確定の事ではないので注意が必要です。
Fixを受け付けた後も未変換文字列の入力は依然として継続しており、変換エンジンのふるまいの中でもひと癖ある部分となっているため適切なコード記述・設計が求められるところでしょう。



…これでひとまず別口入力[でs]キーまわりの難点は克服したかな、と思えましたが…。
確かに、うまく凌げたかのように見えます。シフト状態を解除するのにべタのかな文字キーを使わずに文法的機能キーとしてはたらく[○R][×r]キーで処理すれば通常のかなつづりとは違うチャンネルで余計な干渉を起こさずに境界をはっきりさせられますので理に適っていますし、用途を持て余し気味だった[○R][×r]キーを活かすことにもつながりました。
前置してある[でs」キーの性質も別口入力パーツ(文法機能のもつキー)から別の別口入力パーツへの接続なため、本来の「disる」「トラブる」のようなベタ・英/かな文字とは明確に違いますので後続させる[で-す][で-し]の形を特異な別個の存在として保つことができます。

しかし安堵したのもつかの間、どこからともなくこちらに呼びかける声が飛び込んできました――。

「ホーッホッホッホ♪甘い甘い、そんな解決法じゃまだまだ手ぬるいわ。ちょっとやり方が雑でしてよ。」
「今宵はアタクシとっても腹ペコなんですの。なにか美味しいお料理ないかしら?」
そしてそのお供らしき初老の男性が後ろから現れてこう続けます。
「まったく、姫のお供をするのも一苦労でして…。そこの青年殿。このあたりに何かシャスデリなスペシャル・ディナーはござらんか?」

デス太郎「全く何だ…?突然現れて…。」
デス太郎(やれやれ、まったく面倒くさい事に巻き込まれてしまったみたいだな…)

…デス太郎はこのとき、これから自分の身に起こる運命の事など、知る由もなかったのでした。

(この物語は一応続きます。)

この記事をはてなブックマークに追加

拗音の正確な定義

2017-10-20 | かな84キー+記号キーがある事の利便性
訂正するのが遅れてしまいましたが、
「ゃ」「ゅ」「ょ」などの小書き文字のやゆよの呼称について、ざっくりと「拗音」としてしまっており、これらの表現は必ずしも適当でないことが懸念されるので修正したいと思います。
混乱・混同させてしまった読者の方、すいませんでした。

ペンタクラスタキーボードの基本コンセプト 2017改定ver. - P突堤2 の記事中や
過去記事 かなキー84種 促音・拗音・撥音・長音等キーも個別にある。連続入力も可能、つながり方もさまざま - P突堤2 内での表現において、
一部誤解にもとづく記述をしてしまったものがありますので、この記事で正確な定義を盛り込んだ追記事に代えて当該記事に加筆・訂正したいとおもいます。

具体的な訂正箇所は
「基本コンセプト…」については「ゃゅょ(拗音)」としていたものを改めて「ゃゅょ(拗音の構成要素)」[注2]とさせていただきました。
「拗音キーも個別にある…」については記事末尾にこの訂正追記事へのリンクを付加させていただきました。(記事文面はそのままです)

以下、気になる方は目を通してみてください。


さて、問題の拗音なんですが一番の注目点というのが
「『しゃ・しゅ・しょ』『じゃ・じゅ・じょ』のようにかな2文字の全体をもって拗音とし、『ゃ・ゅ・ょ』単体では拗音とは呼ばず、
単に『拗音の一部(構成要素)』としか言えない」ということがわかりました。
誤解しやすいところなんですが、細かな違いではあるものの大きな違いです。

日本語はモーラ(拍)が基本単位となる音節構造なので 拗音の場合の一拍=直前の(普通の)仮名と2文字で一単位 となることがその理由です。
和歌や俳句などのリズムをとるときにきゃきゅきょなどの拗音は2文字で1拍となるのもモーラ(拍)が基本単位となっているからです。
これは英語などの音の区切り方、シラブル(音節)とはまた違った世界であり、日本語のほかにハワイ語などにもみられる独特の音韻構造です。
ちなみに世界の言語の発音体系には、モーラ言語・シラブル言語・ストレス言語の3系統があるのだそうです。

さらに細かな点まで紐解いていくと、拗音の種類は2つあって
開拗音 :イ段の子音から「ゃ」「ゅ」「ょ」(半母音をはさんだ母音a,u,o)へとつながる構造をもつ音節
合拗音 :ウ段の子音から「ゎ」(半母音をはさんだ母音a)へとつながる構造をもつ音節
となっていて、「ゃゅょ」の他に「ゎ」も別の拗音として独立した名称がつけられていることがわかります。
別々に分かれているのには直拗の対立であるとか発声上の違いだとかなどのファクターにより決まっているのですが私の理解度が及ばず煩雑な説明になってしまうのでWikipediaのリンクを貼っておきます。

拗音 - Wikipedia


さてここでトピックをひとつ、
今日では一般的に浸透している外来語の表記に用いるかなづかい全般については
日本の国語施策の一環の中にある「現代仮名遣い」に関連する事項として平成3年に内閣告示が発せられ、よりどころとする旨が訓令されました。
これらの決定は外来語における従来からの表記、科学,技術,芸術その他の各種専門分野や個々人の表記を尊重しており強制力を持つものではないですが、
一般的な外来語の表記全般にわたる目安となっています。

…ここで拗音との関係に触れたいと思うのですが、
外来語や方言などを表すため、直音、拗音以外の音を、通常の仮名1文字に「あ行」、「や行」または「わ行」の 捨て仮名1文字を付けて拗音風に2文字で表記することがあるが、それについては外来語の項に述べる。なお俗に、本来の拗音以外のそれらの音も含めて拗音といったり、2文字目の捨て仮名のことを拗音と言ったりする人がいる。

…とWikipediaには書かれており、拗音の表記法に倣ったと思われるこれら外来語の表記については、本来の「拗音」とされているものとは異なり、副次的な表記手段と言えるでしょう。

紆余曲折・長い歴史がありますが外国語が流入する過程において
もともと日本の50音になかった表記・発音がこうしてある程度ニュアンスを伝えつつ定着していったのも、完全な表記化とはいきませんが、「外来語」として新たな表現の幅を広げる"巡りあわせの妙"のある受容過程であったと思います。

日本語は字種の使い分けやこういった小書きかなのパーツを用いた表記もあって使いこなすのが大変かと思いますが、微妙な使い分けのできる豊かな表記手段を持っているなと実感できますし、
ペンタクラスタキーボードにおいても過不足なくこういった表記の入力に対応ができていれば良いな…と思います。

この記事をはてなブックマークに追加

特殊かな文字入力の記事の追記とアイヌ語入力周辺補足事項(2)

2017-10-11 | かな84キー+記号キーがある事の利便性
先程の記事ではアイヌ語の背景について駆け足で触れる程度でしたがアイヌ文化理解の助けとなるような文献・資料などが今回の記事作成中に出会いましたのでその一部ではありますが紹介したいと思います。
現在継承の危機に瀕している状況も認識しつつ、日本とも関係の深い豊かなアイヌ文化とともに、興味を惹かれたビジターさんにも情報を提供していけたらいいなと思います。


☆アイヌ文化に関する専門的な内容をわかりやすく親しみやすいかたちで紹介した小冊子『ポン カンピソㇱ』(文字通り小冊子という意味)が公開されていましたのでリンクしたいと思います。
北海道博物館サイト内のアイヌ文化を学びたい方へ…のページで小冊子のpdfがダウンロードできます。
アイヌ文化を学びたい方へ | 学ぶ | 北海道博物館
言語から、生活全般・食・信仰についてなど豊富で色鮮やかな資料となっています。

☆日本の言語学者であり早稲田大学名誉教授もされていた田村すず子氏が記した『アイヌ語沙流方言辞典』の概略が掲載してある有用なページを見つけましたのでリンクしたいと思います。
アイヌ民族博物館のサイト内にあるアイヌ語アーカイブ…アイヌ語の基礎の項より
アイヌ民族博物館 アイヌ語アーカイブ
音韻から文法に至るまで詳細な解説が書かれています。


<その他の特殊記号やかななどについて>
アイヌ語の名詞や動詞には人称接辞がついて所有をあらわしたり活用変化したりします。この際、ローマ字表記のアイヌ語においては
ku=nukar「私は見る」のようにダブルハイフンでつなげた形の表記をとります。
これは外来語の人名のカタカナ表記で区切りに使われている用法のものと全く同じ文字・ダブルハイフン(゠)で
例としてジャン=ピエール・ポルナレフやキャサリン・ゼタ゠ジョーンズ、ワインバーグ゠サラム理論などの固有名称があります。
一般に使われている数学記号の等号(=)で代用されるケースも見かけますが、これとは別のものであり符号化文字集合JIS X 0213に加えられたれっきとした記述記号です。

こちらの記号についても、ペンタクラスタキーボード盤面左にある各種記号のクラスタキーの(=等号)を+シフトキーで変化させた形の入力で
(=ダブルハイフン)を表示させていけばよいかと思います。


その他のものとしては、演歌・民謡や方言の表記、マンガのセリフでの言い回しで使われる小書き文字の「ン」もJIS漢字コードには含まれておりませんが議論の対象になる類のものかと思います。


この記事をはてなブックマークに追加

特殊かな文字入力の記事の追記とアイヌ語入力周辺補足事項(1)

2017-10-11 | かな84キー+記号キーがある事の利便性
過去記事 Shiftキーの使いどころ - P突堤2 でShiftキーの有効活用手段として半濁点付き特殊かなや小書き文字のかな文字について少し触れましたが、
挙げた例以外の他のかな文字の見落としがあったので追記を記したいと思います。

まず、くゎいだん(小泉八雲の作品・怪談の字音仮名遣)やシークヮーサー(沖縄の柑橘類)などで使われている小書きの「ゎ」「ヮ」の文字への言及漏れがありました。
これらは「わ」+Shiftで対応すればとりあえず文字入力手段としては確保できると思います。すでに挙げた濁点付きのワ「ヷ」に続いて変換候補として選択していくカタチです。
これらは+Shiftしたらしたで、変換候補でどれを選ぶのか煩雑になりそうですが、辞書の登録単語の収録具合にもよるところが大きいかなとも思われます。

次にまれですが、「う」の語頭の鼻音音節で使われる「う゚」、「ウ゚」(半濁点のついたう、ウ)というのもあったので表記を網羅するためにこれらにも入力手段として
「う」+Shiftという入力で出せるように打鍵設定すれば良いかと思います。こちらも先の記事ですでに「う」に濁点のついた「ゔ」の入力を挙げていますが同様に「ゔ」以下候補選択するのが良いかなと思います。
ただこれについては、クラスタキーにも元々あるカタカナの「ヴ」から変換できればいいじゃないかという点も踏まえたいかとは思いますが、原則カタカナ語でだけ目にする「ヴ」の変換候補にひらがなの「ゔ」や「う゚」「ウ゚」が混ざるのは違和感がありますのでこれらのマイナーな文字は「う」+Shiftキーで入力する方が妥当と考えます。

小書き文字・濁点/半濁点付き特殊かな文字の字種の違いについては、キーボード下部の[かな/カナ]キーでも操作できる方法も確保してあります。(カタカナのみがある特殊かなの場合は[かな]キーでは変換が出しようがないのでナシとする)


過去記事で提案したアイヌ語小書き文字は日本語では一部の「ん」や「っ」以外ほぼない閉音節の音素を表記するのに役立っています。
現在、アイヌ語の表記の仕方には『アコㇿ イタㇰ』(北海道ウタリ協会編アイヌ語テキスト)という表記体系が規範となって各種の文章記述が確立されており、
その表記法ではローマ字表記とカナ表記が併用されつつ「必要な改変」が施されたもの(アイヌ語の音体系に適う表記法)が使用されています。
ペンタクラスタキーボードではこの一面としてのカタカナ表記は近似的な発音を表したものではありますが、
(かつての古文献や知里幸恵(+金田一京助)によって記されたアイヌ神謡集でのローマ字ベースの表記法)を経て現在の『アコㇿ イタㇰ』が確立された経緯を踏まえつつ)
Mac OS Xと同等程度の入力機会をかな入力方式ベース(=特殊ではありますが端くれとして)の側から提供する図式になります。(あくまでもコンセプトでしかありませんが)

・アイヌ語の表記の変遷について触れているブログを見つけましたのでリンクを挙げておきます。
学問がすべて : 「アコロ イタク」式表記とヘボン式表記

・アイヌ語表記と文字コードの関係が解説してあるwikiを見つけましたのでリンクを挙げておきます。
JIS X 0213利用者有志による、相互扶助を目的としたウェブサイト:
矢野啓介さんの「プロジェクトX0213」http://x0213.org/内にあるJIS X 0213 Wikiのアイヌ語の項目より
アイヌ語 - JIS X 0213 Wiki

・また先程紹介した矢野さんの個人ブログでは韓国語の発音のかな表記での用途や
小書き文字のちょっとしたお遊び的使い方にも触れた記述があったので挙げておきます。
JIS X 0213の小書きの仮名 - yanok.net


この記事をはてなブックマークに追加

接尾語変換の拡張(3) 接辞わびさび 属性またぎ

2017-09-29 | 接頭語・接尾語の変換
接頭語・接尾語変換で処理できる語の中には、その定義通り属性ハ(接辞まわり)での変換に加えて、語句によっては属性イ(名詞)や属性ロ(様態)でも変換入力を兼任して受け付けるタイプのものも数多く見られます。
例えば [後継機/好景気] などはどちらも属性ハで変換できます(接尾語・--機と接頭語・好--で両方接辞がらみ)。しかし属性ハでの変換候補順位は後継機の方が上で好景気の方はそれより下位に提示されます。
これは、好景気の方は「景気が好調だ」という様態の叙述概念をもっているためで用言を担当する属性ロに比較的役割が通ずるものがあるためです。
他方、後継機のほうは「後継」という代替わり的・タイムシフト的な語意を持つ言葉ゆえに第三の属性・属性ハにより適合するのでこちらのほうが属性ハ内での順位は上位にくるというカラクリです。
ただ、後継機の接尾語部分の「機」が意味するように実機が物理的に存在して主語・名詞的に文章を構成する場面もあるのでこちらもまた名詞属性・属性イを兼任するということになります。

このように接頭語・接尾語の変換は言葉によっては他の属性とのカラミもあって多少複雑な構図になりますが、これのおかげで変換意図・ニュアンスの違う複数候補を使い分けることができます。
そのような例をまずはドカッとあげてみて、つづけて個別例の解説を添えてみたいと思います。

<属性またぎのある接辞パーツのついた語句の例>
多店舗/他店舗 水戸さん/水戸産 全盛期/前世期 質問厨/質問中 おためし住み/おためし済 柳腰/柳越し
親父衆/オヤジ臭 優先券/優先権 メンバー票/メンバー表 英国麺/英国面 気合酒/気合避け ビジネス大賞/ビジネス対象

・多店舗は店舗が多いという状態描写なので属性ロ、他店舗は自他概念の接頭語なので属性ハ
・水戸さんは対象となる人物が提示されているので名詞属性イ、水戸産は水戸で生産・収穫された産物という性質描写なので属性ロ、属性ハ内では人称の「さん」は敬遠されて「産」を上位にもってくる
・全盛期はこのかたまり全体で「最も盛んな時期」をあらわす様態概念なので属性ロ、前世期は前後経時概念の接頭語「前」なので属性ハ
・質問厨は「しつこく質問してくる迷惑な奴」の呼称であり人物をあらわすから名詞属性イ、質問中は「~をしている最中」の接尾語「中」を伴った基本接辞なので属性ハ/※属性ロにおいても上位の語(様態)
・おためし住みは複合動詞とみなせるので属性ロ、おためし済・「済」はより生産力の高い接尾辞なので属性ハ、なお住み・済は濁った「ずみ」で対応することに留意
・柳腰は「折れそうで折れにくいしなやかな物腰」をあらわす様態なので属性ロ、柳越しは「-越し」という生産力の高い接尾辞なので属性ハ
・親父衆は「衆」が一集団としての対象であるから名詞属性イ、オヤジ臭は臭っているという状態描写なので属性ロ、なお後続の接辞によって親父とオヤジで書き分けるところまでできることが望ましい
・優先券は物理的なチケットなので属性イ、優先権は抽象的で生産力のある「-権」なので属性ハ
・メンバー票は個別的な可算的事物なため属性イ、メンバー表は集約された情報事物なため属性ハ
・英国麺は何かの麺料理をあらわすので名詞属性イ、英国面は視座視点の概念なため属性ハ
・気合酒は一事物としての酒であるから名詞属性イ、気合避けは動作・テクニックの名称であるから属性ロ、なお酒・避けは濁った「ざけ」で対応
・ビジネス大賞は何かの一プライズであるから名詞属性イ、ビジネス対象は取り組み相手、はたらきかけであるから性質属性ロ、あわせてもちろん指示概念的でもあるから属性ハでも上位にくる

これらは個別例の所属属性いかんに加えて接頭語・接尾語の第一義的ルールがありますから総じて属性ハを持つものでありますが、同じ属性ハ内での変換候補順位は語の用例の検討具合であったり、より抽象的・構造的な「属性ハらしさ」をどれだけ伴っているかの判断によって変わってくるので一概にこうだとは言えません。
また、当初の順位設定にも拘らずその後の学習や単語登録の影響によって候補順位が変動することも考えられます。
ただ呼称の「さん」が属性ハでの上位順位を敬遠するというのがあったり、より生産力の高い辞、抽象的文法的なバリエーションの豊富な生産的接続をもつものが「より属性ハらしい」などの一定の傾向があるということだけは一端として言えるかと思います。


…ここまでざっと使い分けの例について解説していきましたが、このほかにも実際のインターフェイスの段になってからもまだ考慮すべき点があります。
それは…長文中に別の名詞チャンクや様態チャンクがある場合、選択フォーカスが思惑と違う場合があるということです(チャンクはかたまり・断片という意味で使っています)。
具体的にいうと
(例)じどうでゆうせんけんをあたえるけーす
という入力文があったとして、ユーザーは[優先券/優先権]の区別を選択したいと意図していながら、その前の文要素
[児童で/自動で]のようにそれ以前あるいは以後の部分がフォーカスされて変換に面喰ってしまうケースが考えられることです。
この例文が果たして適当であるかどうかは自信が持てませんが、それは置いておいて変換対象部分を適切に抽出できるかどうかを見極めるには変換のプロセス全体の流れをもっと煮詰めて考察していく必要性があるようです。
ステップ的なのを重視して出てくる順番順に変換対象部分をフォーカスしていくのか、それともユーザーにとっての選択重要度順に変換対象部分を提示していくのか、いろいろな組み立てが考えられそうなのですが、これは思ったより難しそうな問題なので今後の課題として残していきたいかと思います。

とりあえずの結論として、接尾語変換は単体で機能させることは事実上難しく、言葉というものは語彙範疇・意味属性というものが常にからんでくるので接辞がらみの語のテリトリーはココ!…というように単純に分離はできないということがわかりました。
接頭語接尾語の拡張というよりも接辞以前の問題との整合性をとるために、より柔軟な位置づけ機能づけを必要とする、そのために局所的ではない広い視点で変換三属性を再構築する…という意味でこの記事を締めたいと思います。

この記事をはてなブックマークに追加