今日は(ってもう昨日か)は
oxy氏がいらしたので、見つけた
Anthyの誤変換やらいろいろなことについてほぼ一日中お話してました。
まず簡単に「誤変換」の紹介を。
私の勝手な分類なので、正確ではないかもしれないという前置きは必要ですが。。
誤変換は大きく2つに分類されます。
ひとつは辞書に登録されていないことに起きる誤変換です。
例えば、現行のAnthy(cannadicも)には「如実」という単語が登録されていないので、必ず誤変換をしてしまいます。
もうひとつは文節区切りのミスです。
例えば、「ふせるいみないか」が「布施類見ないか」になったりします。期待される変換は「伏せる意味ないか」ですね。
人間の目で見たら「布施」に「類」は付かないわけですが、Anthyから見れば「名詞+類」なので、「貝類」とかと一緒なのです。
なので、例えば(ホントに例えで、解決方法はいくつかあります)「布施」よりも「伏せる」のほうを優先して候補を出す、ということをして誤変換を解消するのですな。
話題になったことはいろいろありますが、そのうちのひとつは「未分類」とか「無問題」みたいに打ち消しの接頭語+名詞の変換が弱いよね、ということです。
この解決方法も2つあって、ひとつは「未分類」などを1語で単語登録すること、ひとつは打ち消しの接頭語+名詞という変換をすること。
前者は単語を登録する必要があるので手間がかかりますが、後者は手間はかからないものの「無パソコン」とか「未冷蔵庫」みたいな誤変換を呼ぶ恐れがあるのであまりよろしくないよね、ということになって「打ち消しの接頭語+名詞」という組合せ(勝つよ靴買うもの←また見つけた。かつよく使うもの)はあまり多くないので登録してしまってもいいか、ということでいちおう落ち着きました。
こういうのすごく面白いと個人的には思うのですが、やっぱり煩わしく思うのが普通なのですかね…?
面白いと思った人はOpenSouce Software使ってみるといいかもしれませんね。楽しさにあふれていますよ。本当に。
またちくちくと誤変換を貯めようと思いますが、連文節変換派の弧軍奮闘ハイツまで続くんでしょう…(←弧軍奮闘はいつまで続くんでしょう)