いくやの斬鉄日記

オープンソースからハイスクールフリート、The Beatlesまで何でもありの自称エンターテインメント日記。

Anthyの誤変換潰しその2

2007年11月02日 23時18分59秒 | 言語入力機構
というわけで続き

doc/TESTINGにテストの方法が書いてあるので、このとおりにやってみます。
まずは変更前に./anthy --allを実行し、結果を保存しておきます。
次にdepgraph/av.depwordを
@副詞14のあと "" Sy@ @だ @です @だろう @ね @なの @だけ
と変更して、makeし、./anthy -allを実行し、ログを取り、差分を取ってみても変更はありませんでした。悪影響はなさそうです。
test.txtに「*もうすこしだけさき」を追加して実行してみると、
 anthy-9100d Fri Nov 2 23:08:43 2007
 280:(もうすこしだけさき)
 |もうすこしだ|けさき
 もうすこしだ(もう少しだ:(,1000,Ne,6553)20,069 ,もうすこしだ:(N,0,-)2 ,モウスコシダ:(N,0,-)1 ,):
 けさき(毛先:(1,1000,N,72089)198,245 ,けさき:(N,0,-)2 ,ケサキ:(N,0,-)1 ,):
変わってません。しょぼん。
「もう少しだけ」にすると
 anthy-9100d Fri Nov 2 23:10:26 2007
 280:(もうすこしだけ)
 |もうすこしだけ
 もうすこしだけ(もう少しだけ:(,1000,Ny,655)2,006 ,もうすこしだけ:(N,0,-)2 ,モウスコシダケ:(N,0,-)1 ,):
やっぱり変わっていません。変更するところが間違っているのでしょうか。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Anthyの誤変換潰しその1

2007年11月02日 22時03分28秒 | 言語入力機構
Anthy 9100dで「もうすこしだけさき」を変換すると「もう少しだ毛先」になります。
試しにこの誤変換を潰してみたいと思います。

doc/MISCにあるデバッグの方法を実行してみました。
 ikuya@kiri:~$ sh ./test
 (2 ((UL) "もうすこしだけさき" -1 -1) cursor)
 (3 ((UL RV) "もう少しだ" 0 3) ((UL) "毛先" 0 3))
 |もうすこしだ|けさき
 もうすこしだ(もう少しだ:(,1000,Ne,6553)20,069 ,もうすこしだ:(N,0,-)2 ,モウスコシダ:(N,0,-)1 ,):
 けさき(毛先:(1,1000,N,32153)89,426 ,けさき:(N,0,-)2 ,ケサキ:(N,0,-)1 ,):
ふむ。
「もうすこしだけ」でやってみましょう。
 ikuya@kiri:~$ sh ./test
 (2 ((UL) "もうすこしだけ" -1 -1) cursor)
 (3 ((UL RV) "もう少しだけ" 0 3))
 |もうすこしだけ
 もうすこしだけ(もう少しだけ:(,1000,Ny,655)2,006 ,もうすこしだけ:(N,0,-)2 ,モウスコシダケ:(N,0,-)1 ,):
スコアが低すぎますね。
品詞を調べてみると「少し」は副詞、「だけ」は副助詞だそうです。
副詞の接続はdepgraph/av.depwordに書いてありますが、ここには副詞と副助詞の接続はなさそうです。
それ以前に、alt-cannadicに「だけ」が副助詞として登録されてあるのか調べてみると、
 ぐれい #JN*10 ダグレイ
 だけつ #T30*200 妥結
なさそうです。
mkworddic以下にもなさそうなので、調べてみると副助詞という品詞はAnthyでは使えないようです。
となると、depgraph/av.depwordに決め打ちで書くしかないのでしょうか。

間違っているところも多々あるかと思いますので、もしお気づきの点がありましたらご指摘ください。
コメント (3)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする