ピグマリオン計画 ― UTAU用テキスト読み込みプラグイン(名称未定)配布所

歌声合成ツール「UTAU」を活用したテキスト読み上げ(HANASU)を補助する第三者プラグインを作ろうとしています。

連続音対応

2009-11-28 02:59:33 | 日記
移転先はここになりそうです。
  http://monopole.jimdo.com/
また今後ともどうぞよろしくお願いいたします。

ニコ動とかを見ているとやっぱりHANASUはそろそろ連続音の時代のようなので
当方のテキスト読み上げプラグインも
そろそろ「連続音対応しました」って言って第2回仮公開版を出そうかなと思っています。
漢字仮名交じり文を読ませることについてはひとまず保留で…。


漢字仮名交じり文を読ませる場合の作業の流れは、

 1 漢字仮名交じり文を読み込ませる
  ↓
 2 ひらがな、分かち書き、アクセント記号付きに変換される
  (現仮公開verのものと同じような)
  ↓
 3 適当に修正または表現記号を追加などして保存
  ↓
 4 UTAU上に読み込まれる

とかいうことに結局なるのかなあ、と。

辞書など

2009-11-12 21:57:23 | 日記
goo辞書モバイルは、どうやらPCからのアクセスをはじくようになってしまったようですね。
わからない語があったときに参照する参照先として設定していたのですけど、これからは
モバイルじゃない方のgoo辞書にしようかな…。


ちなみに、昨夜はアクセスするとリダイレクトがループしてしまっていたようです。

「ピグマリオン計画」はリダイレクトのループを検出できないアホの子なので、見事にハマって、
延々と無限ループした挙句に落ちてしまいました。


別の話ですが、ブログの移転を検討しています。
ここは「ファイルのダウンロード」が置けないとか掲示板が作れないとかいう不便があるので…。

今のところは「Jimdo」が良さそうだと思っているのですが、次のverの公開までには。

紛らわしい付属語「-ない」の識別

2009-10-29 01:05:27 | 日記
紛らわしい付属語の識別… ということなのですが。

どうしようかと思っていたのですが、まあやっぱ「直前の語の活用形によって区別する」
というのが普通ですよね多分…。

というわけで、アクセント辞書で今までは「-ない」としてしか項目を立てられなかったのを、
「-ない;未然形-」のように接続の仕方を明示して立てることもできるようにしました。

これによって、紛らわしい付属語の「-ない」が区別できるようになりました。



これを踏まえて、それではまた付属語のアクセント辞書を充実させる作業に戻ります。

※「白くない」の「白く」の部分が訛っているのは、これはまた別の課題です。
※声はアリカさん。

「波音リツ」、さっそく好きになりました。

2009-10-19 02:42:51 | 日記
この週末は残念ながら持ち帰りの仕事で、ひたすら動画の編集をしていました。
jamバンドエディションのMM2で、社長のスピーチとか編集してましたよw

エンコ待ちの時間はパソコンが使えないし出かけるわけにもいかないので
家にたまっていた未読の本をずいぶん消化してしまいました。


「ピグマリオン計画」も進めていました。

最近の進捗はというと、下の2つを見比べていただくのが一番早いと思います。

10/19 日本国憲法前文(波音リツ)


9/24 日本国憲法前文(デフォ子さん)


「ー」や「っ」などにアクセントがつかないようになった(つけると前の音につけたとみなされる)とか、
さまざまなタイプの付属語のアクセントに対応してアクセント辞書が書けるようになってきたとか。
あとそれを受けてシステム辞書にいろんな付属語を登録しています。


次の課題は、zoomeにも書いていますが、紛らわしい付属語の判別です。

「食べようとする」の「よう」と「食べるようにする」の「よう」とか。
「わたし食べるの」の「の」と「食べるのはわたしだ」の「の」と「わたしの食べる物」の「の」とか。

10/19の日本国憲法前文で「諸国民との」や「ないようにする」が訛っているのは、
まさに上記の付属語の識別ができないせいです。


ところで。

我が家にも「波音リツ」をお迎えしたので、いつものように北原白秋の「五十音」を読み上げてもらいました。

【ニコニコ動画】【UTAU】波音リツに喋らせてみた

「りっちゃん」、歌に使用してる動画を見るとパワー不足というコメントも目立つようですけど、
HANASUに使用するとむしろ素直で自然な感じになって、かなり使いやすいのではないでしょうか。
添付されてる原音設定もだいぶ作りこまれているようで、当座いじる必要がなさそうだし。
お気に入りになりそうです。

まだだいぶ訛るけど

2009-09-24 00:47:42 | 日記

漢字仮名交じりの文章が読めるようになりました(声:デフォ子さん)。

以下のような文章を与えると、自動で漢字をひらがなに直し、文節に区切って、アクセントを調べて、UTAUに読み込んでくれます。

まだだいぶ訛りがひどいですが(主に語尾、とくに語尾が長い場合…)、そこは今後の課題ですね。


#KANJI

日本国民は、正当に選挙された国会における代表者を通じて行動し、われらとわれらの子孫のために、諸国民との協和による成果と、わが国全土にわたって自由のもたらす恵沢を確保し、政府の行為によって再び戦争の惨禍が起ることのないようにすることを決意し、ここに主権が国民に存することを宣言し、この憲法を確定する。そもそも国政は、国民の厳粛な信託によるものてあって、その権威は国民に由来し、その権力は国民の代表者がこれを行使し、その福利は国民がこれを享受する。これは人類普遍の原理であり、この憲法は、かかる原理に基くものである。われらは、これに反する一切の憲法、法令及び詔勅を排除する。