EP2006836(JP)
"[0005] In addition, in any of the conventional technologies, an external noise is mixed in the utterance at the stage of registration, or a registered utterance model becomes unreliable when the speaker makes the utterance without repeatability despite the user's intent (e.g. a voice flips into falsetto or quavers). Thus, a final speaker recognition accuracy falls to the extent that it cannot be ignored. Alternatively, in order to avoid this, a registration operation is required to be performed many times, which causes such a problem that the registration itself becomes hard in practice."
加えて、いずれの従来技術においても、登録の段階で、発話に外部の雑音が混入したり、話者が意図に反して再現性なく発話(例えば声が裏返ったり震えたり)してしまった際に、登録された発話モデルが信頼性のないものとなり、最終的な話者認識の精度も無視し得ない程に落ちてしまう。或いは、これを回避するために登録動作において多数回のやり直しが求められたることで、登録自体が実践的に困難となるという問題点もある。
最新の画像[もっと見る]
-
バズリクソンズA2:第18週 2日前
-
バズリクソンズA2:第17週 1週間前
-
バズリクソンズA2:第16週 3週間前
-
DAZN(ダゾーン):メール配信停止ボタンくらい付けとけ 3週間前
-
DAZN(ダゾーン):メール配信停止ボタンくらい付けとけ 3週間前
-
バズリクソンズA2:第15週 4週間前
-
バズリクソンズA2:第14週 1ヶ月前
-
Google Patents Advanced Searchで全部表示される図面の表示を隠す 1ヶ月前
-
召合せ框(めしあわせかまち) 1ヶ月前
-
バズリクソンズA2:第13週 1ヶ月前
※コメント投稿者のブログIDはブログ作成者のみに通知されます