林間教育通信(「東大式個別ゼミ」改め「シリウス英語個別塾」)

私立中高一貫校生徒を対象とする英語個別指導塾。小田急線の東林間駅(相模大野と中央林間の隣駅)から徒歩3分。

誰にでも勧めることのできる音声認識ソフトAmiVoice SP2の登場

2012年12月05日 | 文房具と読書
AmiVoice SP USBマイク付
クリエーター情報なし
エムシーツー


AmiVoice SP の新しいバージョン AmiVoice SP2がついに、2012年11月30日に発売されました。私は、このソフトのモニター(USB マイクロフォン附属タイプ)になることができましたので、早速実験してみました。もちろんこの文章も、 AmiVoice SP2を使って書いています。

一) ヘッドフォン・マイクが素晴らしい。

私は AmiVoice Es 、 AmiVoice SP とこの音声認識ソフトのシリーズを最初から使い続けています。うち、マイクロフォンつきを購入したのは初回の AmiVoice Es の時だけですが、この時のマイクはやや質の低いものでした。しかし、今回の SP2の USB マイクロフォンは、なかなか良い感じですね。(1)音声認識の際にとくに問題になるのは、口から5センチくらいまでの距離を保ち、かつ息が直接にかからないような位置にマイクロフォンが配置されることです。この点、このヘッドフォン・ USBマイクロフォンは安定感があります。(2)ヘッドフォンマイクロフォンの最大の問題は、頭が締めつけられる事です。しかし、このヘッドフォン・マイクロフォンについてには、不快感がほとんど感じられません。ささいなことのように思われるかもしれませんが、現在の音声認識にとってはきわめて重要なことです。(3)スカイプなどへの配慮も行き届いている。

二) 認識率が旧バージョンよりも格段に良くなっている。

AmiVoice Es から AmiVoice SP へのバージョンアップの時には、認識率の向上はさほど感じられませんでした。しかし、今回の SP から SP2へのバージョンアップは違います。びっくりする程の性能アップです。

従来の音声認識も大変便利なものではありました。しかし、私のような音声認識ファンでも、不愉快な気持ちなる時もありました。けれども今回の新製品は、音声認識が実に快適です。多くのパソコンユーザーに文句無しに薦められると宣言して良いでしょう。

三)やや旧式のパソコンや、安価なマイクロでも、十分実用的に使える。

ちょっと気になるのが、パワーの落ちるパソコンで使えるのか、あるいは、附属の USBマイクがどうしても必要なのか、と言うことです。そこで試しに4年くらい前に購入した Windows XP のパソコンにもインストールしてみました。結論的にいうと、十分に使えます。

500円未満の安いマイクではどうなのか。まずは、マイクジャックに差し込むスタイルで試しました。が、残念ながら誤認識が頻発で駄目でした。そこで、そのマイクをUSBオーディオ変換アダプタを通して音声認識してみると、今度は非常によく認識してくれました。

結論的に言えば、パソコンは多少パワー不足でも大丈夫、安価なマイクロフォンも USB 接続であれば問題なし、です。ただし、音声認識の初心者であれば、ヘッドフォン・マイクロフォンつきの AmiVoice SP2を購入する事を勧めます。

四)「を」「に」「は」といった助詞や”」”を簡単に入力できる。

音声認識ソフトのちょっと厄介な点は、「を」のような助詞が抜け落ち易いことです。しかし、 従来の製品では、「を」だけを音声認識で付け加えようとしても、なかなか認識してくれませんでした。また、"「"は認識してくれても、"」"はなかなか認識してくれませんでした。しかし、今回の新製品ではそれらの問題をすべてクリアーしているようです。

以上で初日の簡単なレポートを終えたいと思います。今後は音声認識の実験結果について、いくつか書き加えていきたいと思います。例えば、本を読んでそれを音読した時にどのくらいの精度で認識してくれるのか、あるいは、 IC レコーダーを使った音声ファイルについてどのぐらいの認識率があるのかといったテーマです。

追加
五)ICレコーダーによる音声ファイルもかなり使えそう。

待ちきれなくなって深夜実験してみた。以下は、旧式パソコンに旧式ICレコーダー(七年前発売のSony ICレコーダー)という組み合わせで音声ファイル(WAVファイル)の音声認識を試みたものです。修正は無しで、そのまま載せてみました。よどみなく文が出てくるときにはかなり便利だということがわかります。(言いよどんでいるときには、音声認識率は悪くなる)。


音声認識の二つの可能性としては、0[←不要]本を読んだときに
その本の内容をメモすることが可能になるということです。
つまり、
重要な箇所について本を朗読し、
その音読音声によっては、
文字化はテキスト化することはできるならば、
適当な
%えー%ほんのノートといったものができるはずだから。
もちろんその他にも、写真にとって
島とか[←しまうとか]、
いろんな人[←やり方]とあろうかと思いますが、音声認識も一つのやり方として
参考になるはずです。



以上


最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。