世界の中心で、哀をさけぶ

このブログは、AISAKEB.comに移転しました!

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

Siriに存在意義を聞いてみる ~音声認識の未来

2013-02-17 20:51:00 | Essay
 先日の記事で、斬新な文字入力ソフト「Fleksy」について調べていたら、
最近、いくらか盛り下がってきてしまった感がある「音声認識」の行く末が気になってきた。



 今から10年以上前、IBMから「ViaVoice」という音声認識を用いた文字入力ソフトが出ていたのをご存知だろうか。
当時学生だった僕は、学割パックでこれを買ったのを覚えている。ViaVoiceを買う学生・・今思うといろいろ切ないものがある。
 パッケージの中にはソフトと共に、マイク付きのヘッドセットが同梱されていて、当時としてはなかなかの音声認識精度を誇っていた。
ただし、使う前には、まずキャリブレーション作業が必要だった。PCの画面に提示された文章を延々と1時間ほど朗読させられる。
端から見ると実に奇怪な作業で、部屋でブツブツ言っている僕を案じて、親がそっとのぞきに来たくらいである。

 時は移り、2013年。
Siriを始め、音声での機器操作、文字入力はだいぶ世間的な認知を得た。
ViaVoiceの時代と大きく変わったのは、音声認識ソフトがオンライン上のデータベースを参照・更新するようになった事だろう。
クラウドの威力はものすごく、当時のパソコン上だけで動く音声認識エンジンとは雲泥の差を感じる。

今、この文章を書いているMacのOS X Mountain Lionには標準で音声認識機能がついている。



ためしに先ほどの文章を5行ばかり、音声入力で再度書いてみよう。


時は移り、 2013年。
尻を始め、音声での機器操作、文字入力がだいぶ世間的な人気を得た。
ViaVoiceの時代と大きく変わったのは、音声認識ソフトがオンライン上のデータベースを参照・更新するようになった事だ。
クラウドの威力はものすごく、当時のパソコン上だけで動く音声認識エンジンとは雲泥の差を感じる。

↑(以上、音声入力ママ)

ところどころ誤認識はあるものの(尻はねーよ・・)、キャリブレーションなし、端末横の小さなマイクでここまでできるのは、
凄い進歩だと思う。事実、SiriやGoogle検索のような短文の認識なら完全に実用レベルに達している。

 だが、音声入力は残念ながら入力の”主役”とはなれない運命を背負っているはずだ。
会社、喫茶店で人々が音声入力で文章を書く姿はどうやっても想像できない。(実現したらカオスだ)
自宅で一人でいるときや、車の運転中など、限られた条件の中での手段に限られるのだろう。

 また、10年前、そして認識精度の上がった今も、音声入力を使っていて感じることは、
文を頭のなかで構成する→キーボードでタイプという繰り返しのリズム感、レイテンシがまさに絶妙ということだ。
キーを叩く僅かな時間、思考と出力の間にワンクッションの遅延があることで、
頭の中で次の文章を、ほんの一歩先に編み上げる事ができる。

 音声入力はそのわずかなタイムラグが無いせいで、ものすごく難しいものとなる。
発声しながら文章を組み立てていく作業は、実に難易度が高いと思う。
試しに実際に発声しながら、リアルタイムで新たに文章を組み立ててみれば、この感じがわかって頂けると思う。

もしかしたら、トレーニングでこの能力は何とかなるのかもしれない。
そのうち練習してみたいと思う。


最後にSiriに表題の件、聞いてみた。


健気なSiri
この記事についてブログを書く
« シムシティ最新版、クローズ... | トップ | らくらくスマートフォン、フ... »
最近の画像もっと見る

Essay」カテゴリの最新記事

関連するみんなの記事