近年、IOT化の掛け声とともに、様々な分野で音声入力が普及を見せております。家電メーカー等でも、遠隔地にあってもスマホを利用した音声入力で自宅の家電を操作できる技術等の開発に凌ぎを削っているようです。しかしながら、この音声入力方式、機器操作の主流となるのか、と申しますと、そうでもないかもしれません。その理由は、その便利さとは裏腹に、疑問やリスクが潜んでいるように思えるからです。
音声入力の第一のメリットは、入力速度の速さです。今では、PCのキーボードよりも音声入力を愛好するライターの方も登場しているとのことですが、口語と文語とでは、文章表現に相当の違いがあります。後者の場合には、全体の論理構成や前後の文脈を整える必要から、しばしば後からの修正、加筆、文章の切貼りなどの作業が行われます。音声入力ですと、入力後にこれらの作業を正確に行うことが難しく、例えば、本記事の‘第一のメリットは’を‘最大のメリット’に修正しようとすれば、“入力終了”と音声で指令して一旦入力作業を止め、“修正開始”と発声した上で、“第二段落の第一節目の‘第一’を‘最大’に変更せよ”と口頭で命じなければなりません。トータルでは、キーボード入力の方が時間的にも簡便さにおいても優れているかもしれないのです。仮に、音声入力の方が便利なケースがあるとすれば、それは、試行錯誤を伴う創造的な分野ではなく、最初から出来上がっている文章を音声で読んでデジタル化するといった事務的、あるいは、機械的な作業となりましょう(もっとも、それでも漢字の誤変換の問題も生じる…)。
文書作成には音声入力が不向きとしますと、この方法が最も効力を発揮しそうな場面は、家電や自動車等の機器操作です。しかしながら、ここにも、幾つかの問題を指摘することができます。
特に問題となるのは、音声収集の持つ公開性と広域性です。例えば、社内にあって自宅の家電を操作しようとして、“手洗いモードで洗濯開始!”などと突然しゃべろうものなら、オフィス内で爆笑が起きるかもしれません。また、スマートフォンでの音声入力中に、周囲の声を拾ってしまい、命じられた機器が全く別の作業を始めてしまうかもしれません。例えば、ある人が自宅のエアコンの音声入力操作中に、隣の人が、偶然、両人が現在居る部屋の室温について‘もっと温度を下げて欲しい’と言ったといたしますと、音声入力式のエアコンは隣の人の発言の方に反応してしまう可能性もあります。こうした事例は大事には至りませんが、自動車の運転や重機の操作等にも導入されますと、運転手や操作者の独り言や助手席に座っている人の声に反応して事故が起きてしまうといったリスクがないわけではありません。同乗した人物に悪意がある場合には、大声による音声操作によって事故が故意に起こされる可能性も指摘できるでしょう。
こうした問題を解決するためには、声紋による本人確認技術の確立や入力ミスを想定した安全装置の開発などを急ぐ必要がありますが、それでも、発音や表現に多様性があり、文法が複雑な言語ほど、AIによる意味理解の精度が低下します。この点、日本語は、母音が多く、発音において明瞭な点では音声入力向きですが、漢字、ひらがな、カタカナの使い分けがある上に、言葉に細かなニュアンスの違いがある言語ですので、音声入力には不向きにも思えます。あるいは、音声入力社会の到来が言語の単純化を要求するとしますと、音声入力方式が文化を劣化させるという重大な問題も持ち上がります。
かくして音声入力方式には課題が山積しているわけですが、スマートフォンの普及以降の産業の動向を見ておりますと、情報通信至上主義者の人々が描いている特定の未来モデルに縛られ過ぎているように思えます。全世界の諸国が同一の方向に向かって脇目も振らずにこのモデルの実現へと邁進する姿は、どこか常軌を逸しております(ソフトな全体主義?)。‘敷かれたレール’を走らされるのではなく、ここは一先ずは立ち止まる必要があるのではないでしょうか。未来モデルは唯一絶対でも、一つでもなく、人類により幸せをもたらす道が他にもあり得るのですから、狭い道に追い込まれることなく、柔軟な発想を以って広く視野を開いてゆくべきではないかと思うのです。
よろしければ、クリックをお願い申し上げます。
にほんブログ村
音声入力の第一のメリットは、入力速度の速さです。今では、PCのキーボードよりも音声入力を愛好するライターの方も登場しているとのことですが、口語と文語とでは、文章表現に相当の違いがあります。後者の場合には、全体の論理構成や前後の文脈を整える必要から、しばしば後からの修正、加筆、文章の切貼りなどの作業が行われます。音声入力ですと、入力後にこれらの作業を正確に行うことが難しく、例えば、本記事の‘第一のメリットは’を‘最大のメリット’に修正しようとすれば、“入力終了”と音声で指令して一旦入力作業を止め、“修正開始”と発声した上で、“第二段落の第一節目の‘第一’を‘最大’に変更せよ”と口頭で命じなければなりません。トータルでは、キーボード入力の方が時間的にも簡便さにおいても優れているかもしれないのです。仮に、音声入力の方が便利なケースがあるとすれば、それは、試行錯誤を伴う創造的な分野ではなく、最初から出来上がっている文章を音声で読んでデジタル化するといった事務的、あるいは、機械的な作業となりましょう(もっとも、それでも漢字の誤変換の問題も生じる…)。
文書作成には音声入力が不向きとしますと、この方法が最も効力を発揮しそうな場面は、家電や自動車等の機器操作です。しかしながら、ここにも、幾つかの問題を指摘することができます。
特に問題となるのは、音声収集の持つ公開性と広域性です。例えば、社内にあって自宅の家電を操作しようとして、“手洗いモードで洗濯開始!”などと突然しゃべろうものなら、オフィス内で爆笑が起きるかもしれません。また、スマートフォンでの音声入力中に、周囲の声を拾ってしまい、命じられた機器が全く別の作業を始めてしまうかもしれません。例えば、ある人が自宅のエアコンの音声入力操作中に、隣の人が、偶然、両人が現在居る部屋の室温について‘もっと温度を下げて欲しい’と言ったといたしますと、音声入力式のエアコンは隣の人の発言の方に反応してしまう可能性もあります。こうした事例は大事には至りませんが、自動車の運転や重機の操作等にも導入されますと、運転手や操作者の独り言や助手席に座っている人の声に反応して事故が起きてしまうといったリスクがないわけではありません。同乗した人物に悪意がある場合には、大声による音声操作によって事故が故意に起こされる可能性も指摘できるでしょう。
こうした問題を解決するためには、声紋による本人確認技術の確立や入力ミスを想定した安全装置の開発などを急ぐ必要がありますが、それでも、発音や表現に多様性があり、文法が複雑な言語ほど、AIによる意味理解の精度が低下します。この点、日本語は、母音が多く、発音において明瞭な点では音声入力向きですが、漢字、ひらがな、カタカナの使い分けがある上に、言葉に細かなニュアンスの違いがある言語ですので、音声入力には不向きにも思えます。あるいは、音声入力社会の到来が言語の単純化を要求するとしますと、音声入力方式が文化を劣化させるという重大な問題も持ち上がります。
かくして音声入力方式には課題が山積しているわけですが、スマートフォンの普及以降の産業の動向を見ておりますと、情報通信至上主義者の人々が描いている特定の未来モデルに縛られ過ぎているように思えます。全世界の諸国が同一の方向に向かって脇目も振らずにこのモデルの実現へと邁進する姿は、どこか常軌を逸しております(ソフトな全体主義?)。‘敷かれたレール’を走らされるのではなく、ここは一先ずは立ち止まる必要があるのではないでしょうか。未来モデルは唯一絶対でも、一つでもなく、人類により幸せをもたらす道が他にもあり得るのですから、狭い道に追い込まれることなく、柔軟な発想を以って広く視野を開いてゆくべきではないかと思うのです。
よろしければ、クリックをお願い申し上げます。
にほんブログ村