東芝は、音声や映像に含まれる言葉や人物を捉えてその意図や状況を把握し、人にわかりやすく伝えるというクラウドサービスの提供を開始する。サービスの名称は「RECAIUS(リカイアス)」である。
新サービスは、人がICT(情報通信技術)を意識して利用するのではなく、ICTが人の意図や状況に合わせて適切に動作するための仕組みを提供するという。人が持つ「見る、聴く、話す」能力をICTで補完することで、言語や表現などの言葉の違い、音声・映像・文字といった形態の違いを超えて、多くの人が安心・安全・快適に過ごせる社会の実現を目指すとする。
新サービスは、同社が培ってきた音声認識、音声合成、顔・人物画像認識、知識処理技術を融合して、これらの能力を最大限引き出せるように、必要な知識を日々進化させることが可能なクラウド上に構成したという。様々な言葉の表現や人の動き・態度から意図や状況を把握して、要約、翻訳、音声対話、音声合成を利用して、人にわかりやすく伝えるとする(図1)。例えば、カメラに写った人に合わせて情報を提示する案内システムや、音声記録をテキスト化して重要な発言だけをチームで共有するなど、幅広い業務や用途で活用できるとしている(図2)。
■第1弾を10月から開始
RECAIUSの第1弾として、2つのサービスの営業活動を2015年7月2日から始めた。サービスは2015年10月から始める。2つのサービスは「RECAIUS 音訳エディタ(DaisyRings=デイジーリングス)」と「RECAIUS 音声書き起こしエディタ」。
前者のRECAIUS 音訳エディタ(DaisyRings)は、視覚障がいやディスレクシア(識字障がい)により文字を読むことが困難な人のための音訳コンテンツを容易に作成するためのクラウドサービスである。ウェブブラウザ上で、テキストをアップロードして音訳でき、編集結果をDAISY(Digital Accessible Information System)形式のファイルでダウンロードできる。音声合成の読みやアクセントを容易に修正できるという。
図書館や学校、行政機関での利用のほか、一般企業でも製品マニュアルなどドキュメントの音訳に利用できるとする。同社によれば、平成28年(2016年)4月施行の「障害者差別解消法」では障がい者差別解消のための合理的配慮が、行政機関では義務、一般企業などでも努力義務として求められている。RECAIUS 音訳エディタは、全国の大学や障害者団体などで実証実験を実施し、使い勝手を高めてきたという。
後者のRECAIUS 音声書き起こしエディタは、講演や会議などの録音データをウェブブラウザ上で人が聴いて書き起こす作業を支援するサービス。アップロードした音声データを再生しながらテキスト入力する際、テキスト未入力の箇所を特定して自動的に音声を再生したり、音声認識によるテキスト入力の候補を提示したり、話者の切り替えを推定したりすることで、音声をチェックしながら書き起こしを効率よく行えるという。このサービスに関しても実証実験を実施し、使い勝手を高めてきたとする。
東芝は、自治体・図書館向け音訳支援サービス、金融業向け対話サービス、フィールド作業支援など様々なサービスへの適用に向けてRECAIUSを提案していく。今後、次のようなサービスを提供予定という。「RECAIUS 音声ビューア」(音声認識技術により、長期間・長時間の音声データの可視化(テキスト化)機能を提供)、「RECAIUS 音声クリエータ」(多様な感情表現をもつ音声合成機能を提供。日本語以外に米語、中国語、韓国語など11言語に対応する予定)、「RECAIUS音声対話」(用途に応じて構築する対話知識に基づいて、曖昧な問いかけにも応える音声対話機能を提供)、「RECAIUS 同時通訳」(話す先から逐次訳せる同時通訳機能を提供。日英・英日、日中・中日に対応予定)、「RECAIUS 人物ファインダ」(客層や混雑度などの状況把握や登録した人物の検出機能などを提供)などである。

図1 RECAIUSの基盤技術

図2 RECAIUSの利用イメージ
[日経テクノロジーオンライン 2015年7月2日掲載]