「外国人とコミュニケーションを取りたい・・・英語とか覚えずに」
こうこう考えて日々生活していたのは、日本語もおぼつかないのに(敬語とか難しいですよね)、外国語なんて話せるわけ無いじゃん!とか考えていたボンクラ学生の頃です。もちろん、今でも英語は片言、ヒアリングなんてダメダメのまま成長してきたわけですが、たまに外国の方とあったりしたときに、自分の英語力のなさ加減を思い知らされて愕然となることが多々あります。・・・いや、多々ってほど外国人と話す機会があるわけではないですけどね。
そんなときに思い出すのが翻訳こんにゃく。子供の頃はドラえもんをバイブルに育ってきた夢見がちな少年でしたので、「食っただけで英語ぺらぺら」という魔法の様な効果に指をくわえておりました。
今では割と夢を見なくなりましたので、翻訳こんにゃくのメカニズムがどう考えてもわからないと、日々悶絶する日々です。「なんで食うだけで英語がしゃべれるんだ」ってな具合。そういえば「暗記パン」とかいうのもありましたね。未来世界では胃や腸から記憶を摂取する方法を編み出したんでしょうか。
そんな与太話は置いておいて、近頃はPSPの「TALK MAN」などのリアルタイム自然言語翻訳ツールってのが少しずつ世の中に進出してきました。
そんな中、今月号(2006年4月号)のASCII紙面「夢見るテクノロジー」にてNECの「VoToL」が紹介されました。
このVoToL何ですけれど、実はWeb上では結構前から露出がありまして、その外観ときれいなGUIが目を引いていました。
VoToLでできることは、音楽やムービーの再生、そして自然言語翻訳です。この事前言語翻訳なんですけれど、英語と日本語を双方向翻訳、しかも旅行英会話特化と言うことで、TALKMANのように多言語対応というわけにはいきません。その当たりはちょっと見劣りしてしまうのですが、VoToLの真の価値はそれ単体ではなく、そのテクノロジそのものにあったようです。
VoToLは他の携帯プレイヤーの例に漏れず、PCに比べれば貧弱なCPUと容量(音楽、ムービーの保存領域のぞく)しか持っていないわけです。それにもかかわらず、かなりの精度での翻訳を可能にできた事は、冷静に考えれば驚嘆に値することです。
ASCIIの記事によれば、音声パターンのクラスタ化とグループ化によって実現したとの事。
クラスタ化とは「合成」と説明されていましたが、似たようなデータから平均を取ることで、パターンサンプルを絞っていくことらしいです。これにより、保存しておくサンプルデータを数万個から数千個まで減らせたと言うことです。これによって、必要とする容量を、携帯プレイヤーでの運用レベルまで減らすことができたようです。
では、グループ化とは何かと言いますと、サンプルパターンを波形の形状によってグループにまとめておくことです。ASCIIの説明からすると、木構造・・・つまり、Windowsのフォルダ構造、「エクスプローラ」で「フォルダ表示」をしてみるとわかりやすいと思います。
入ってきた音声データをグループごとに比較、どれだけにているか点数を付けて、点数がもっとも高いグループだけ、そのグループの中で比較・・・と言うように、比較の回数を効率的に減らすことで、貧弱なCPUでも実用に耐えられる速度を実現したということです。
この技術の素晴らしいことは、そこそこの容量、そこそこのCPUがあれば、他の端末にも使い回せると言うこと。近いうちにWindowsCE.NET版が公開されるようですけれど、携帯電話にも乗せる方向で、現在開発が進んでいるようです。
外国人、そして外国語が生活の至る所に入ってくる中で、言葉の壁がコミュニケーションを阻むという事は予想以上に多くなってくると思います。接客業についている人たちはもとより、その他の業種の人も決して人ごとでは無いと思いますけれど、そんなときにこのような自然言語翻訳ツールがあれば、トラブルを未然に回避できるのでは、とも思います。
それぞれの業種に合わせ、「日常会話+業種ごとの辞書セット」という形で普及する日もそう遠くないかもしれませんね。
とは言え、言語はやっぱり自分で学習するのが一番良いかな、とも思っていますが・・・やっぱり難しいですものね。
NEC VoToLのプレスリリースページ
VoToL製品紹介ページ
こうこう考えて日々生活していたのは、日本語もおぼつかないのに(敬語とか難しいですよね)、外国語なんて話せるわけ無いじゃん!とか考えていたボンクラ学生の頃です。もちろん、今でも英語は片言、ヒアリングなんてダメダメのまま成長してきたわけですが、たまに外国の方とあったりしたときに、自分の英語力のなさ加減を思い知らされて愕然となることが多々あります。・・・いや、多々ってほど外国人と話す機会があるわけではないですけどね。
そんなときに思い出すのが翻訳こんにゃく。子供の頃はドラえもんをバイブルに育ってきた夢見がちな少年でしたので、「食っただけで英語ぺらぺら」という魔法の様な効果に指をくわえておりました。
今では割と夢を見なくなりましたので、翻訳こんにゃくのメカニズムがどう考えてもわからないと、日々悶絶する日々です。「なんで食うだけで英語がしゃべれるんだ」ってな具合。そういえば「暗記パン」とかいうのもありましたね。未来世界では胃や腸から記憶を摂取する方法を編み出したんでしょうか。
そんな与太話は置いておいて、近頃はPSPの「TALK MAN」などのリアルタイム自然言語翻訳ツールってのが少しずつ世の中に進出してきました。
そんな中、今月号(2006年4月号)のASCII紙面「夢見るテクノロジー」にてNECの「VoToL」が紹介されました。
このVoToL何ですけれど、実はWeb上では結構前から露出がありまして、その外観ときれいなGUIが目を引いていました。
VoToLでできることは、音楽やムービーの再生、そして自然言語翻訳です。この事前言語翻訳なんですけれど、英語と日本語を双方向翻訳、しかも旅行英会話特化と言うことで、TALKMANのように多言語対応というわけにはいきません。その当たりはちょっと見劣りしてしまうのですが、VoToLの真の価値はそれ単体ではなく、そのテクノロジそのものにあったようです。
VoToLは他の携帯プレイヤーの例に漏れず、PCに比べれば貧弱なCPUと容量(音楽、ムービーの保存領域のぞく)しか持っていないわけです。それにもかかわらず、かなりの精度での翻訳を可能にできた事は、冷静に考えれば驚嘆に値することです。
ASCIIの記事によれば、音声パターンのクラスタ化とグループ化によって実現したとの事。
クラスタ化とは「合成」と説明されていましたが、似たようなデータから平均を取ることで、パターンサンプルを絞っていくことらしいです。これにより、保存しておくサンプルデータを数万個から数千個まで減らせたと言うことです。これによって、必要とする容量を、携帯プレイヤーでの運用レベルまで減らすことができたようです。
では、グループ化とは何かと言いますと、サンプルパターンを波形の形状によってグループにまとめておくことです。ASCIIの説明からすると、木構造・・・つまり、Windowsのフォルダ構造、「エクスプローラ」で「フォルダ表示」をしてみるとわかりやすいと思います。
入ってきた音声データをグループごとに比較、どれだけにているか点数を付けて、点数がもっとも高いグループだけ、そのグループの中で比較・・・と言うように、比較の回数を効率的に減らすことで、貧弱なCPUでも実用に耐えられる速度を実現したということです。
この技術の素晴らしいことは、そこそこの容量、そこそこのCPUがあれば、他の端末にも使い回せると言うこと。近いうちにWindowsCE.NET版が公開されるようですけれど、携帯電話にも乗せる方向で、現在開発が進んでいるようです。
外国人、そして外国語が生活の至る所に入ってくる中で、言葉の壁がコミュニケーションを阻むという事は予想以上に多くなってくると思います。接客業についている人たちはもとより、その他の業種の人も決して人ごとでは無いと思いますけれど、そんなときにこのような自然言語翻訳ツールがあれば、トラブルを未然に回避できるのでは、とも思います。
それぞれの業種に合わせ、「日常会話+業種ごとの辞書セット」という形で普及する日もそう遠くないかもしれませんね。
とは言え、言語はやっぱり自分で学習するのが一番良いかな、とも思っていますが・・・やっぱり難しいですものね。
NEC VoToLのプレスリリースページ
VoToL製品紹介ページ










