聴覚障害者の斉藤りえさんが議員活動をスタートさせたということで、東京都北区議会に導入された音声認識システムのことがTV新聞などで報道されました。
そこで、何故、パソコン通訳・パソコン要約筆記ではなく音声認識システムなの?という疑問が湧きました。
少なくとも自分が知っている知識の範囲内では、議員活動のためにはパソコン通訳・パソコン要約筆記の方が良いかと思われたからです。それとも知らないうちに最近の音声認識システムはそんなに精度があがったのか?とも思ったのですが、そうでもないようで…。そのことに関して少々書き込みます。もちろん私が理解している範囲となります。私の誤解などがあればご指摘ください。
参考までに、斎藤さんは手話は出来ませんから情報保障として手話通訳という選択肢はありません。
音声認識システムとパソコン通訳・パソコン要約筆記を簡単に説明し比較していきます。
まず音声から文字への変換。つまり斎藤さん以外の議員などの発言をどう文字化するかという点です。
音声認識システムからみていきます。議会運営に則して言えば、他の議員などの発言が斎藤さんのパソコンに文字で表示されるシステムということになります。但し誤変換も多く、喋り手が複数の場合は誤変換も増します。一人に限定し、しかも発音明瞭であれば誤変換は軽減されますが、なくなるわけではありません。
次にパソコン通訳・パソコン要約筆記。他の議員などの発言をパソコン通訳者・パソコン要約筆記者がキーボード入力していきます。その結果が斎藤さんのパソコンの表示されます。例えば2人が分担して入力すればほぼ100%の発言を文字化することができます。機械と違う点は間違っても訂正が出来る点です。入力者の2人だけでずっと入力し続けるのは困難ですので、交代要員としてさらに2人。計4名が理想ということになるかと思います。求められる内容、入力時間、予算に応じて人数を減らすということも考えられます。場合によっては計2名、あるいは3名ということもあるかと思います。
2つを比較するともう圧倒的にパソコン通訳・パソコン要約筆記の方が情報が正確に伝わるということになります。また人間がやる作業ですので、相談して日々斎藤さんが読みやすい知恵と工夫を盛り込んでいくこともできると思います。
次に文字から文字への変換。あるいは文字から音声への変換。つまり斎藤さんが入力したデータを他の議員などにどう理解してもらうかという点です。斎藤さんの入力速度の問題はとりあえずおいておきます。
音声認識システムの場合は、斎藤さんが入力したデータを機械が読み上げるということになります。こちら側は誤変換はあまりないと思います。機械的な口調は致し方ないでしょう。漢字の読み方などに問題があるのかもしれませんがそのあたりはよくわかりません。元々はローマ字かかなで入力するわけですから、それをもとにしているのなら漢字の問題はあまりないのかもしれません。
次にパソコン通訳・パソコン要約筆記を導入した場合。斉藤さんの入力したデータを何らかの形で他の議員に文字情報として読んでもらう。あるいは誰かがその文字情報読み上げるということになります。
どちらかが圧倒的に良いということではないかと思います。
つまり情報を正確に伝えるということで考えると、どう考えてもパソコン通訳・パソコン要約筆記の方が優れているとしか思えません。では何故音声認識システムが導入されたのでしょうか?お金の問題でしょうか。それとも人員が確保できないのでしょうか?報道によると音声認識システムの導入は(スポーツ報知によれば)400万円だったようです。
http://headlines.yahoo.co.jp/hl?a=20150525-00000291-sph-soci
記事によると、手話通訳は年間約700万円かかるということのようです。しかし斉藤さんには手話通訳は無効なはず、何故比較として手話通訳に言及されているのかはよくわかりません。パソコン通訳・パソコン要約筆記の予算に言及した記事は、探した限りは見つかりませんでした。記者会見で誰かが質問すれば答えがあったかもしれませんが、誰も理解しておらず質問もなかったということでしょうか?
NHKニュースwebによると「北区議会はおととしから障害者に対応した議会運営の方法を検討していて」ということのようです。http://www3.nhk.or.jp/news/html/20150525/k10010091271000.html
導入するなら、パソコン通訳・パソコン要約筆記ではなく音声認識システムという判断が既になされていたのでしょうか?
実際議会で使用した後、NHKニュースwebで斉藤さんは以下のような感想を語っています。
「不安はありましたが、無事に初めての議会を終えることができました。音声を文字に変換するシステムは当初より間違いが多いように思いましたが、隣の席の議員に間違いを教えてもらうなどして、大きな意味はつかむことができました」http://www3.nhk.or.jp/news/html/20150526/k10010092441000.html
大きな意味を掴むだけで議員活動って出来るものなのでしょうか?
毎日新聞の記事でも大意しかつかめないことが書かれています。
事務局は「大意はつかめるが、採決など大事な局面では職員がサポートします」と説明した。 http://mainichi.jp/select/news/20150526k0000m040050000c.html
議会が始まる以前の斎藤りえさんのブログには以下のような言及があります。
「どのくらい間違がなく、文字に変換されるのか」「どの程度、自然な声なのか」といった精度への不安は残りますが、議会事務局はじめ、他の議員のみなさんも議会活動に支障のない精度だと仰っており、技術の進歩のおかげであることも実感しています。
http://saitorie.com/blog/kusei/335/
これを読むと議会主導で音声認識ソフトが導入されたということでしょうか?しかも甘い認識で。それとも大意がつかめれば議員活動には問題ないという認識なのでしょうか?
議員活動のことはよくわからないので、ひょっとしたらそうなのかもしれません。
しかし斉藤りえさんには、情報保障の権利者の代表者としての側面があります。斉藤さんもブログで述べられているように、聴覚障害者のなかには手話ではなく文字による情報保障を必要とされている方々が多数います。
聴覚障害者の議員という立場となった以上、『大意』や80%ではなく100%を追及すべきだと思います。
試験的にでもパソコン通訳・パソコン要約を導入し、比較したらどうでしょうか?そうしたうえで議会とともに併用を考えていってもよいのではないでしょうか?例えば音声認識システムは議会を傍聴したい聴覚障害者にとって、とても便利なアイテムでしょう。導入したものの有効利用を考えつつ100%の情報保障を追及していってほしいと思います。
繰り返しになりますが、区議とはいえ議員になった以上は、情報保障の権利者の代表者としての立場からは逃れられないと思います。
大変かもしれませんが頑張ってほしいと思います。
ちなみに兵庫県明石市市議となった家根谷敦子さんには手話通訳がつき議員活動をされているようです。
(追記)
その後、斉藤さんは音声認識ソフトの一つであるUDトークを試されたそうです。
UDトークの側からの申し出があったようです。
私自身、UDトークのことは知っていましたが他の音声認識ソフトとの違いなどはあまり把握していませんでした。
いっしょに体験した斉藤さんの先輩議員音喜多俊さんの言葉を借りれば、
「基本的に、音声認識は完璧に行うことは現時点では難しい」という考え方のもと、親機として登録したPCから即座に誤変換を修正することができ、それが各人のスマートフォンやタブレット等の画面に共有されるというスグレモノ。
ということのようです。
私も早速iPhoneにインストールしました。個人的な利用法としては原稿などの下書きに利用できそうだと思いました。但し滑舌よくしゃべらないとへんてこりんな変換になりまが、そのあたりの改善も進んでいるようです。
UDトークのHp http://udtalk.jp/
斉藤さん、音喜多さんのブログにも体験談が書き込まれています。
斉藤りえさんのオフィシャルブログ http://saitorie.com/blog/etc/375/
おときた駿さんのブログ http://otokitashun.com/blog/daily/7573/