この問題の興味深いところは「どっちが正解か」でも「なぜふた通りに聞こえるか」でもなく「この音声に特有の問題」として「なぜある瞬間には片方しか聞き取ることができないのか」のとこだと思うの。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:09
huffingtonpost.jp/2018/05/16/yan…
直感的には低音部のローレルの「倍音列の中」にヤニーが紛れているということ以外は考えにくいんだけど、それが成立する音声がなぜそこに存在するのか。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:12
技術的には「高音部はiとaだけ、低音部にoが主に使われているから」というのが一つの答えと思う。そもそも「iという母音」は口内空間を狭め(端折る)「高次倍音が多く低次倍音が少ない倍音列を表す概念」であって、oはその逆で。aは全域開放だけど女声と認識するとそもそも低音部がない。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:23
男声の音域でローレル(音素的にはたぶんoとuしかない)と発音した時の倍音列中に女声の音域で発音するヤニーが含まれていたとしてもそこには全く不思議はない。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:29
低次倍音を都合よくカットできる耳が一定数、議論が巻き起こる程度の割合で存在できるのだとしたら、その点はとても興味深い。
仮説として「元音声に低音部や高音部、あるいは特定の倍音がそもそも存在しなくて、音響機器ないし人間の認識の仕組みによって、cdの圧縮伸張のように、元々存在しない倍音が表れている」、「その仕組みが一様でなく個人差がある」とか。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:34
「ノイズが含まれる」という証言は示唆的。
こういう音声が意図的に作れるようになるとサブリミナル方面のヤバい目的で使われるようになるんではというか既に使われていてもおかしくないというか使われてなかったらびっくりする。音素的に縛りがあるのは間違いないけどそれがどの程度キツイか調べるのは億劫だけど人間がやる前提は非現実的。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:40
特定音声パターンを自動認識して余分な情報をリアルタイムでねじ込む音声フィルタとか、大学生レベルで作れるんではないか。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:42
もっとヒネって、日本語音声の高音部カットして英語音声をねじ込んでどっちの話者にも自然に聞こえるような…それはちょっと厳しいか。
— Kimiru-Hamiru (@KimiruHamiru) 2018年5月19日 - 17:43
※コメント投稿者のブログIDはブログ作成者のみに通知されます