gooブログはじめました!

写真付きで日記や趣味を書くならgooブログ

護送船団方式

2011-05-22 17:42:15 | 社会・経済

 浅羽通明著「教養論ノート」(リーダーズノート新書)を読んだ。この著作で語られる「世間」とは何か、「教養」とは何かについての説明に感心し、文系は、この種の話題について語るのがうまいなあ、と思う。

 この著書の中に、何回か「護送船団方式」という言葉が現れる。私は、「護送船団方式」とは、官僚指導により国が各種企業という船団を率いて経済成長という目的に向かって邁進する方式、というように解釈していた。しかし、この方式は、官僚や企業だけにとどまらず、高度成長期の日本社会全体を支配するバックボーンとなっていたのではないか、と考える。この方式は、地域のコミュニティや各家庭にも浸透し、高度成長期を語るときのキーワードとして使えるのではないか、というわけである。ただし、地域コミュニティや家庭が対象となると、「船団」とは、企業や組織ではなく、人々ということになる。

 日本人の国民性を一言で表現する言葉として、「集団主義」というものがある。「護送船団方式」の代わりに「集団主義」という言葉で日本社会を表現しても よいのだが、「集団主義」は、官公庁や企業の態様を説明する言葉としては適当かも知れないが、地域のコミュニティや学校や家庭を支配する空気を一言で表現するには、「護送船団方式」の方が適しているように思える。

 「護送船団方式」は、高度経済成長とともに存在していたわけだから、バブルが崩壊し、経済成長が止まるとともに、衰退することとなった。経済成長が華やかな頃、地域のコミュニティは活況を呈しており、人はある地域に生まれるとともに、無条件にそのコミュニティに参入することが許されるのであった(地域コミュニティが「世間」というものの主な舞台でもあったわけである)。従って、私の少年期や若い頃には、およそ「ひきこもり」のような社会現象が見当たらなかった。経済成長の停滞とともに、多くの地域コミュニティ、特に都会にあったコミュニティは衰退していった。人は、孤独になるのを恐れ、ケータイやパソコンなどのツールを使うにせよ、そうでないにせよ、自力で他人とのソーシャル・ネットワークを構築する他ない時代となった。そして、このようなネットワークを形成できない者は「ひきこもり」の状態に陥るほかないこととなった。

 家庭についても、同様の変革を避けることができなかった。かつての家庭は、家族構成員の間がしっかりした絆で結びつけられているように思えた。今にして思えば、これは日本社会を支配する空気がわけへだてなく各家庭にも及んでいたのであった。現在では、家族構成員がバラバラの個人に分かれてしまったような家庭も珍しくない。これをもって、「家庭崩壊」と呼ぶ人もいるが、同意し兼ねる。それは、かつての「護送船団方式」を懐かしむノスタルジアに他ならないからである。家庭は、一度バラバラの個人に解体すればよいのである。そして、そこを原点として家族構成員の間でどのような相互関係が作れるのか、関係を構築して行けばよいのである。

 かつて企業戦士などの名で経済成長を支えていた「おやじ」は、家庭内の中心人物のようにみえたが、その後、どうなったのか。「おやじ」の中には、専業主婦の妻に向かって、「だれに食わせてもらっているのだ」というような言葉を投げつける人もいたが、それは無意味な駄弁であるから、やめた方がよい。かつてのおやじもまた、日本社会のバックボーンとなっていた空気に洗脳された人物に他ならなかった。現在では、「おやじ」は、妻や子供たちと一緒に横一列に座する一個人とみればよい。今では、見かけ上「存在感のない」おやじが理想的にみえる。おやじは、子供を自立の方向に導いて行くとか、妻の視野を少しだけ広げるとか、長期的な戦略をもって家族構成員の人間的成長を促すように、さりげなく動けばよい。実際にうまく行くか否かは、構成員の自覚次第ではあるが。

 日本社会の変革は、結婚に至るまでの手続きにまで及んだ。かつて、地域コミュニティや親族の中に結婚の世話をしてくれる人がいた。「護送船団方式」が崩れるとともに、このような人はいなくなった。結婚を望む者は、結婚相談所を利用するにせよ、そうでないにせよ、自力で結婚相手を探すほかなくなった。

 このような結婚手続き上の変化とともに、結婚観も変わることになった。すでに、女性にとっても、「結婚=しあわせ」の方程式が成り立たなくなっている。結婚するとしあわせになることもあるが、しあわせが幻想のまま終わることも少なくない。今まで、娘に向かって、「早く結婚しなさい」と言っていた親は、「結婚すればだれでもしあわせになれる」という数学でいう公理を信じていたからだ。この公理が崩れてしまった現在、もはや自分の子供に向かって「結婚しなさい」というのは、適切ではない。


音のイリュージョンから聴覚メカニズムを探る

2011-05-16 16:16:50 | 学問

 岩波科学ライブラリー168「音のイリュージョン」(柏野牧夫著、岩波書店)を読んだ機会に、特に2つのイリュージョンを取り上げ、聴覚を生み出す脳のメカニズムにどこまで迫っているのか、まとめてみることにした。

 まず、予備知識として、耳の奥の内耳内の蝸牛というところに基底膜という振動板のようなものがある。耳に入ってくる音には通常いろいろな周波数成分が含まれているが、この基底膜の共振によって周波数成分がある程度分解される。基底膜の入り口側は高い周波数に同調するような聴覚フィルタ、先端部は低い周波数に同調する聴覚フィルタという具合に構成されている。つまり、基底膜は、周波数分析機能をもっている。そうすると、基底膜から大脳に通じる神経網は、この周波数分析結果を保存するようにある周波数帯域ごとに独立した神経束をもっていると考えてよいだろう。また、音圧レベルは、各々の神経束ごとに発火が伝送される聴神経の数に反映されていると考えてよいだろう。基底膜という聴覚フィルタは、外界から到来する物理的な音響を脳で処理するための音響信号に変換する変換器の役割ももつわけだが、その変換特性は、非線形の特性をもつと言われる。

 第1のイリュージョンは、連続聴効果というものである。文章を声に出して読み上げたものを録音し、その文章の頭から100~200ミリ秒程度の間隔ごとに信号を削除して無音にする。こうすると、何を言っているのか非常に聞き取りにくくなる。次に、声を削除した部分に一定の条件を満たした雑音を挿入する。こうすると、雑音はザッザッと一定間隔ごとにやかましいが、その背後で、削除されたはずの声が復活し、滑らかにつながって聞こえる。すなわち、雑音が挿入された場合に限って、削除された部分が修復される。このイリュージョンは強力であり、うまく条件を設定すると、声を削除せずに雑音を加えたもの(つまり、声を雑音でマスキングしたもの)と、声を削除してから雑音を加えたものと、まったく聞き分けられない。このような知覚的補完現象が生じるのは声に限らない。音楽の場合も同様である。音楽の場合、100~200ミリ秒程度の一定間隔ごとに音響信号を削除すると、とても聞けたものではない。しかし、同様に雑音を挿入すると、もちろん雑音はやかましいが、音楽自体はうそのように滑らかに聞こえる。

 以下、連続聴効果が生起するための条件を上記著書から抜き書きしておく。ここで、補完されるべき音を被誘導音、中断部分に挿入する音を誘導音と呼ぶことにする。

(1)連続聴効果が生じるためには、被誘導音の中断部分が実際に連続していたとしても、それをマスキングできるような音響特性を誘導音が備えていなければならない(マスキング可能性の法則)。

(2)連続聴効果が生じるためには、誘導音と被誘導音の間に検出できるようなギャップ(無音区間)があってはならない。 

(3)連続聴効果が生じるためには、被誘導音の中断される時間(つまり誘導音の長さ)が200~300ミリ秒以下でなければならない。

(4)連続聴効果が生じるためには、誘導音と被誘導音の音響特性が不連続的に変化していなければならない。

(5)連続聴効果が生じるためには、誘導音の前後で被誘導音の音響特性があまりにも異なっていてはならない。

(1)について注釈すると、断続的な被誘導音の間に適切な周波数・音圧レベルの誘導音を挿入すると、被誘導音が連続しているように知覚される、ということである。逆に言えば、誘導音の周波数が適切でも音圧レベルが低すぎると、完全に連続しては知覚されない、ということである。また、被誘導音と誘導音の周波数帯域が異なると、音圧レベルが高くても連続的に知覚されない。さらに、周波数と音圧レベルが適切でも被誘導音と誘導音の空間的位置が異なると連続的に知覚されない。大脳は、両者の空間的位置が異なることを検知すると、各々独立したものとしてしか知覚しない。

 (2)については、音が切れていることを検知すれば、知覚的補完は必要ないから、そのまま無音を知覚するしかない。(3)については、被誘導音の中断時間があまりにも長いと、大脳は、補完の対象外とみなしてしまうようだ。(4)については、誘導音と被誘導音の間が滑らかに変化していると、音色が時間的に変化するひとつの音であるように聞こえる。誘導音は、補完の必要がないものとみなされる。

 (5)については、中断の前後で、被誘導音の周波数帯が不連続であるなど音響特性が短時間で急激に変わるということは、中断の前後が別の音源である可能性が高い。中断の前後が同じ音源であるからこそ補完する意味があるのであるから、大脳は、この状況を検知するやいなや補完の対象外とみなしてしまうようだ。

 さて、以上の連続聴効果の実験データから大脳のメカニズムを推定してみる。大脳は、時系列的に到来する音響信号を分析するとともに、両耳から入力された音響信号を統合する第1段階と、この分析・統合結果を基に音響信号が何を意味するかを認知する第2段階との少なくとも2つの段階が存在するようだ。

 第1段階では、到来する音響信号を200~300ミリ秒程度蓄積できる短期記憶に一時的に記憶し、信号の分析にとりかかる。まず、この時間帯の中に無音区間、すなわちすべての周波数帯に亘って音圧レベルがほぼ0を検出すれば、無音とみなして、次の第2段階での知覚的補完の処理を抑止するよう制御する。誘導音の音圧レベルが低すぎる場合も、閾値レベルに達しないような低い音圧レベルであれば、知覚的補完の処理を抑止する。

 また、大脳は、被誘導音から誘導音に移るときに周波数帯域が不連続であることを検出すると、補完の対象外の扱いをする。

 大脳は、両耳から入力した音響信号を比較して被誘導音と誘導音の音源が同一か否かを検知する機能をもつと考えられるので、両者の音源の空間的位置が異なることを検出できるのであろう。そうであれば、このような場合に、大脳が誘導音を補完の対象外にするのは当然の処理と言える。検出の詳細については、この分野の専門書で説明されているものと期待して省略する。

 また、上記(3)と(5)から言えることは、大脳は、被誘導音の中断時間の前後の音響信号の状態の変化を検出しているということである。実験によると、大脳は、被誘導音が誘導音によって200~300ミリ程度中断されても、中断前後で被誘導音がどのように変化しているかを検出し、その結果を知覚に反映していることが確かめられている。すなわち、大脳は、200~300ミリ秒位の範囲で被誘導音の変化を検出し、後付け的な知覚を行っていることが知られている。

 さらに、上記(4)については、メカニズムの意味するところが難解である。誘導音と被誘導音の音響特性が不連続的に変化していると、何故知覚補完の必要性が生じるのか謎である。今後の解明を待つことにし、保留としておくしかない。

 第2段階の情報処理では、被誘導音の音響パターンに近いモデル・パターンが長期記憶から取り出され、誘導音に重ねられるとみる。現実の音響パターンとモデル・パターンは、各々ウェイトが保存されているから、モデル・パターンのウェイトが高ければ、こちらが優先される。しかし、現実のパターンが知覚の対象から外されることはない。誘導音が補完の対象外を知らせる制御信号は、中断部分についてモデル・パターンの適用を抑止するので、結果として誘導音のみが知覚されることになる。しかし、モデル・パターンには、音圧レベルまで保存されているのだろうか。そうでなければ、モデル・パターンの音圧レベルを現実の音響パターンの音圧レベル程度に合わせるような変換操作が必要となる。

 次に、第2のイリュージョンについて説明する。演奏される楽器から出てくる音のように複数の周波数成分からなる音を複合音と呼ぶ。複合音の一番低い周波数成分を基本周波数(ファンダメンタル)と呼ぶ。その上の周波数成分は、基本周波数の2倍、3倍、・・・というように、整数倍になっている。これを倍音という。基本周波数とその整数倍の倍音からなる複合音を、とくに調波複合音と呼ぶ。脳で知覚される複合音は、特に基本周波数が優勢であるように聞こえ、倍音は奏でられる楽器の音色を特徴づけることに寄与するものと考えられる。ただし、各々基本周波数が異なる複数の複合音を和音として合奏するときには、互いに周波数が合致する倍音が優勢となるようである。周波数が同じか互いに差の小さい周波数成分が一つのまとまったグループを形成し(群化と呼ばれる)、互いに周波数の離れた複数の基本周波数よりも優勢となるように知覚が変化するらしい。

 さて、一つの複合音からわざと基本周波数を削除し、倍音のみからなるような音を構成し、人に聞かせたら、どのように知覚されるのだろうか。結果は、基本周波数が存在する通常の複合音に近いような音に聞こえる。脳は、残っている倍音成分から基本周波数を推定する。その結果、欠落した基本周波数(ミッシング・ファンダメンタル)に対応する高さ(ピッチ)が知覚されるのである。

 聴覚システムは、どのようにして複合音からピッチ(基本周波数)を求めているのだろうか。耳の聴覚フィルタは、低い周波数領域では周波数分解能が高く、高い周波数領域では周波数分解能が低い。そのため、高周波数領域では、高次の倍音成分が完全には分解されずに加算されたまま残るが、その代わり、時間分解能が良いために、波束の周期は明確に表れる。従って、高次成分の時間パターンからピッチが求められるという説(周期ピッチ理論)が1938年ごろから提唱されていた。例えば、基本周波数が100ヘルツの調波複合音であれば、聴覚フィルタの出力の振幅包絡には10ミリ秒の周期が現れるので、この周期の逆数をとることによって基本周波数が求められる。

 現在有力な説のひとつは次のようなものである。まず、各々の周波数領域の聴覚フィルタの出力の周期が検出される。次に、その情報が異なった聴覚フィルタ間で比較されて、共通の周期が検出される。これは、基本周波数の逆数になっているはずである。このようにして、ピッチが求められたとして、その音圧レベルはどのように生成されるのだろうか。ピッチの音圧レベルが現実の倍音の音圧レベルよりやや大きくなるよう調整されるのだろうか。

 非調和成分をもつ音を知覚するとき、音の高さは、最も近い倍音系列の基本音で近似される。たとえば、850,1050,1250,1650Hzの成分から成る音を考える。これに最も近い倍音系列は、833,1042,1250,1458,1667Hzである。この系列は基本音が208.3Hzの第4,第5,第6,第7,第8倍音に相当するので、この基本音がこの非調和複合音の高さの近似値として用いられる。こうなると、いくつかの非調和成分に共通の周期からピッチを求めるのが困難になる。近似された倍音系列は、現実の時間変化をもつものでないので、リアルタイムで共通の周期を測定するわけにはいかなくなる。

 非調和成分をもつ音が、倍音系列で近似できる限界を越えているときには、複合音は2つの音系列に分離する。いわゆる音脈分凝(ぶんぎょう)といわれる現象である。例えば、100,200,300,・・・ヘルツの成分をもつ調波複合音の周波数成分のうち、どれかひとつの周波数を基本周波数の整数倍からずらしてみる。例えば、400ヘルツ440ヘルツのように近似限度を越える程にずらすと、その成分だけが残りの複合音から浮き出して聞こえる。また、いくつかの成分の周波数を元の基本周波数とは別の周波数の整数倍になるように変更すると(例えば、400ヘルツ440ヘルツ、600ヘルツ660ヘルツ、800ヘルツ880ヘルツ)、それらがひとまとまりになって独立し、残りの成分からなるまとまりとふたつ同時に鳴っているように聞こえる。いずれの場合も、複合音は2つの音源から出ているものと知覚されるらしい。音脈分凝の処理が先行し、その後で各々の音系列についてピッチを求めるのであれば、周期ピッチ理論が適用できる。

 調波関係というのは非常に強力な手がかりなので、他の手がかりと矛盾している場合にも打ち勝つことがある。例えば、左右ふたつのスピーカを用意し、片方からは基本周波数の奇数倍の倍音のみ(100,300,500,・・・ヘルツ)、もう片方からは偶数倍の倍音のみ(200,400,600,・・・ヘルツ)を呈示する。中央で聞いていると、一ヶ所からひとまとまりの音(100,200,300,・・・ヘルツ)が聞こえてくる。空間的な手がかり(両耳間時間差やレベル差など)よりも調波関係の手がかりが優先されたわけである。

 上で取り上げた2つのイリュージョンは、知覚によって欠落した音響信号または周波数成分を補完するケースであるから、両者には共通の知覚メカニズムがあるのではないかと期待していた。しかし、上記考察の結果としては、期待外れとなったようである。まずもって、知覚システムは何故欠落した音響信号または基本周波数成分を補完する必然性が生じるのか、ということである。次いで、聴覚システムは何故調波関係を保持しようとこだわるのか、調波関係は何を基準にして決定されるのか、ということである。これは自然が秘めているミステリーの1つではなかろうか。

 人間の脳活動を含めた自然というものの全体像を完成したジグソーパズルに例えるなら、音響心理学は、そのピースの一片とみてよいであろう。また、脳科学や神経生理学は、他のピースとみてよいであろう。さらに、非線形科学で説く「ゆらぐ自然」や、生命原理に必須とみられる自己組織化のメカニズムは、さらに他のピースとみてよいだろう。問題は、音響心理学というピースと、他のピースとの間をつなぐべきピースが欠落しており、そのピースの形やピース上に描かれた模様を推定するのが困難であるということである。例えば、聴覚メカニズムのモデルが、活動する神経細胞のダイナミズム、あるいは自己組織化や「ゆらぎ」とどういう関連をもつのか、について説明するのは容易でない。全体像と言っても、平面的なジグソーパズルではなく、立体構造をしているかも知れないのだ。音響心理学は抽象度の高い上位レイヤに属するピース、脳科学や神経生理学は下位レイヤに属するピース、欠落しているのは中間レイヤのピース、という具合に。聴覚システムが補完するミッシング・ファンダメンタルとは異なり、欠落しているピースの形やその上あるいは内部の模様を補完して、自然というものの全体像を鳥瞰するにはまだほど遠いとうことを改めて痛感する。