gooブログはじめました!

写真付きで日記や趣味を書くならgooブログ

恐竜の二足歩行に親しむ

2011-09-16 11:24:17 | 学問

 ティラノサウルスのような肉食恐竜は、貧弱な前脚に対してよく発達した後脚をもち、その後脚を使って二足歩行をしていたものと考えられている。恐竜博2011では、ティラノサウルスがどのように前脚を使ったとみられるかについて説明されていた。座った姿勢状態のティラノサウルスは、地面に前脚をついて、その重心を前方に移し、両方の前脚によって体を支持しながら立ち上がったようだ。

 二足恐竜が立ったり歩いたりするとき、その重心は腰の近くにあったから、頭、胴体および尾がほぼ水平に保たれ、腰を中心として上半身と下半身のバランスがよくとられ、尾が釣合いおもりの役割をしたことは、ほとんど疑いない。人間は、尾をもたないが胴が直立しているため、重心が腰に近い。恐竜でも人間でも他の動物でも、腰とは、両方の大腿骨の上端が接続する部位と考えてよい。そうすると、恐竜も人間も、腰近くの重心を中心にして大腿骨より先の脚部を前後に振って歩く動物と考えてよい。これに対して、ダチョウなど現存の鳥類は、尾らしいものをもたず、胴体の中心線が斜め方向を向いているため、その重心は腰のかなり前方に位置する。このため、鳥は、大腿をほぼ水平に保ったまま、膝から下の脚を前後に振って歩いている。そうすると、人間の歩行のメカニズムは、現存の鳥よりもむしろ二足恐竜のそれに近いと考えてよい。二足恐竜の歩行メカニズムに親近感を覚えるのは、単なる興味本位以上のものがあるためであるように感じられる。

 二足恐竜と人間の歩行メカニズムは、基本的には同じとみられるが、両者には枝葉的な違いもある。まず、ヒトは、かかとから足の指先までが接地する「蹠行」を行うが、恐竜や鳥は、足指だけで接地する「趾行」を行う。次に、二足恐竜が歩くとき、前後方向にはほとんど揺れがなくよく安定しているのに対し、左右方向にはやや揺れを伴うような安定状態であったと考えられる。

 米国ジョンズ・ホプキンス大のドナルド・ヘンダーソン博士は、コンピュータを使ったアロサウルスやティラノサウルスなどの歩行モデルを研究している。彼の研究成果によれば、二足恐竜が歩行するとき、横からみた時の重心は、常に同じ位置(股間接の少し前)を上下しているのに対し、前から見ると、Vの字型の軌跡を描いて左右に揺れている。

 ヘンダーソン博士の歩行モデルを信頼するとすれば、この重心の移動状況から、二足恐竜の歩行の様子を読みとれる。まず、V字軌跡の最低端の時点は、恐竜の重心が最も低い状態にあったときであり、両足が歩幅だけ開いた状態で着地した時点であり、恐竜の胴体は、重心が低いとはいえ揺れのない正規の位置にある。この時点は、一方の脚が支持脚から遊脚に、他方の脚が遊脚から支持脚に切り替わる時点でもある。V字軌跡の一方の頂点にある時点は、恐竜の重心が最も高い位置にあるときであり、胴体が一方の支持脚だけで支えられていて他方の脚が遊脚になっている期間のうち、その支持脚が横からみて最も垂直に近い角度になったときである。この時点は、恐竜の胴体の左右方向の揺れが最大になったときでもある。ただし、このとき支持脚の着地点の中心はこの時点の重心のほぼ真下になければならない。また、二足恐竜の足跡化石をみると、両方の足跡は地面上の一直線に近接した位置についている。この両方の条件を満たすために、前から見たときの支持脚の形状は、膝の関節を左右方向に多少曲げた状態になるようだ。V字軌跡の他方の頂点にある時点についても、他方の支持脚について同様である。

 人間が歩くときも、横からみて支持脚が斜め状態になるときとほぼ垂直状態になるときがあるから、その重心が上下動することは明らかである。しかし、左右方向への重心の移動はほとんど感じられない。人が片足立ちしたとき、重心は着地した足裏の中心の真上になければならない。人は、膝の関節を柔軟に曲げてこの状態に対応しているのだろうか。

 人が歩くとき、支持脚の筋肉が生み出す力によって体を前方に推進させている。このとき、筋肉は人の重心を最低点から最高点へと押し上げる働きもしている。重心が最高点から最低点へと落ちる間に獲得した位置エネルギーの差分を放出するから、このエネルギーが体の推進にいくらかの寄与をしている。二足恐竜についても同様である。

 そうすると、重力のない宇宙で人が床上などの着地面を歩くとき、人体はその重心を押し上げる必要もない代わりに重力エネルギーの寄与を受けることもない。歩行のために脚の筋肉が重力に抗して仕事をする必要もない代わりに、脚の筋肉にかかる負荷が少ないために筋肉の衰えを招くということだろうか。

 参考文献:

  笹沢教一著「恐竜が動きだす」(中公新書ラクレ)

  犬塚則久著「恐竜ホネホネ学」(日本放送出版協会)

  アレクサンダー著「恐竜の力学」(地人書館)


「不完全性定理」を学んで

2011-08-17 13:54:51 | 学問

 野崎昭弘著「不完全性定理」(日本評論社)を読んだ。ゲーデルの不完全性定理は難解、との前評判通り、ゲーデル文と呼ばれる論理式がどのような技術的手続きを経て展開されていくのかを理解するのは容易ではなかった。不完全性定理は、長い論理学・数学の歴史が到達した1つの到達点のように思える。公理系を前提としてそれから様々の定理が証明されていくユークリッド幾何学、ユークリッド幾何学の平行線公理を否定することによって誕生した非ユークリッド幾何学、集合論の誕生と発展、改めて数学や論理学の基礎を問う数学基礎論、そして数学基礎論がたどりついた不完全性定理、という具合である。さらに、ゲーデルの不完全性定理は、現代の数学や論理学の出発点となったようにも見える。

 自然数x,y,zの間に何らかの演算を定義し、これらx,y,zに関して結合則、交換則が成立し、たとえば0や1のような単位元を定義するような公理系を設定できる。そして、変数間に定義された演算がこの公理系を満足するにもかかわらず、正しいことが証明できないような算術式が存在することが知られている。しかし、この算術式が証明できないことは、通常の数学的手続きによって証明できるので、問題は生じない。

 これに対して、次のような記述(文)、

 「「この論理式Gは証明できない」ということを表現している論理式G」

は、ゲーデル文とも呼ばれ、「自分自身の証明不可能性」を表現しているわけであり、数学的手続きの範囲では真であるとも偽であるとも判定できない。この種の記述は、超数学的記述と呼ばれる。なお、このような記述(文)は、真偽のいずれかを問うているので、論理式ともなっている。

 上記論理式Gは、記号・記号列のシーケンスから構成されている。ゲーデルは、部分的な記号・記号列をゲーデル数と呼ばれる自然数で表現した。各記号・記号列間は掛け算記号で接続するので、ゲーデル文の全体も1つのゲーデル数すなわち自然数で一意に表現することになる。すなわち、ゲーデル文という超数学的な論理式がゲーデル数という算術的記述で表現できる自然数に翻訳されたわけである。逆に、あるゲーデル数が1つの自然数として与えられると、素因数分解の方法を用いて、表現されている論理式があたかも暗号解読のように一意に決定できる。ゲーデル数の体系は、このように自然数とありふれた算術規則だけを使って論理式を暗号化したり復号化できるよう構成されている。

 ゲーデルは、ゲーデル文が自然数の公理系を満足するにもかかわらず、証明できないことが表明されたのであるから、自然数の体系が形式的に不完全であることを示した。もし論理式Gが証明可能だとすると、G自身が言っていること、すなわち「Gが証明できない」と矛盾する。もしGの否定(-G)が証明可能だとすると、「Gは証明できない」ことの否定が証明できることになる。2重否定は肯定と同等なので、「Gが証明できる」ことが証明できることが導かれる。これは実質的に「Gが証明できる」ことと考えてよい。一方、(-G)も証明できるのだから、Gと(-G)が両方とも証明できたことになる。これもやはり矛盾である。このように、Gが証明できるとしても(-G)が証明できるとしても矛盾が発生するので、もし公理系が無矛盾ならば、どちらも証明できない。

 ゲーデル文に関する上記議論は、いわゆる「ウソつきパラドックス」とよく似た構造をもっている。「ウソつきパラドックス」とは、たとえば、クレタ人であるエピメニデスが「すべてのクレタ人は嘘つきである」と言ったというパラドックスである。エピメニデスも嘘つきであるから、言ったことは嘘であるので、「クレタ人は嘘つきでない」ことになり、ということはエピメニデスは本当のことを言ったのであるから、「クレタ人は嘘つきである」ことになるという真偽判定の手順が永久に繰り返される。すなわち、このパラドックスは、クレタ人が嘘つきか否か決定不可能な記述ということになる。一方、ゲーデル文Gは、「証明できない」ことが真であるから、論理式の真偽はそれで終結し、パラドックスは生じない。

 次にコンピュータの停止問題に言及しよう。一般に、コンピュータは、あるアルゴリズムに基づいて作成されたプログラムを参照して与えられた演算手続きを実行し、その演算結果を出力して停止する。しかし、何らかの原因によってプログラム実行が無限ループに陥り、コンピュータが停止できなくなることがある。あるいは、ゲーデルとチューリングが提示したという自分自身とジレンマに陥るプログラムの例を挙げよう。コンピュータは、各々1,2,3のプログラム番号を与えられた3個のプログラムを実行するものとする。1番目のプログラムは、その処理を実行し、その実行結果をその出力欄に出力する。この出力欄が更新されたことを検出した3番目のプログラムが第1プログラムの出力結果に1を加えて自分の第1の出力欄にその結果を出力する。次に、第2のプログラムはその処理を実行し、その実行結果をその出力欄に出力する。これを検出した第3のプログラムが第2プログラムの出力結果に1を加えて自分の第2の出力欄にその結果を出力する。次に、第3のプログラムは、その処理を実行し、自分の第3の出力欄にその結果を出力するが、さらにその結果に1を加えて第3の出力欄を更新するという単純なアルゴリズムを実行する。しかし、第3の出力欄が更新されたことを検出した第3プログラムは、さらにその結果に1を加えて第3の出力欄を更新するという処理を続ける。すなわち、第3プログラムの実行は無限ループに陥った状態となり、コンピュータは停止しない。第3プログラムは、自分自身の判定結果を修正し続けるのであるから、「ウソつきパラドックス」に類似した結果判定の手順を永久に繰り返すことになる。つまり、ゲーデルとチューリングが指摘したように、「アルゴリズムでは決定できない」問題が存在する、という決定不可能な命題にたどり着くのである。

 次に、別の例として、リチャードのパラドックスとして知られる問題を挙げよう。fを、すべての負でない整数n=0,1,2,...に対して定義された負でない整数を値にとる関数とする。f(n)がnでのfの値とするとき、f(n)が有限個のことばで書かれた法則で、有限個の段階を踏んで得られるとき、fは「計算可能」ということにする。換言すれば、「計算可能」とは、f(n)を計算するためのアルゴリズムがあるということである。たとえば、f(n)=1+2+...+n=n(n+1)/2のように、数学的帰納法を用いてf(i)から容易にf(i+1)を導き出せるような関数を想定するとわかりやすい。関数fは、帰納的関数という範疇にはいるものなのであろう。

 すべての計算可能な関数は可算集合をつくることが容易に証明され、したがって、これらの関数をすべて一列に並べることができる。

   f,f,...,f

 さて、新しい関数を次の式で定義しよう。

   g(n)=f(n)+1

この関数は上の列には入らない。なぜならn=1に対してはf(1)と値が異なり、n=2に対してはf(n)と異なる・・・から。ゆえにgは計算可能ではない。一方、この関数gは計算可能である。なぜならf(n)は計算可能であり、それに1を加えて、g(n)を得るから。

 関数gの計算可能性は、本質的にf,f,...,fの順序に依存しているので、計算可能な関数fは算術体系の範囲で記述されるのに、gの順序の方は「超数学的演算」にほかならない。

 このように、通常の数学的手順に依存する限り、リチャードの問題はパラドックスとして提示されるだけだが、ゲーデルの方法によれば、f,f,...,fによって形成される体系が無矛盾であると仮定すると、関数gが計算可能かどうかという問題は、「決定不可能な命題」として浮かび上がってくる。

 考えてみれば、自然数というと、1,2,3,...のように数が順番に配列された体系であると考えがちである。しかし、この考えは錯覚のようなものである。この自然数の数列は、n番目の自然数に1を加えることによってn+1番目の自然数を得るというアルゴリズムによって構成されたものに他ならない。無限に存在する自然数の集合から任意の自然数を1つ選んだとき、それは、ゲーデル数のようにその内部的な構成に意味をもたせた数でない限り、ランダムな数である確率が高い。大多数の自然数はランダムであることが知られている。すなわち、あるアルゴリズムに従って配列されている数の体系という世界を離れると、とたんにランダムな数が無秩序に集められた混沌とした世界となる。たとえば、ある種のディオファントス方程式のすべての整数解を集めた集合のようなものであろう。ディオファントス方程式とは、1個または数個の未知数に関する通常の代数方程式で、問題はそれが整数解をもつかどうかということである。たとえば、有名なフェルマー予想:x+y=zは、ディオファントス方程式の1つである。任意に高い次数のディオファントス方程式の整数解の存否を決めるアルゴリズムが作れるかどうかという問題は、ヒルベルトの第10問題と呼ばれ、未解決の問題である。フェルマー予想の場合には、n>2で整数解がないことが証明されたのであるから、そのようなアルゴリズムがあるということなのであろう。

 ゲーデルの不完全性定理から連想されるものは、日常生活で遭遇する様々な出来事には様々な矛盾が満ち満ちているということである。3月に起きた東日本大震災の悪夢の記憶もまだぬぐい去れない現在、どうしても大震災により生じた原発事故と不完全性定理とを結びつけて考えてしまう。原発を推進してきた原子力ムラの住人は、原発の安全神話というムラの中ではあたりまえと考えられてきた体系(日常的には常識ということばで語られる)を信奉し、この体系からは導き出せない冷却系の全滅という事態を想定できなかった。その道の専門家であろうが素人であろうが、人間の視野にはとび越えられない限界があることを明確に教えてくれる。人々は、人間ならばだれでも過ちを犯すという思いを共有しながら、復興作業を進めているようにみえる。


数学の組合せ論に現れる相転移

2011-07-17 14:24:30 | 学問

 ブライアン・ヘイズ著「ベッドルームで群論を」(みすず書房)を読んだ。著者は、科学ジャーナリストということであるが、彼の旺盛な探究心と著作内容のレベルの高さに驚いた。一流の科学ジャーナリストというものは、単に耳学問的に得た科学知識を披露するだけでなく、学者や研究者の成果を紹介するとともに、自分自身の探究の成果を加えて読者にレベルの高い読み物を提供しているのだろうか。

 ヘイズの10編以上あるエッセイの中で、特に興味を引かれるのが、「一番簡単な難問」と題するエッセイである。ここでは、数学の組合せ論に現れる数の分割という問題が扱われているが、数学的な探究にとどまらず、物理学の相転移や統計力学との関連について言及されている。例えば、数の分割問題を隣り合うスピンが互いに逆方向を向いている反強磁性体の物理との関連で説明している。ある温度の下で、強磁性体や反強磁性体がどのようなエネルギーとエントロピーのときに安定になるのかを定量的に扱うのは容易でないようにみえる。

 さて、本題に戻って、数の分割問題など組合せ論的な問題に現れる相転移の話題に絞って話を進めよう。この著作で扱われている数の分割問題とは、例えば、

    {2,10,3,8,5,7,9,5,3,2

のように1から10までの範囲からでたらめに選ばれた10個の数を2つの組に分割するときに各組に属する数の和が等しくなるような分割を見つけることである。例えば

2,5,3,10,7}と{2,5,3,9,8

のように分割したとき、どちらの組も和は27となり、完璧な分割が得られる。この例の場合、両組の数の和が等しくなるように分割する方法は23通りある。

 数の分割問題を扱う簡単な方法として、欲張りアルゴリズムと呼ばれる方法が知られている。この方法は、一番大きい数から順番に、その時点で和が小さいほうの組に割り当てていくというものである。しかし、この方法を用いれば常に成功するというわけではない。例えば、

   {771,121,281,854,885,734,468,1003,83,62

の10個の数は完璧に分割できるが、その分割方法は一通りしかない。しかし、この問題を欲張りアルゴリズムで扱うと、完璧な分割が得られず、どうしても両組の差を32より小さくできない。

 一般的に言えば、実は、数の分割問題は、NP完全と呼ばれる超難解な問題に属するのである。クラスPに属する問題は比較的簡単に解けるが、クラスNPに属する問題は並外れて難しい問題として知られ、その中でもNP完全と呼ばれる問題は、特に難しい問題とされている。

 数の分割問題は、問題が大きくなればなるほど難しくなる。問題の大きさは、分割すべき整数の個数nと代表的な整数の桁数mをかけたもので表わされる。ここで、mは2進数、すなわちビット数で表わすことになっている。実は、数の分割問題の難しさをよく表しているのは、mとnの積ではなく、m/nという比である。m<nであれば、ほとんどの場合、完璧な分割がたくさん存在することになる。しかも、mに比べてnが大きくなるほど解の数が増えていく。一方、m>nの領域では、最良の解はほぼつねに1つしかなく、そのうえめったに完璧でなくなる。

 そうすると、m=n附近に難しい問題と簡単な問題のあいだの境界があることになる。分割問題がこの境界を越えたとたんに、ちょうど水が沸騰したり凍ったりするように、相転移を起こすのである。つまり、m>nの領域では氷の状態、m<nの領域では水あるいは水蒸気の状態に相当するのである。m>nの領域では、数の組合せの状態が高々1つしかないのであるから、エントロピーが0の状態に相当する。m<nの領域では、数の組合せの状態が多数存在するのだから、エントロピーが高い状態に相当するわけである。

 次に、他の組合せ最適化問題についても同様の相転移が現れるか否か、調べてみよう。例として、集合被覆問題というものをとりあげよう。例えば、台集合

   S={1,2,3,4,5,6,7,8,9,10,11,12,13,14

の部分集合

   S={1,8},S={2,3,9,10},S={4,5,6,7,11,12,13,14},

   S={1,2,3,4,5,6,7},S={8,9,10,11,12,13,14

の5つの集まり(集合族)が与えられたとき、台集合は、

   S=S∪S∪SともS=S∪S

とも表せる。集合被覆問題とは、集合族に含まれる最小数の部分集合で、その合併が元の台集合となるもの(最小被覆)を求める問題である。

 この問題に対して、欲張りアルゴリズムを適用できるが、必ずしも成功するわけではない。このアルゴリズムは、集合族の中でできるだけサイズの大きな部分集合を優先的に選択していく方法である。上記の例では、まずサイズが8のSを選択し、次にSの残りの要素に関して最大の部分集合を被覆に使うので、Sを選択する。このプロセスを繰り返していくと、S,SおよびSの合併集合が求まるが、これは最小解ではない。正解は、SとSの合併集合である。

 一般的に記述すると、n個の要素から成る台集合S={e,e,...,e}に対してm個の部分集合から成る集合族={S,S,...,S}(S⊆S)が与えられている。集合族の中から適当な部分集合を選び、Sの最小被覆を求める問題である。集合被覆問題もNP完全に属する超難解な問題なのである。

 集合族のすべての部分集合(台集合Sを除く)を集合族とする場合には、非常に簡単な問題となる。部分集合{e}とSの余集合、{e}とSの余集合、・・・などがすべて正解になるからである。この場合には、解が無数に存在する。一方、n,mを大きくし、かつ正解が一通りの部分集合の組合せしかないように集合族を構成することも可能である。

 そうすると、集合被覆問題にも、どうやら易しい問題と難しい問題との分岐点があり、相転移を起こすらしいことが見えてくる。この分岐点は、mの大きさに依存するらしいことは推定できるが、特定することは難しい。数の分割問題に関するm/n比が母集合に含まれる要素の個数とその桁数だけに依存するのに対し、集合被覆問題の場合には、集合族として選ぶ部分集合に任意性があり、それが問題の難しさを左右するからである。

 最後に、フェルマー予想に言及しよう。フェルマー予想とは、方程式

   x+y=z

がn>2に対して整数解をもたないことを証明する問題である。長らく解けなかったフェルマー予想が近年になって解決され、数学界を賑わしたことは、まだ記憶に新しい。この問題は、整数の集合の中から方程式を満たす部分集合{x,y,z}を求める問題であるから、一種の組合せ論に属するのではなかろうか。あるいは、整数の組{x,y,z}が与えられた方程式を充足するか否か判定する問題とも言えるので、充足可能性問題に属するのだろうか。

 n=1,2ならば、この方程式には無数の整数解がある。しかし、n>2となると、とたんに解がなくなるので、n=3を境界として相転移を起こしていると言えるのであろう。


音のイリュージョンから聴覚メカニズムを探る

2011-05-16 16:16:50 | 学問

 岩波科学ライブラリー168「音のイリュージョン」(柏野牧夫著、岩波書店)を読んだ機会に、特に2つのイリュージョンを取り上げ、聴覚を生み出す脳のメカニズムにどこまで迫っているのか、まとめてみることにした。

 まず、予備知識として、耳の奥の内耳内の蝸牛というところに基底膜という振動板のようなものがある。耳に入ってくる音には通常いろいろな周波数成分が含まれているが、この基底膜の共振によって周波数成分がある程度分解される。基底膜の入り口側は高い周波数に同調するような聴覚フィルタ、先端部は低い周波数に同調する聴覚フィルタという具合に構成されている。つまり、基底膜は、周波数分析機能をもっている。そうすると、基底膜から大脳に通じる神経網は、この周波数分析結果を保存するようにある周波数帯域ごとに独立した神経束をもっていると考えてよいだろう。また、音圧レベルは、各々の神経束ごとに発火が伝送される聴神経の数に反映されていると考えてよいだろう。基底膜という聴覚フィルタは、外界から到来する物理的な音響を脳で処理するための音響信号に変換する変換器の役割ももつわけだが、その変換特性は、非線形の特性をもつと言われる。

 第1のイリュージョンは、連続聴効果というものである。文章を声に出して読み上げたものを録音し、その文章の頭から100~200ミリ秒程度の間隔ごとに信号を削除して無音にする。こうすると、何を言っているのか非常に聞き取りにくくなる。次に、声を削除した部分に一定の条件を満たした雑音を挿入する。こうすると、雑音はザッザッと一定間隔ごとにやかましいが、その背後で、削除されたはずの声が復活し、滑らかにつながって聞こえる。すなわち、雑音が挿入された場合に限って、削除された部分が修復される。このイリュージョンは強力であり、うまく条件を設定すると、声を削除せずに雑音を加えたもの(つまり、声を雑音でマスキングしたもの)と、声を削除してから雑音を加えたものと、まったく聞き分けられない。このような知覚的補完現象が生じるのは声に限らない。音楽の場合も同様である。音楽の場合、100~200ミリ秒程度の一定間隔ごとに音響信号を削除すると、とても聞けたものではない。しかし、同様に雑音を挿入すると、もちろん雑音はやかましいが、音楽自体はうそのように滑らかに聞こえる。

 以下、連続聴効果が生起するための条件を上記著書から抜き書きしておく。ここで、補完されるべき音を被誘導音、中断部分に挿入する音を誘導音と呼ぶことにする。

(1)連続聴効果が生じるためには、被誘導音の中断部分が実際に連続していたとしても、それをマスキングできるような音響特性を誘導音が備えていなければならない(マスキング可能性の法則)。

(2)連続聴効果が生じるためには、誘導音と被誘導音の間に検出できるようなギャップ(無音区間)があってはならない。 

(3)連続聴効果が生じるためには、被誘導音の中断される時間(つまり誘導音の長さ)が200~300ミリ秒以下でなければならない。

(4)連続聴効果が生じるためには、誘導音と被誘導音の音響特性が不連続的に変化していなければならない。

(5)連続聴効果が生じるためには、誘導音の前後で被誘導音の音響特性があまりにも異なっていてはならない。

(1)について注釈すると、断続的な被誘導音の間に適切な周波数・音圧レベルの誘導音を挿入すると、被誘導音が連続しているように知覚される、ということである。逆に言えば、誘導音の周波数が適切でも音圧レベルが低すぎると、完全に連続しては知覚されない、ということである。また、被誘導音と誘導音の周波数帯域が異なると、音圧レベルが高くても連続的に知覚されない。さらに、周波数と音圧レベルが適切でも被誘導音と誘導音の空間的位置が異なると連続的に知覚されない。大脳は、両者の空間的位置が異なることを検知すると、各々独立したものとしてしか知覚しない。

 (2)については、音が切れていることを検知すれば、知覚的補完は必要ないから、そのまま無音を知覚するしかない。(3)については、被誘導音の中断時間があまりにも長いと、大脳は、補完の対象外とみなしてしまうようだ。(4)については、誘導音と被誘導音の間が滑らかに変化していると、音色が時間的に変化するひとつの音であるように聞こえる。誘導音は、補完の必要がないものとみなされる。

 (5)については、中断の前後で、被誘導音の周波数帯が不連続であるなど音響特性が短時間で急激に変わるということは、中断の前後が別の音源である可能性が高い。中断の前後が同じ音源であるからこそ補完する意味があるのであるから、大脳は、この状況を検知するやいなや補完の対象外とみなしてしまうようだ。

 さて、以上の連続聴効果の実験データから大脳のメカニズムを推定してみる。大脳は、時系列的に到来する音響信号を分析するとともに、両耳から入力された音響信号を統合する第1段階と、この分析・統合結果を基に音響信号が何を意味するかを認知する第2段階との少なくとも2つの段階が存在するようだ。

 第1段階では、到来する音響信号を200~300ミリ秒程度蓄積できる短期記憶に一時的に記憶し、信号の分析にとりかかる。まず、この時間帯の中に無音区間、すなわちすべての周波数帯に亘って音圧レベルがほぼ0を検出すれば、無音とみなして、次の第2段階での知覚的補完の処理を抑止するよう制御する。誘導音の音圧レベルが低すぎる場合も、閾値レベルに達しないような低い音圧レベルであれば、知覚的補完の処理を抑止する。

 また、大脳は、被誘導音から誘導音に移るときに周波数帯域が不連続であることを検出すると、補完の対象外の扱いをする。

 大脳は、両耳から入力した音響信号を比較して被誘導音と誘導音の音源が同一か否かを検知する機能をもつと考えられるので、両者の音源の空間的位置が異なることを検出できるのであろう。そうであれば、このような場合に、大脳が誘導音を補完の対象外にするのは当然の処理と言える。検出の詳細については、この分野の専門書で説明されているものと期待して省略する。

 また、上記(3)と(5)から言えることは、大脳は、被誘導音の中断時間の前後の音響信号の状態の変化を検出しているということである。実験によると、大脳は、被誘導音が誘導音によって200~300ミリ程度中断されても、中断前後で被誘導音がどのように変化しているかを検出し、その結果を知覚に反映していることが確かめられている。すなわち、大脳は、200~300ミリ秒位の範囲で被誘導音の変化を検出し、後付け的な知覚を行っていることが知られている。

 さらに、上記(4)については、メカニズムの意味するところが難解である。誘導音と被誘導音の音響特性が不連続的に変化していると、何故知覚補完の必要性が生じるのか謎である。今後の解明を待つことにし、保留としておくしかない。

 第2段階の情報処理では、被誘導音の音響パターンに近いモデル・パターンが長期記憶から取り出され、誘導音に重ねられるとみる。現実の音響パターンとモデル・パターンは、各々ウェイトが保存されているから、モデル・パターンのウェイトが高ければ、こちらが優先される。しかし、現実のパターンが知覚の対象から外されることはない。誘導音が補完の対象外を知らせる制御信号は、中断部分についてモデル・パターンの適用を抑止するので、結果として誘導音のみが知覚されることになる。しかし、モデル・パターンには、音圧レベルまで保存されているのだろうか。そうでなければ、モデル・パターンの音圧レベルを現実の音響パターンの音圧レベル程度に合わせるような変換操作が必要となる。

 次に、第2のイリュージョンについて説明する。演奏される楽器から出てくる音のように複数の周波数成分からなる音を複合音と呼ぶ。複合音の一番低い周波数成分を基本周波数(ファンダメンタル)と呼ぶ。その上の周波数成分は、基本周波数の2倍、3倍、・・・というように、整数倍になっている。これを倍音という。基本周波数とその整数倍の倍音からなる複合音を、とくに調波複合音と呼ぶ。脳で知覚される複合音は、特に基本周波数が優勢であるように聞こえ、倍音は奏でられる楽器の音色を特徴づけることに寄与するものと考えられる。ただし、各々基本周波数が異なる複数の複合音を和音として合奏するときには、互いに周波数が合致する倍音が優勢となるようである。周波数が同じか互いに差の小さい周波数成分が一つのまとまったグループを形成し(群化と呼ばれる)、互いに周波数の離れた複数の基本周波数よりも優勢となるように知覚が変化するらしい。

 さて、一つの複合音からわざと基本周波数を削除し、倍音のみからなるような音を構成し、人に聞かせたら、どのように知覚されるのだろうか。結果は、基本周波数が存在する通常の複合音に近いような音に聞こえる。脳は、残っている倍音成分から基本周波数を推定する。その結果、欠落した基本周波数(ミッシング・ファンダメンタル)に対応する高さ(ピッチ)が知覚されるのである。

 聴覚システムは、どのようにして複合音からピッチ(基本周波数)を求めているのだろうか。耳の聴覚フィルタは、低い周波数領域では周波数分解能が高く、高い周波数領域では周波数分解能が低い。そのため、高周波数領域では、高次の倍音成分が完全には分解されずに加算されたまま残るが、その代わり、時間分解能が良いために、波束の周期は明確に表れる。従って、高次成分の時間パターンからピッチが求められるという説(周期ピッチ理論)が1938年ごろから提唱されていた。例えば、基本周波数が100ヘルツの調波複合音であれば、聴覚フィルタの出力の振幅包絡には10ミリ秒の周期が現れるので、この周期の逆数をとることによって基本周波数が求められる。

 現在有力な説のひとつは次のようなものである。まず、各々の周波数領域の聴覚フィルタの出力の周期が検出される。次に、その情報が異なった聴覚フィルタ間で比較されて、共通の周期が検出される。これは、基本周波数の逆数になっているはずである。このようにして、ピッチが求められたとして、その音圧レベルはどのように生成されるのだろうか。ピッチの音圧レベルが現実の倍音の音圧レベルよりやや大きくなるよう調整されるのだろうか。

 非調和成分をもつ音を知覚するとき、音の高さは、最も近い倍音系列の基本音で近似される。たとえば、850,1050,1250,1650Hzの成分から成る音を考える。これに最も近い倍音系列は、833,1042,1250,1458,1667Hzである。この系列は基本音が208.3Hzの第4,第5,第6,第7,第8倍音に相当するので、この基本音がこの非調和複合音の高さの近似値として用いられる。こうなると、いくつかの非調和成分に共通の周期からピッチを求めるのが困難になる。近似された倍音系列は、現実の時間変化をもつものでないので、リアルタイムで共通の周期を測定するわけにはいかなくなる。

 非調和成分をもつ音が、倍音系列で近似できる限界を越えているときには、複合音は2つの音系列に分離する。いわゆる音脈分凝(ぶんぎょう)といわれる現象である。例えば、100,200,300,・・・ヘルツの成分をもつ調波複合音の周波数成分のうち、どれかひとつの周波数を基本周波数の整数倍からずらしてみる。例えば、400ヘルツ440ヘルツのように近似限度を越える程にずらすと、その成分だけが残りの複合音から浮き出して聞こえる。また、いくつかの成分の周波数を元の基本周波数とは別の周波数の整数倍になるように変更すると(例えば、400ヘルツ440ヘルツ、600ヘルツ660ヘルツ、800ヘルツ880ヘルツ)、それらがひとまとまりになって独立し、残りの成分からなるまとまりとふたつ同時に鳴っているように聞こえる。いずれの場合も、複合音は2つの音源から出ているものと知覚されるらしい。音脈分凝の処理が先行し、その後で各々の音系列についてピッチを求めるのであれば、周期ピッチ理論が適用できる。

 調波関係というのは非常に強力な手がかりなので、他の手がかりと矛盾している場合にも打ち勝つことがある。例えば、左右ふたつのスピーカを用意し、片方からは基本周波数の奇数倍の倍音のみ(100,300,500,・・・ヘルツ)、もう片方からは偶数倍の倍音のみ(200,400,600,・・・ヘルツ)を呈示する。中央で聞いていると、一ヶ所からひとまとまりの音(100,200,300,・・・ヘルツ)が聞こえてくる。空間的な手がかり(両耳間時間差やレベル差など)よりも調波関係の手がかりが優先されたわけである。

 上で取り上げた2つのイリュージョンは、知覚によって欠落した音響信号または周波数成分を補完するケースであるから、両者には共通の知覚メカニズムがあるのではないかと期待していた。しかし、上記考察の結果としては、期待外れとなったようである。まずもって、知覚システムは何故欠落した音響信号または基本周波数成分を補完する必然性が生じるのか、ということである。次いで、聴覚システムは何故調波関係を保持しようとこだわるのか、調波関係は何を基準にして決定されるのか、ということである。これは自然が秘めているミステリーの1つではなかろうか。

 人間の脳活動を含めた自然というものの全体像を完成したジグソーパズルに例えるなら、音響心理学は、そのピースの一片とみてよいであろう。また、脳科学や神経生理学は、他のピースとみてよいであろう。さらに、非線形科学で説く「ゆらぐ自然」や、生命原理に必須とみられる自己組織化のメカニズムは、さらに他のピースとみてよいだろう。問題は、音響心理学というピースと、他のピースとの間をつなぐべきピースが欠落しており、そのピースの形やピース上に描かれた模様を推定するのが困難であるということである。例えば、聴覚メカニズムのモデルが、活動する神経細胞のダイナミズム、あるいは自己組織化や「ゆらぎ」とどういう関連をもつのか、について説明するのは容易でない。全体像と言っても、平面的なジグソーパズルではなく、立体構造をしているかも知れないのだ。音響心理学は抽象度の高い上位レイヤに属するピース、脳科学や神経生理学は下位レイヤに属するピース、欠落しているのは中間レイヤのピース、という具合に。聴覚システムが補完するミッシング・ファンダメンタルとは異なり、欠落しているピースの形やその上あるいは内部の模様を補完して、自然というものの全体像を鳥瞰するにはまだほど遠いとうことを改めて痛感する。


音楽を聴く楽しさに科学を求める

2011-04-08 07:37:17 | 学問

 人に生じるストレスを低減するために、音楽療法が行われている。人が適当な音楽を聴くことによって、心身の圧迫感や硬直状態が軽減され、リラクセーションの効果が期待される。

 音楽は、音響物理学的には、和音を基準とする垂直成分に対し、時間軸上のゆらぎ(fluctuation)を水平成分とする時系列情報である、と定義される。そして、クラシック音楽やセラピーミュージックに内在する1/f型ゆらぎが療法的効果をもたらしているらしいという説が有力である。

 地球的、あるいは宇宙的規模の物理現象、例えば、気温の長期変動、地球の自転速度の変化、年間の雨量のばらつき、太陽黒点の活動、海の波のリズム、宇宙線の強度変化などにも、1/f型パワースペクトルを示すゆらぎ現象が存在していることが発見されている。近年、それらの大自然にあらかじめ存在している現象の中に生息する生物が、生命を維持していくために活動させている体内臓器、器官の運動にも1/f型ゆらぎが存在していることが発見されるに至り、自然界の物理法則と生体との関わりが論じられるようになった。例えば、心臓の鼓動も速くなったり遅くなったり、不規則にゆらいでいるが、心拍周期の変動を長時間に亘って測定し、そのパワースペクトルを調べると、1/fに近い結果が得られるという。

 そうであれば、クラシック音楽などに内在する1/f型ゆらぎが、大脳の神経細胞に作用して、大脳がその1/fゆらぎに同調するような活動を誘起し、人を心地よい精神状態に導く、と考えるのが自然である。

 しかしながら、1/fゆらぎというものだけにこだわると、雑音でも何でも1/fをもつ現象ならばよいのか、ということになり、音楽がもつ特徴が切り捨てられることになる。また、音楽あるいは1/fゆらぎをもつ音楽を取り込んだ大脳がどのようなプロセスを伴って活動するのかのメカニズムが明らかになっていない。

 音楽心理学あるいは音楽療法の学問的基礎が単に広くゆらぎ現象に適用されるパワースペクトルの計算式で終わってしまうのでは、心もとない。これでは、理屈はどうであれ、音楽が療法的効果をもたらすのならそれでいいではないか、という結果オーライの考えが透けて見える。これでは、音楽療法が先行し、学問的基礎は単なる付け足しの気休めの類となる。それならば、学問の代わりにおまじないの類をもってきてもよいわけだが、おまじないの代わりにもっともらしい数式をもってきた方が音楽療法の信用度が高くなるということか。やはり、音楽療法がもたらす効果はうんぬんという説明のほかに、そのバックグラウンドとなる思想が欲しいのである。

  実は、1960~1980年代に欧米を中心として、科学的方法、特に心理物理学に基づいた音楽心理学や音響心理学が精力的に研究された。この年代では、コンピュータなどの電子機器が実験のためのツールとして手軽に利用できることになったことと、その当時、電子ピアノ、シンセサイザなどの電子楽器やオーディオ機器の開発のためにはこの分野の心理学がほとんど必須と言える程に必要になったためであろう。電子楽器やオーディオ機器もほぼ完成の域に達するとともに、これらの心理学に関する研究も一段落した状態で現在に至っているように見える。

 音楽療法や1/fゆらぎに焦点が当てられたのは、上記年代の後のようであるが、音楽療法だからと言って心理物理学的な基礎を欠くのは、やはり物足りない。そこで、せめてもと思い、以下、音楽がもつ主要な特徴である和音と1/fゆらぎとの関係について考察することにした。科学的事実としては、何も目新しさはないが、和音とは何かを具体例で確認しておくのも将来の進展に向けての第一歩ではなかろうか。

 ピアニストがレの音を弾くと、147ヘルツの周波数をもつ空気の振動を聞くことになるが、実は、これを基音として、その2倍、3倍、4倍、・・・の周波数をもつ振動も合わせて聞いていることになる。そして、レの2倍音は、1オクターブ上のレの基音と合致し、両者はもっとも協和的な音程となる。

 純正律的な音程において、レ-ファ#、レ-ファ、レ-ラ、レ-ソ、レ-シなどは、協和的音程をもつ和音と言われる。そこで、ファの弦の長さをレの弦の長さの5/6にすれば、ファの基音をレの基音の6/5の数比をもつ周波数に設定することができる。また、ファ#の弦の長さをレの弦の長さの4/5にすれば、ファ#の基音をレの基音の5/4の周波数に設定することができる。同様にして、ラ、ソ、シの基音をレの基音のそれぞれ3/2、4/3、5/3の周波数に設定することができる。

 このような設定に基づいて、和音レ-ファ#の間で同一周波数をもつ倍音間の関係を探すと、ファ#の4倍音がレの5倍音に合致することがわかる。また、レ-ファの倍音間では、ファの5倍音がレの6倍音に合致する。レ-ラについては、ラの2倍音がレの3倍音に合致するという強い同期性をもつ。同様にして、レ-ソでは、ソの3倍音がレの4倍音に合致する。また、レ-シでは、シの3倍音がレの5倍音に合致する。

 次に、レ-ファ#-ラのような長3和音についてはどうか。レ-ファ#とレ-ラについての同期性については、すでに調べたから、残るのはファ#-ラ間の同期性についてである。ファ#-ラについて倍音間の関係を探すと、ラの5倍音がファ#の6倍音に合致することがわかる。そうすると、レ-ファ#-ラの間で協和的音程が成立することが確認できる。また、短3和音レ-ファ-ラについても、レ-ファとレ-ラについての同期性は分かったので、残りはファ-ラの同期性である。ファ-ラの倍音関係は、ラの4倍音がファの5倍音に合致することがわかる。そうすると、レ-ファ-ラの間で協和的音程が成立することが確かめられた。同様にして、和音ソ-シ-レについては、ソ-シについての倍音関係を調べると、シの4倍音がソの5倍音に合致することがわかるので、ソ-シ-レの間で協和的音程が成立する。

 それでは、レ-ソ-ラについてはどうか。レ-ソとレ-ラについては強い同期性をもつので、レ-ソ-ラについて協和的音程を期待したくなるが、ソ-ラは2度で隣り合った音程であり、非協和的な音程と言われる。ソ-ラの倍音関係については、ラの8倍音がやっとソの9倍音に合致する同期性しかない。この合致する周波数のパワースペクトルが弱すぎるというよりも、ソ-ラは人間が聴き分け可能な4~6倍音の周波数帯で協和的な音程が成立しないことが不協和音の理由のようである。レ-ラ-シについても、同様の理由で不協和音となる。ラ-シの倍音関係をみると、シの15倍音がやっとラの17倍音に合致する同期性しかない。

 以上の考察をまとめると、複数の音の間で比較的パワースペクトルの強い同一の周波数成分が同期して響くとき、協和的音程となることがわかる。そうであれば、和音と1/fゆらぎとの関係について説明するまでもない。このfとは、少なくとも同期する同一周波数の音響に他ならないのであるから。

 さらに、1/fゆらぎを越えて、音楽がもつメロディ、ダイナミックス、リズムなどの特徴が大脳の中の神経活動のプロセスにどう反映されるのかを明らかにするようなモデルが望まれる。