gooブログはじめました!

写真付きで日記や趣味を書くならgooブログ

具体的な基底画像を構成する

2018-10-28 08:47:15 | ブログ
 8月12日の「線形代数の応用例」というブログの中で、ディスプレイ上に表示される画像について、基底画像というものに言及した。

 例えば画面がn×n画素で構成されるものとする。最も単純な例として、各画素にn^2次元ベクトル空間上の基底ベクトルeijを対応させる。このeijは、(i,j)画素のみが1で、残りの画素がすべて0とする。

 そうすると、たとえば(i,j)画素の濃淡値がfijである全体画像fはベクトルであり、各基底画像fijeijの重ね合わせであるから、
  f=f00e00+f01e01+...+fijeij+...+fn-1,n-1en-1,n-1   (1)
と書ける。

 基底画像の数はn^2枚にもなる。例えば白黒画像の場合、値が1の画素に対応する基底画像のみを残し、値が0の画素に対応する基底画像を削除すれば、データ圧縮が可能になるが、これでは、あたりまえすぎて面白くも何ともない。

 そこで、新たに基底画像を定義して、基底ベクトルの数をn^2個より減らしたい。そうすると、任意の画像fは、次のような基底の重ね合わせとして表せる。
  f=c1e1+c2e2+...+cmem  (2)
ここでm<n^2である。ここで、係数ciはベクトルeiに掛かる重みであり、eiの個々の要素に掛かる数値ではない。

 画像fと基底画像ei(1=<i=<m)の内積をとると、異なる基底画像が互いに直交していれば、
  (f,ei)=ci   (3)
となるので、画像fが上記のように独立した基底画像の一次結合として展開できるとみて間違いない。

 具体的な基底画像の例を示すために、32×32画素で構成される画面を例にとる。

 このとき、次のような構成をもつ基底画像e1~e10を想定する。
 e1:画素位置(0,0)から(15,31)まで+1、(16,0)から(31,31)まで-1の値をとる(横2分割)。
 e2:e1を横4分割し、(0,0)から(7,31)まで+1、(7,0)から(15,31)まで-1の値、(16,0)から(23,31)まで+1、(24,0)から(31,31)まで-1の値をとる。
 e3:e1を横8分割し、上記のように+1帯と-1帯を交互につくる。
 e4:e1を横16分割し、+1帯と-1帯を交互につくる。
 e5:e1を横32分割し、+1帯と-1帯を交互につくる。
 e6:e1を縦2分割し、左半分を+1帯、右半分を-1帯とする。
 e7:e6を縦4分割し、縦方向に+1帯と-1帯を交互につくる。
 e8:e6を縦8分割し、縦方向に+1帯と-1帯を交互につくる。
 e9:e6を縦16分割し、縦方向に+1帯と-1帯を交互につくる。
 e10:e6を縦32分割し、縦方向に+1帯と-1帯を交互につくる。

 ベクトルe1~e10についてeiとejが直交することは、iとjが異なるときeiとejの内積が0になり、iとjが同じとき0でない数になることで確かめられる。

 基底画像e1~e10は、sin関数の正値帯を+1に変更し、負値帯を-1に変更したものと考えることができる。e1~e10の順番は、波長の大きさの順になっている(e1が最大波長、e10が最小波長の関数)。あるいは、基底画像e1~e10は、+1と-1の組をベースとしており、最も簡単なウェーブレットとみなしてもよい。

 ウェーブレットの解説書、特に数学的に厳密な説明がされる文献は難解である。最も簡単なウェーブレットは、+1と-1の組で構成される関数であり、スケーリングによってそのスケールを拡大・縮小できる(e1が最大スケール、e10が最小スケールの関数)。

 なぜこの例のような基底画像を用いるのかという疑問が生じて当然である。人間がつくり出す画像と言っても、それはその根本原理として自然法則に従っているであろう。そうすると、画像はその根底に自然現象にみられる自己相似性という性格を備えているものと仮定できる。言い換えれば、それは、べき乗則に従っているものと考える。そうであれば、その画像に適用可能な最大スケールから最小スケールまでの基底を用意しておけば、その画像を各基底にその重みを掛けたものの一次結合で表現できるであろう、というところか。

 この例に現れる基底を用いて(2)式を書き直すと、
  f=c1e1+c2e2+...+c10e10   (4)
となる。

 画像fが白黒画像とすると、ciはfが基底eiを用いる回数(あるいはeiの重み)とみなすことができる。

 32×32画素で構成される白黒画像として、6×6画素の領域に一つの数字パターンを構成し、このような数字1~9,0,1~6の16個から成る数字の配列を設定した。

 この白黒画像について、c1~c10を計数すると、次のようになる。
  c1:507,c2:495,c3:521,c4:511,c5:491,
  c6:517,c7:483,c8:485,c9:531,c10:517

 この数字を見て、初めて気付いた。テキストのような単純な白黒画像であれば、基底画像の数も少ないし、わざわざ基底画像を持ち出すまでもなく、白画素、黒画素のラン・レングスを計数してデータ圧縮する方式が有効であるということを。カラー画像であれば、画素の濃淡値の変化が多彩であるので、画像fを(2)式のように基底画像の一次結合に展開し、重みの小さい基底の成分を削除することによって、画像圧縮する方式が有効になるだろう。

 テキスト画像、カラー画像ともに、データ圧縮方式は標準化されていて、これ以上深入りしても面白い成果は得られないような気がする。

 今後は、参考文献を参考しながら、「意味のある画像」からなる正規直交基底をつくることによって絵画のような画像を解析できないか検討してみたい。

 参考文献
 金谷健一著「インターネット時代の数学―重ね合わせの原理と応用」(共立出版)
 榊原進著「同上―ウェーブレット」(同上)

年寄になるという幸せ

2018-10-14 08:24:53 | ブログ
 TIME誌に「すばらしいかな、年寄になるという喜び」と題する記事があったので、その要点を紹介するとともに、私のコメントを追記する。

 ある心理学者は、「ある意味において、我々の少青年時代と中年時代は、老人になるという予想外の喜びを得るためのトレーニング期間である」と言う。

 心理学者、人類学者、その他研究者は言う:「老年期とは、概して、悲しみ、恐怖や後悔によってではなく、平穏、感謝の念、および充実感といった言葉で語られるものである。」

 ジョナサン・ラウチは、「幸福曲線」という著書の中で、こう述べている:「人生の満足感あるいは幸福度は、U字形の曲線をたどるようにみえる。すなわち、それは、子供時代と老年期に幸福度のピークをもつ。子供時代には、世界は一つの大きなテーマ・パークである。老年期になると、パークの乗物をすべて乗り尽くしたので、ただ人々が遊ぶ様子を眺めているだけで充分満足である。」

 本来は、経済力、将来性、生産性が人生で最大になる40代、50代で人は最も幸福を感じるべきなのである。しかし、実際にはそうならない。そのような経済力や生産性を維持するには、労働が必要である。しかもそのときこそ、他の圧力―子育て、ローンの支払い、子供の教育費などーも最大となる。40代、50代の生活は活力があって幸せそうに見えるが、体験的には必ずしも幸せではない。

 これから先は、私のコメントとなる。

 このようなU字形の幸福曲線をたどれる人は、理想的であって、好運な人であると思う。

 子供時代に、育児放棄、虐待、悪質ないじめ、性的虐待、セクハラなどを受けた人は、その当時は何をされたか充分理解できないとしても、後年になって、いつまでもトラウマとして心に残るのではなかろうか。

 子供時代には、経験から得る知識が少ないため、何が起こったのか判断できず、外部に助けを求めることができないが、成人した後、世の中の出来事や法律の知識が増えるに従って、子供時代の記憶が蘇るのであろう。テレビのドラマでも、育児放棄、虐待、いじめの場面や、後年になって生じる親子の仲違いの場面がよく出てくる。

 セクハラに関しては、#MeToo運動以来、TIME誌でもこれに関する記事が増えてきた。子供時代に受けたセクハラは、親にも言えず、50代になってその記憶が蘇り、トラウマになるケースが少なくないようだ。こうなると、セクハラ犯罪は、刑法あるいは民法で規定する時効となっているので、時効を過ぎても訴訟できるようにする特例を立法化するか否か議論となっている。ただ、このような特例が法制化されたとしても、犯罪者、被害者ともに事件当時の記憶が薄れているであろうし、目撃者あるいは証人を探すのは容易ではないので、事件の立証は難しいであろう。

 セクハラの記述でだいぶ横道にそれたが、子供時代あるいはその後に受けた上記のような人的被害は老年期になっても心の傷として残るものだろうか。もしそうだとしても、そのトラウマを克服して老年期の喜びを享受することが望まれる。

 少青年期にトラウマとなるような人的被害をほとんど受けていないか老年期に入る前に克服できた人は、理想的な老年期を送れるだろうか。

 老人がその年齢にふさわしい知恵を備えるためには、老年期になる前に総合的な判断を下すに充分な記憶の蓄積が必要である。以前に書いたように、「脳は自分が見たいと思うものしか見ていない」のであり、視覚器官から入力される情報は20%ほどであり、残りの80%は脳内に蓄積されている内部情報である。従って、その場のエビデンスに基づくよりも脳内に記憶されている情報に重みづけするような判断は、妄想に近いものとなる。

 老年期に入っても不平、不満が多いとか切れやすいという人は、それ以前に脳のトレーニングをしていないとか、トレーニング方法に問題があったのではなかろうか。

 このような見解に対して、現代のような変化が激しい時代にあっては、老人が時代についていくのは容易ではない、従って老人の知恵に期待することはできない、むしろ若者のアイデアや行動力に期待したいとする意見があるだろう。

 また、多くの年寄は、寝たきりや認知症など介護の対象になるか、そうならないように自分の身をいたわるのに精一杯で、知恵を備えた老人とは程遠い、という意見もあるだろう。

 しかし、それでもなおかつ、U字形の幸福曲線をたどる人生を理想としたいものである。冒頭の心理学者の言葉を自己流に言い直して、「少青年時代と中年時代は、知恵のある老人になるためのトレーニング期間である」としてもよいと思う。