まるを認識することをもう一度整理してみます
図形の認識は,
1)CCDカメラの画素の2次元配列として入力されるとします
2)いびつな円であったり,その直径も違うもの入力されます
3)2次元配列としては,簡単のため,1か0という二値で記録されます
4)円の中心(重心)は画素画面の任意の位置にあります
という条件にて物理的な入力となります
それを丸であることを認識するために,学習させることを考えます
まず,丸であるか三角であるか四角であるかを学習させます.
ニューラルネットの手法により学習できるかどうか
これを学習していきます.
ニューラルネットワークは隠れ層を含んだ3層構造でまず考えます.
つまり,入力層が任意の二次元配列の0か1の入力になります
中間層があり,出力層として,丸,三角,四角の出力をするようにします.
これで学習をさせて,そのニューラルネットがどんな挙動を示すかということになります.
ここまでが最初の課題となります.
ただし,これは教科書レベルの単純な課題です.この単純な課題をベースに,脳科学による知見を取り入れたモデルを付け加えて検討していきます.
それは
1)身体性
つまり,まるを視覚で追いかける運動機能をどのようにモデルとして入れ込むか
2)環境性
これは,単純な認識に環境性ということをどのように入れるかはもう少し考えないといけないところです
3)感情
例えば,まるを見ると喜ぶ,うれしいというような感情をどうモデルにしていくか
4)記憶
記憶は,とくに短期と長期の記憶の関わりをどうするか
5)言語
これは記号,抽象化の問題で,トップダウンにまるを認識する時に必要になるモデルで,例えば,まるの一部が何かに遮られていたときに,まるを認識する過程で関与する問題.また,記号化はもう少し高次の問題となる
などなど,脳の情報処理モデルとしての道のりは果てしないのです
しかし,まず最初の課題である,単純なモデルを学習していこうと思います.
図形の認識は,
1)CCDカメラの画素の2次元配列として入力されるとします
2)いびつな円であったり,その直径も違うもの入力されます
3)2次元配列としては,簡単のため,1か0という二値で記録されます
4)円の中心(重心)は画素画面の任意の位置にあります
という条件にて物理的な入力となります
それを丸であることを認識するために,学習させることを考えます
まず,丸であるか三角であるか四角であるかを学習させます.
ニューラルネットの手法により学習できるかどうか
これを学習していきます.
ニューラルネットワークは隠れ層を含んだ3層構造でまず考えます.
つまり,入力層が任意の二次元配列の0か1の入力になります
中間層があり,出力層として,丸,三角,四角の出力をするようにします.
これで学習をさせて,そのニューラルネットがどんな挙動を示すかということになります.
ここまでが最初の課題となります.
ただし,これは教科書レベルの単純な課題です.この単純な課題をベースに,脳科学による知見を取り入れたモデルを付け加えて検討していきます.
それは
1)身体性
つまり,まるを視覚で追いかける運動機能をどのようにモデルとして入れ込むか
2)環境性
これは,単純な認識に環境性ということをどのように入れるかはもう少し考えないといけないところです
3)感情
例えば,まるを見ると喜ぶ,うれしいというような感情をどうモデルにしていくか
4)記憶
記憶は,とくに短期と長期の記憶の関わりをどうするか
5)言語
これは記号,抽象化の問題で,トップダウンにまるを認識する時に必要になるモデルで,例えば,まるの一部が何かに遮られていたときに,まるを認識する過程で関与する問題.また,記号化はもう少し高次の問題となる
などなど,脳の情報処理モデルとしての道のりは果てしないのです
しかし,まず最初の課題である,単純なモデルを学習していこうと思います.
※コメント投稿者のブログIDはブログ作成者のみに通知されます