計算気象予報士の「知のテーパ」

旧名の「こんなの解けるかーっ!?」から改名しました。

ニューロ・モデルの多層化実験

2024年04月24日 | 計算・局地気象分野
 昨年の11月半ばから今年の3月末までの4か月半に渡って「降雪予報」の期間でした。4月に入って新年度を迎えたのと同時に、このシーズンが終わりました。そこで、この1か月弱は「ニューロ・モデルの多層化」について研究を進めておりました。

 ニューロ・モデルの基礎である「ニューラルネットワーク」は、大きく分けて「入力層」「中間層(隠れ層)」「出力層」の3つから構成されます。入力層と出力層は1層ずつ設置されますが、中間層は1層以上を設置します。最も簡単な構造は、中間層を1層とした「3層構造」です。そして、中間層を多数設置したものを「ディープニューラルネットワーク」と言います。



 そして、多層化されたニューロ・モデルの学習プロセスの一例です。この実験は、入力値とそれに対する正しい出力値(正解=教師データ)の組み合わせから成る「訓練データ」を反復学習させるものです。

 入力値を与えると、それに対する出力値を計算します。その出力値と教師データ(正解)の誤差を評価して、モデル内のパラメータを出力側から入力側に向かって段階的に修正(調整)して行きます。このサイクルを何度も繰り返すことで、モデル全体として徐々に最適化が図られるものです。



 実験の詳細は割愛しますが、横軸が反復回数、縦軸が予測誤差です。初めに誤差が低減した後、暫く横ばいの状態が続いています。その後、再び誤差が大きく低減する様子が描かれています。誤差が低減するということは、それだけ学習が進んでいることになります。

 さて、私たち人間も、何らかの知識や技を習得するために、学習や練習を重ねます。しかし、その過程には多くの時間と労力を要し、途中で気持ちが萎えることもあるでしょう。どんなことでも、初めから上手くできる人はいないのです。

 そして、それは人工知能にも同じことが言えます。その割には何かと「人工知能は凄い」と持て囃されます。それでは、人工知能は何が凄いのでしょうか。おそらく「膨大な数の反復練習を、物凄い速さでこなしてしまう」ことにある、と私は考えています。

 周知の通り、機械は疲れや飽きを知りません。しかも、計算処理のスピードは人間のそれを遥かに凌駕しています。従って、「膨大な数の反復練習を、物凄い速さでこなしてしまう」ことが可能なのです。しかし、「初めから上手くできるわけではない」と言う点では人間と同じです。人間と同じようなプロセスと、人間よりも速く・大量にこなすことができるのです。

 また、先のグラフからもわかるように、最初に誤差が低減した後、暫く横ばいの状態が続いています。それはまさに「いくら練習を重ねても、その効果が結果に現れて来ない」状態なのです。そして、その後の「ある段階」で一気に誤差が急落します。これはまさに「それまでの練習の効果が一気に現れた瞬間」と言っても良いでしょう。

 問題は「その効果が現れて来ない」状態が何時まで続くのか、と言うことです。これは正直、わかりません。そして、上記の事は「人間の学習プロセス」についても言える事ではないでしょうか。

 「いくら頑張っても、一向に結果につながらない」と言う経験は、多くの皆さんが共有していることでしょう。試験にせよ、仕事にせよ、「タイムリミット」が存在する以上、「所定の期間内に一定の効果を上げる」ことが求められます。そして、それができなければネガティブに評価されるのが、私たちの社会です。その意味では、「頑張っても芽が出ない」ものを「向いていない」として「損切り」するのも、場合によっては致し方ないでしょう。

 しかしながら、「頑張った効果」それ自体は、しっかりと自分の中に蓄積されているということです。結果として目に見えるまでには至らなかったとしても、もしかしたら「もう少し頑張れば、一気に覚醒できた」のかも知れません。とは言え、それは誰にも判りません。

 私が地域気象の研究を始めてから「一定の形」になるまでを考えても、ざっと10~20年は掛かっています。この間、ニューロ・モデルの研究も2~3回?途中で投げ出しています。それでも、過去に頑張った経験や感覚と言うものは、案外にも残っているものです。その積み重ねで漸くここまで到達できたのです。

 努力の効果が必ずしも「結果」につながるとは限りません。しかし、自分の中には確実に「蓄積」されているのです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

この秋は「学会の秋」

2023年10月04日 | 計算・局地気象分野
 あの「記録的な猛暑」から一気に秋めいてきました。秋になると「あっという間に日が暮れてしまう」様子を「釣瓶落とし」と言いますが、最近は気温についても「釣瓶落とし」の感があります。

 さて、食欲の秋、読書の秋、芸術の秋…など、色々な秋がありますが、私の場合は今年は「学会の秋」となりそうです。10月23日~26日の日程で「日本気象学会2023年度秋季大会」が仙台を会場に開催されます。

 この中の「専門分科会」の一つで「GSM地上を用いた新潟県内における降雪量ニューロ・モデルの開発」と題した発表を予定しております。

 昨年10月の記事「学会誌9月号届く」で述べた通り、学会誌「天気」9月号にて調査ノート「ニューラルネットワークを用いた山形県内の気温および降雪量の予測実験」が掲載されました。これは7年振り・2報目の「ニューラルネットワーク論文」です。

 そこで、このニューロ・モデルによる「山形県」の降雪量予測の手法を「新潟県」にも適用して実験を試みました。その取り組みについて、学会の場で報告します。



 ついでに「仙台」と言えば、銘菓「萩の月」を買うのが定番です。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

波形の重ね合わせ

2023年09月12日 | 計算・局地気象分野
 ニューラルネットワークで多く用いられるシグモイド関数を組み合わせると、三角関数のような波形を作り出すことができます。次の図のように、基準となるシグモイド関数(黒)を、x軸方向に正の方向()と負の方向()にそれぞれ平行移動して、その両者を線形結合(重ね合わせ)することで、新たな単発パルス波形()が得られます。



 さて、「フーリエ級数展開」で知られるように、一般的に「任意の関数は三角関数の線形結合で表現(近似)できる」ので、上記のシグモイド関数()の波形でも同様のことができるかも知れません。そこで、三角関数の波形シグモイド関数の単発パルス波形の重ね合わせにより、それぞれ矩形波の近似関数を作ってみました。


 左が三角関数を5つ重ねた波形、右が単発パルス波形を5つ重ねた波形(シグモイド関数は10個に相当)です。右(シグモイド関数)の場合は、左(三角関数)ほどではないにせよ、それなりに「矩形波」を表現(近似)しています。なお、適用区間は「-2≦x≦2」に限定しています。

 ここで、重ね合わせに用いた波形(成分)を列挙してみましょう。まず、三角関数については、下記の5種類の関数を重ね合わせました。


 続いて、シグモイド関数については、下記の5種類の単発パルス波形を重ね合わせました。



 従って、シグモイド関数を幾つも重ね合わせることで(線形結合)、近似関数を作り出すことができます。

 ニューラルネットワークでは、多くのシグモイド関数を段階的に重ね合わせることで、その関数近似能力を高めているのです。しかも、機械学習のプロセスにおいては、個々のシグモイド関数の重みを「自動的に」調節しているのです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新潟県の冬の気象の数値実験

2023年04月28日 | 計算・局地気象分野
 今回は「新潟県の冬の気象の数値実験」の紹介です。日々の予報業務の合間を縫って、密かに進めていたものです。

 数値モデルは、「山形県の解析」で用いたものを「新潟県仕様」に書き換えたものです。季節風の向き(角度)や強さ(フルード数)を変えながら、相対的な降水量の分布を計算しました。この結果、佐渡島や能登半島に伴う島影効果に加えて、季節風の向きや強弱と降雪域の位置の関係も現れました。





 今後は日本海上に収束域が形成された場合についてもトライしたいです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

数理モデルによる予測と予報

2020年12月11日 | 計算・局地気象分野
 数理モデルは、対象となる現象に対する「構築者の世界観の一つの表現」であり、その構築過程により大きく2種類に分けることができます。

・多くのデータを元に統計的手法で導かれる帰納的なもの(例・線形重回帰分析や機械学習)
・基本法則から出発し数学的手法で導かれる演繹的なもの(例・熱流体数値モデル)

 シミュレーションの結果は、それ単体ではあくまで「理論的な根拠に基づく推論・仮説」です。さらに「実験・観測による実証」が揃ってはじめて真実として認知されます。しかし、不確実性を伴う将来を対象とした予測として用いる場合は、発生し得る事態を事前に把握し、個々に備えた対応策を議論することができます。その意味では「リスクマネジメント」としての意義は大きいものです。

 また、数理モデルを構築し、そのモデルを基に将来に関する仮説・推論を導き出すのは科学や技術のフィールドです。一方、その予測を基に将来の様々な事態を想定し、事前に対応策を用意するのは経営や政治のフィールドです。両者のコミュニケーションを通じて「将来を想定し、予め備える」心構えが大切です。

 さらに「予測」と「予報」は似て非なるものです。予測とは「確かな根拠を基に将来に関する仮説・推論を導き出すこと」であり、予報とは「仮説・推論を基に将来の可能性を予想し、伝えるべき事項を決断すること」です。

 そうであれば、予測の機械化が進んでも、最後の決断は人間に委ねられます。決断には責任を伴うものであり、機械には出来ないことなのです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

半径方向に温度勾配を持つ回転二重円筒内の熱流動の解析

2020年08月25日 | 計算・局地気象分野
 8年前に「円筒座標系の熱流体方程式と熱ロスビー波」という記事を掲載しました。今回はこの記事の続報になります。前回は数値計算のプログラムをFortranで作成しましたが、今回はこのプログラムをC#に移植して数値実験を行いました。

 さて、傾圧不安定波を実験で再現する取り組みとしては、回転水槽を用いた研究が有名です。一般的な回転水槽のイメージを次の図に示します。


 これは(北極に見立てた)中心部を氷等で冷やす一方、(赤道に見立てた)外側から加熱された(中緯度地方に見立てた)回転二重円筒間の流れを観察するものです。この時、実験装置全体は一定の各速度で回転しています。半径方向の温度勾配や回転速度(角速度)に応じて、流れの様子が変化(波動の形成される様子)します。

 これに対して、私が開発している数値モデルのイメージは次の図のようなものです。


 半径方向に温度勾配を与えられながら、一定の回転角速度で回転し続ける二重円筒形状容器を考え、その内部に充填された試験流体(気体)の熱流動を考えます。

 ここで、作動流体を「水」ではなく「気体」としたのは、これまで局地風のような気流の数値シミュレーションを扱ってきたので、その延長上の取り組みであるためです。実は、閉鎖空間の中に充填させると考えた方がモデルを組みやすいのです。

 初期条件と境界条件は過去の記事と同様です。


 初期条件としては、内側半分の温度をTC、外側半分の温度をTHとし、速度分布は壁面上を0、半径方向の中心を極大とする放物状としました。また、境界条件としては、壁の両側では摩擦により速度は0とし、温度はTHまたはTCに等しいものとしました。

 数値シミュレーションに際して見るべき箇所は次の図のように4つの断面を設定しました。

 今回は、上層(Z=0.9Δr)と下層(Z=0.1Δr)の温度分布、および中層付近(Z=0.6Δr,Z=0.4Δr)の速度の鉛直成分を見ることにしました。

 それでは、数値シミュレーションの結果の一例を次の図に示します。



 左側は温度分布(赤・高温、青・低温)、右側は鉛直速度(赤・上昇流、青・下降流)です。また、上の段は上層側、下の段は下層側です。

 温度分布をみると、上層・下層共に3つの波動が形成されています。また、互いに位相がずれて様子が見られます。鉛直速度を見ると、温度分布で見られた波動に伴って上下に動く様子が現れています。上層と下層で上昇流と下降流が互いに逆転しつつ、その位置(位相)が互いにずれている様子も見られます。

 パラメータの条件を変えることで、色々な波動の様子やその鉛直構造を解析することができそうです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

山越え気流の2次元解析

2018年10月25日 | 計算・局地気象分野
 今から7年前に「山越え気流の解析モデル」と言う記事を掲載しました。局地気象の特性を把握するためには、地形の影響を理解する必要があります。この出発点となるのが山岳地形を乗り越える気流の解析(山越え気流)です。そこで今回は、2次元の熱流体数値シミュレーションを用いて、この問題にアプローチしてみました。

第1図・山越え気流の解析モデル

 第1図は、山越え気流の理論解析に用いられる古典的な解析モデルです。

 まず、三角形状の山を中心にその周辺の大気を二層構造と仮定します。ここで、上下層の境界面を自由表面と呼びます。また、下層の温位(ポテンシャル温度)をθ0[K]、上層の温位を少し高めのθ0+Δθ[K]と設定すると、自由表面は逆転層に相当します。

 さらに、左側面から速度U0[m/s]の一様な風が流入するという条件を付加します。ここで、重力加速度をg[m/s2]、自由表面の高さH0[m]とすると(図では省略)、フルード数Frが定まります(※)。速い流れの場合ではFrは大きな値となる一方、遅い流れの場合ではFrは小さな値となります。

(※) Fr = U0 / { g (Δθ / θ0 ) H0 } 0.5

 今回は、自由表面の高さとフルード数の条件を変化させて、山を乗り越える2次元流れの解析を試みました。

第2図・自由表面の設定(上段:High,中段:Middle,下段:Low)

 第2図は、3種類の高さの自由表面です。

 上段は山頂の2倍(High)に設定しています。様々な文献や書籍で見る山越え気流の図も、概ねこのようなイメージで描かれているものを多く見かけます。中段は山頂と同じ高さ(Middle)に設定しています。さらに、下段は山頂の半分の高さ(Low)に設定しています。逆転層が山頂より低い場合などを想定しています。

 また、フルード数Frは、Fr=0.3, Fr=0.6, Fr=0.9の3つの場合を設定しました。この時、レイノルズ数Reは一貫して、Re=1.02×103を用いています。

 以上の条件を基に数値シミュレーションを行いました。ここで、今回使用した数値計算のスキームは次の通りです。

・対 流 項:3次精度風上差分(UTOPIA)
・拡 散 項:2次精度中央差分
・時間発展:2次精度Adams-Bashforth法
・圧力解法:MAC(Marker And Cell)法

第3図・計算結果(Fr=0.3の場合 上段:High,中段:Middle,下段:Low)

 第3図は、フルード数Fr=0.3の場合の計算結果です。3種類のフルード数の中では最も「遅い流れ」に相当します。また、図中の黒い帯状の領域は自由表面に相当します。

 自由表面の高さで比較すると、Highの場合には、風下側の斜面上で剥離が生じ、時計回りの渦(鉛直循環)が形成されています。この渦の真上では、風速が部分的に増しています。また、その上空では自由表面が部分的に陥没していますが、概ね水平の状態を保っています。

 Middleの場合は、風下側の斜面上に渦は形成されないものの、部分的に風速が増しています。しかし、風下側の麓では風は弱くなっています。その上空の自由表面は、山の風下側で少し波を打ち始めています。

 Lowの場合には、風上側の斜面上で時計回りの渦が形成される一方、風下側の斜面上では部分的に風速が増しています。その上空の自由表面は、山頂から風下側で少し波を打ち始めていますが、概ね水平の状態を保っています。

第4図・計算結果(Fr=0.6の場合 上段:High,中段:Middle,下段:Low)

 第4図は、フルード数Fr=0.6の場合の計算結果です。3種類のフルード数の中では「やや速い流れ」に相当します。

 自由表面の高さで比較すると、Highの場合には、風下側の斜面上で剥離が生じ、時計回りの渦が形成されています。この渦の真上では風速が部分的に増しており、地上に向かって強い風が吹き下ろすような形になっています。上空の自由表面は、山頂より風上側では水平を保つ一方、山頂より風下側では波を打っています。

 Middleの場合は、風上側の斜面上で風速が増して、自由表面を押し上げて山頂を乗り越える様子が解析されています。この結果、風下側の斜面上で剥離が生じ、薄いながらも時計回りの渦が形成されています。この渦の真上では風速が部分的に増しており、地上に向かって強い風が吹き下ろす形になっています。また、上空の自由表面は、山頂より風上側では水平を保つ一方、山頂より風下側では地上に打ち付けるような波を形成しています。

 Lowの場合も同様に、風上側の斜面上で風速が増して、自由表面を押し上げて山頂を乗り越えています。この結果、風下側の斜面上で剥離が生じています。この様子は自由表面の形状にも反映されています。また、自由表面は風下側では地上に打ち付けられるような激しい波となっています。

第5図・計算結果(Fr=0.9の場合 上段:High,中段:Middle,下段:Low)

 第5図は、フルード数Fr=0.9の場合の計算結果です。3種類のフルード数の中では最も「速い流れ」に相当します。

 主な流れの特徴は先の第4図(Fr=0.6)と同じですが、山頂より風下側の自由表面の波動、およびHighとMiddleの風下側の斜面上における渦が顕著になっています。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

冬季降水量のニューロ・モデル解析

2017年10月25日 | 計算・局地気象分野
 天候デリバティブと並行して独自に研究を進めているのが、ニューラルネットワークを用いた降水域分布の解析です。もともと、情報工学におけるニューラルネットワークでは入力・出力共に「0と1からなる信号」を想定しています。

 しかし、気象のパラメータは連続的に変動するため(アナログ)、0か1か(デジタル)で表現する情報とは性格が異なります。このため、入力・出力のパラメータをどのように扱うか、などの課題がありました。約10年に渡る試行錯誤を経て、一つの成果を上げるに至りました。次の図は計算の概要です。


 今回は、降水量に相当する「相対降水量」の算出方法を変更して解析を試みました。今回の相対降水量は、平均レベルが0、平均より多い場合は正の値、平均よりも少ない場合は負の値となります。


 こちらは山形県の場合です。左側は季節風の弱い場合の相対降水量の分布、右側は季節風が強い場合の相対降水量の分布です。

 相対降水量が0以上の領域を「降水域」として注目してみると、季節風が弱い場合は海側を中心に広がる一方、季節風が強くなるにつれて内陸側に進入する傾向が再現されています。この傾向は、3次元熱流体数値モデルによる山形県内の降雪域形成シミュレーションの結果と一致しています。


 続いてこちらは新潟県の場合です。左側は季節風の弱い場合の相対降水量の分布、右側は季節風が強い場合の相対降水量の分布です。季節風が弱い場合は平野部を中心に広がる一方、季節風が強くなるにつれて山間部中心に偏る傾向が再現されました。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

佐渡地方を取り巻く流れの数値シミュレーション(2)

2017年07月28日 | 計算・局地気象分野
 昨日の記事の続きです。

 新潟県の佐渡島の周囲を取り巻く流れの数値シミュレーションの結果について、昨日は風速ベクトルの分布で表示しましたが、今回は風速(スカラー)でカラー表示してみました。

 基準風速を1.0とした場合の相対値で評価するものとし、0.0を青、2.0を赤で対応させています。

(1)西北西の一様流を与えた場合

(2)西の一様流を与えた場合

(3)西南西の一様流を与えた場合
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

佐渡地方を取り巻く流れの数値シミュレーション

2017年07月27日 | 計算・局地気象分野
 久々の更新となります。
 今回は、新潟県の佐渡島の周囲を取り巻く流れの数値シミュレーション(LES)を試みました。

 対象領域は、北緯:37.6333°~38.4583°、東経:137.7750°~139.0125°の約100km×100kmと設定しました。なお、数値計算は水平方向:約1km×1kmメッシュで実施しておりますが、風ベクトルは約2km×2km間隔に間引いております。

 今回は、(1)西北西の一様流を与えた場合(2)西の一様流を与えた場合(3)西南西の一様流を与えた場合について数値シミュレーションを実施しました。アニメーションGIFで表示してみると、島の下流側で渦が形成される様子が判ります。

(1)西北西の一様流を与えた場合

(2)西の一様流を与えた場合

(3)西南西の一様流を与えた場合
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

オンライン「天気」にて公開されました。

2015年10月25日 | 計算・局地気象分野
 10月03日の記事で御報告しました日本気象学会・機関誌「天気」掲載の「ニューラルネットワークによるサクラ開花日の学習・予測実験(山形・新潟を例に)」がオンライン公開されました(←タイトルに直リンクを貼ってます)。

 以前は学会誌掲載後1~2か月程経ってからのオンライン公開だったのですが、今回は1ヶ月以内に公開されました。最近はホントに早くなりました。

 これまでは3次元熱流体数値モデルによる計算気象シミュレーションや観測データの分析による局地気象特性の解明が主なテーマでしたが、今回は新たに人工知能(ニューラルネットワーク)を用いたアプローチがテーマとなっています。単にニューラルネットワークを用いるのみならず、線形重回帰分析を用いた場合との比較も試みています。

 そして、11月のはじめには、また話題提供の予定があるので、その準備も進めています。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「ニューラルネットワーク」とは何か?

2015年09月13日 | 計算・局地気象分野

 私たちの思考や感性を司るは全体で千数百億個もの「神経細胞(生体ニューロン)」から構成されています。人間の感性を数値化する必要があります。この理論の出発点は神経細胞を数理モデル化した人工ニューロン・モデルであり、究極的には脳の機能をコンピュータ上にモデルとして再現しようとしているものです。

 そもそも生体ニューロンは、その本体となる細胞体、入力インターフェースである樹状突起、内部中枢となる、出力インターフェースである軸索、そして生体ニューロン間のインターフェースを担うシナプス等から構成されています。

 生体ニューロン間の信号伝達のプロセスは、(1)前段のニューロンのシナプスから発せられたパルス樹状突起で受ける、(2)パルスの持つ電気によって細胞体の膜電位が上昇する、(3)膜電位がその生体ニューロン特有の閾値電圧を超えると細胞体内部で新たなパルスが発生する、(4)このパルスが軸索を通じて出力される、(5)シナプスを通じて後段の生体ニューロンに向けて放射される、というものです。

 この生体ニューロンの機能を模式的に表現したものが次の図に示すモデルです。これを人工ニューロンと言います。一般的には「人工」を省略して「ニューロン」と呼んでいます。


 細胞体に相当するユニットを中心に、樹状突起に相当する入力、シナプスに相当する結合荷重、軸索に相当する出力から構成されます。前段の人工ニューロンから出力される多くの信号が、この人工ニューロンに入力されます。これらの入力値は各々、結合荷重に応じて重み付けられてユニット内で数的処理が行われます。その結果となる値が、後段の人工ニューロンに向けて出力されます。

 続いて、この人工ニューロンの数式化を考えます。次に示すように入力をx1~xn、線形結合をw1~wn、閾値をθ、出力をyとします。


 また、入力信号と線形荷重の積の総和をネット値と呼びます。ニューロンの膜電位が閾値電圧を超えるとパルスを発生する現象を、モデル上はネット値が閾値を超える場合にy=1が出力される事で表現します。ここでシグモイド関数が登場します。


 このようなニューロンのモデルを幾つもつなげてネットワーク状に接続した構造を、(人工)ニューラルネットワークと言います。脳の構造を単純化して、その機能のモデリングを図ったもので、様々な分野におけるパターン学習による推定という形での応用が可能です。


 ニューラルネットワークは、入力変数と出力変数のデータベースを学習することで、入出力関係を再現するモデルとして最適化が可能です。

 この学習の流れは、(1)入力値をニューラルネットワークに与える、(2)その入力値を基にニューラルネットワークが予測値を計算する、(3)予測値と教師データ(正解値)を比較して誤差を評価する、(4)得られた誤差を基に、ニューラルネットワーク内の結合荷重(シナプス係数)の値を逐次修正する、というプロセスを繰り返すものです。このプロセスを繰り返すことにより、ニューラルネットワーク全体としての最適化が図られていきます。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ニューラルネットワークを学ぶことは、人間の「学習」を学ぶことに通ず

2015年06月22日 | 計算・局地気象分野
 ニューラルネットワークは、もともと脳の構成する神経細胞の機能を真似した数式の集合体で、要は脳の機能を数式モデル(ニューロモデル)で表現しようとしたものです。詳しいことはこちらの記事にて解説しています。

 さて、ニューロモデルが学習を行う場合は、例えば入力値に対して得られた出力値と、本来得られるべき正解値(教師信号)を比較して、その誤差をより前段のニューロンに順次伝播し、各ニューロンに設置されたシナプスはそのパラメータの値を自動的に調節していきます。このプロセスを繰り返すことで、段々とニューロモデル全体としての最適化が図られていきます。

 ニューラルネットワークの勉強していて思うのは、「人の学習というのも、そういうものかも知れないな・・・」ということです。

 新しい事をやろうとしても、初めから上手くいくということは、そうそうあるものではありません。何度も繰り返し練習するなり、試行錯誤を繰り返して、段々と身についていくものです。このプロセスの中で、私たちの脳も徐々に最適化を図っているのだ、と理解することができます。

 そう考えると、失敗は必ずしも悪いことではなく、あくまで脳の最適化のプロセスの最中にあるのだと考えることもできるのです。

 上達の早い遅いというものも、結局は脳の中のシナプスのパラメータの情報がお互いに違っていることの現れに過ぎないのです。シナプスのパラメータの情報は、それまでの経験や勉強などいろいろな形での「学習」によって形作られるわけなので、人それぞれです
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ニューラルネットワークと重回帰分析

2015年06月21日 | 計算・局地気象分野
 ニューラルネットワークと重回帰分析を比較してみると・・・説明変数と目的変数の数が少ない場合は、どちらを用いても良いのですが、(a)説明変数や目的変数の数が膨大になるケースや、(b)分析に用いるデータベースが頻繁に更新される場合は、ニューラルネットワークの方が使いやすいのかも知れません。要は、予測モデル式のメンテナンスが容易ということです。

 そもそも、重回帰分析から得られる回帰式は計算式ですが、ニューラルネットワークもまた膨大な数の計算式の集合体です。

 (a)説明変数や目的変数の数が膨大になると、目的変数の数だけ重回帰分析を行う必要があり、一つの重回帰分析に用いる説明変数が多くなると、なかなか面倒です。かつて説明変数が30種類近い重回帰式を100本近く、エクセルで、手動でちまちまと作成したことがありますが、ハッキリ言ってしんどい作業でした。

 これに対して、ニューラルネットワークは入力層と出力層のニューロン数を、各々、説明変数と目的変数の数に対応させ、後はデータを学習させれば良いのです。学習が進むにつれて、ニューラルネットワークは自動的に、説明変数と目的変数に最適化されていきます。

 (b)分析に用いるデータベースが頻繁に更新される場合、重回帰分析の式はその都度、重回帰分析を行って回帰式(計算式)のアップデートを行う必要があります。

 これに対して、ニューラルネットワークは、既にある状態のまま、新たに更新されたデータベースを追加学習してゆけば良いのです。こちらでわざわざ式を作り直す必要がありません。要は、ニューラルネットワークが勝手に学習して、自らを最適化してしまうのです。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

久々にニューロ・モデルの実験に取り組む

2015年06月18日 | 計算・局地気象分野
 今日は久々にニューラルネットワークの実験に明け暮れました。


 現在考えているのは、入力層・中間層・出力層の3層からなるフィードフォワード型のニューラルネットワーク構造を持つ「ニューロ・モデル」を構築し、その入力層と出力層にレベル変換モジュールを設けています。この変換モジュールの機能を表す数式を(1)式と(2)式として表記しています。


 一気に実験を進めて、早くもその結果の取りまとめに掛かっています。課題は多いですが、ようやくニューロ・モデルとの付き合い方が、少しずつ判ってきました。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする