公開相談(with ゆーすけさん)

( ゜д゜) 皆さんの前にさらけ出して下さい!(笑

質問者「ゆーすけ」さんからの相談スレッドです.質問者さんは,この文章に対してコメントお願いします.
コメント ( 3 ) | Trackback ( 0 )

雪本さんの統計教育観

( ゜д゜) 有意性

bobさんのここの記事を読んで,ふと思ったこと.

このblogのメインは何かというと,統計法教育であると主張することは問題ないと思います.統計法「教育」の難しいところは,如何にして学習者に効果的・適切な統計的知識・技法の習熟をサポートするかにつきます.

僕の立場は「ある程度の体系的な最終目標を想定し,段階を踏んで学習を進めるべし」というものです.なので,必ずしも初学者に最新版の統計学知識を教える必要はないと思っています.
blogでは,どのようにしてその統計的道具が誕生したからを,なるべく歴史性を踏まえて説明しています.その方が,問題意識が明確になるからです.

さて,統計の有意性検定に対する態度です.
確かに有意性検定一辺倒の態度は正しくない……と,今では納得できるでしょう.「一つの立場に固執するのはよろしくない」という一般的な意見からも納得できるでしょう.

しかし,それは,今の状況から見たからこそです.
逆に問いましょう.なぜ昔は,有意性検定主流だったのでしょうか? ここで単純に「昔の人は頭が固かったから」なんていうのはやめましょう.当時,有意性検定が支持されているのは,そのような時代背景があったから……と考えるのが自然です.

科学とは,直線上に発展しているわけでもなく,その時代に独特の性質の影響を受けながら構築されているわけです.
僕が考える「時代性を意識した統計教育」とは,今の立場から「昔の人はおろかだったのだなぁ」という見下したものではなく,「昔の人は,○○という部分に焦点を当てていたため△△という方法を主に採用していたのだ」という,相対化して歴史を説明することを意味しています.

(´-`).。oO(無駄に熱い)
コメント ( 3 ) | Trackback ( 0 )

固有値問題II

( ゜д゜) 固いですか?

前回に続いて固有値問題。多変量解析の計算式として「固有値問題」というものが絡んでいますが,やはり固有値問題と多変量解析とは直接関係がないものと理解するのが良いようです。

すなわち,多変量解析とは,実際のデータと,分析者が想定するモデルから導かれる予測データとのズレを最小にするためのパラメーターを算出する分析道具であると割り切るべきなのでしょう。

この最小にする方法としてどのような基準を使うかによって,色々な推定法-主因子法,最小二乗法,最尤法など細々と分類できるようです。

最小二乗法が最もシンプルに考えるものですが,昔はこれを素直に計算するにはあまりにも面倒だった。そこで,別アイデアを用いることで計算を楽にしようとしたわけです。そのアイデアとは固有値問題です。多変量解析とは全く別に,線形代数学には固有値問題という有名な問題というか,考え方,というか計算公式があったようです。
んで,この固有値問題については,かなり計算手順が確立されており,比較的容易に計算することができる。【つまり,ズレの最小化問題を,計算式を式変換することで,何とか固有値問題にすることができれば】,後はこれまで蓄積された解法により多変量解析を使うことができる……

このように「多変量解析≒固有値&固有ベクトルに関する計算」というイメージがあるのは,多変量解析を考えた人が,計算が容易な固有値問題に還元したためだからです。

ん? ならば,多変量解析とは固有値問題を使わなくとも解けるということになるのか?

そうです。解けます。例えば,主成分分析とか,因子分析とかは,固有値という数値を算出するのが普通だというイメージがある多変量解析の道具ですが,これらは固有値&固有ベクトルというものを求めなくとも計算することができます。

というわけらしいです。
コメント ( 0 ) | Trackback ( 0 )

固有値問題

( ゜д゜) 長い列ができましたっ!

多変量解析を真面目に勉強しようとなると,どうしても「行列」という数学の道具を勉強しなければなりません。最近の統計法学習においては,コンピュータに計算任せができるので,計算式なんか知らなくてもいいもん! と開き直ることができますが,極めようとすると行列などの線形代数学を勉強しなければならないようです。

( ゜д゜) 難しいー

んで,なくなく,勉強している雪本さんなわけですが。
多変量解析では,行列に関する用語として「固有値」なるものがでてきます。主成分分析とか,因子分析とか,正準相関分析とか,結構色々なものに固有値という情報が算出されます。

これって何でしょう?

行列の教科書を見てみますと,固有値問題の説明ページがあります。
雪本的には「行列を単純なスカラー値に変換する作業」に関する問題だと理解しています。んーと,要するに情報の圧縮に関するものだとご理解下さい(それでも意味不明)。

ただ……前回の投稿において,「固有値を求める主因子法は,実際のデータと予測されるデータのズレを最小にする最小二乗法の,近似解だ」と述べました。つか,そういう風に教科書に書いているわけです。

すると,主因子法と最小二乗法とは関連があるわけで,主因子法で求められる固有値というのも最小二乗法と関連があるはずですね?
で,あれこれ調べてみたのですが,どうやら,固有値問題というものは非常に抽象度が高い問題であって,より個々具体的な応用例に適用されるみたいです。例えば,「何かの数式の最小値・最大値を求める計算式」を式変形すると「固有値問題」になるなど……

すなわち,固有値というのは,何かを最小にしたい場合に関連する数値だったりするわけです(固有値が最小二乗値であり,固有値に関する固有ベクトルがその最小二乗を成立させるような解,だとか?)。

そんな感じで,固有値というのは最小二乗に関連するみたいのようです。


たぶん

(´-`).。oO(まだ自信持ってないのでよくわかりませんがに)
コメント ( 0 ) | Trackback ( 0 )

各種のパラメータ推定法

( ゜д゜) にゃうーん(意味なし)

多変量解析におけるパラメータの推定法について,因子分析などを使われている方はちっと悩みどころでしょうね.

因子分析では共通性の推定法という作業を必要とします.共通性とは因子分析におけるパラメーターの一種なのですが,このパラメーターを推定する方法として幾種類かあります.

統計学というものが,始めに記述統計学,その後に推測統計学というように「記述→推測」という順番に発展していることは,統計学の教科書を読んだことがある人はご存知の通り.

パラメータ推定法についても,記述重視の立場と推測重視の立場の二種類があります.
最初に登場したものは当然記述重視の立場です.この立場は,与えられたデータを効率よく記述しようとする立場のことであり,その結果求められたパラメータ推定値が【統計的に有意であるかどうか】などの推測統計的観点は問題となりません.効率よく記述する方として,(1)主因子法と(2)最小二乗法があります.

(1)主因子法
 簡略版の因子分析プログラムなどに搭載されている,一昔前の代表的な推定法.与えられたデータについて,情報量(固有値)を最大限にするように,データ記述を再構成したものです.主因子法には,細かく,(a)主成分法:対角要素を「1」とする,(b)対角要素を最大の相関係数とする,(c)対角要素を十相関係数を利用するもの,と分かれますが,「反復計算」をさせるのならば,初期値にあまり意味はありません.
 なお,十分な反復計算が行われる場合には,主因子法の計算結果は,次の(2)[重み無し]最小二乗法と同じ結果を導きます.この意味では,主因子法とは,記述系の代表格である最小二乗法の近似計算法と見なせるでしょう.

(2)最小二乗法
 実際に観測されたデータの共分散(相関係数)行列情報と,仮定したモデルから導かれる共分散(相関係数)行列情報とのズレ(の二乗)を最小にするような,パラメータを推定するもの.発想としては納得しやすい.ただし記述系であるために,導かれた結果が統計的検定をすることが必ずできない.
 最小二乗法にも細かく分けると幾つかの種類があるが,代表的なものとして(a)重み無し最小二乗法,(b)尺度不変最小二乗法,(c)一般化最小二乗法がある.最もシンプルなのが(a)だが,(a)は「データの単位の影響が大きい」と「有意性検定を行えるような統計量を導かない」という問題点があります(後者については,そもそも有意性検定を想定しないのだから当たり前なのだが).ひとまずデータの単位の影響を受けないように解消したものとして(b)が開発されました.ただし(b)は有意性検定は不可なので,この点を改良したものが(c)です.
 ただし,本来,記述重視の推定法であるものに,無理矢理有意性検定などの推測能力を付与させたわけなので,(c)を使用する際には注意が必要となります.すなわち「多変量正規分布を仮定する」というものです.

一般化最小二乗法というもので記述系の推定法はある意味ピークを迎えるわけですが,どうせならば,最初から有意性検定を考慮した推測重視の推定法を開発しようという発想が出てきます.これが(3)最尤法です.

(3)最尤法
 母集団の分布を仮定して,有意性検定を行うことを前提にした推定法.推測重視の現代の統計学では,最も優れている推定法.ただし,有意性検定を行うことを前提にしているので,最初からデータに対する要請も多く,「データは多変量正規分布」「ある程度のデータ数」を必要とする.

(´-`).。oO(たくさんありますがに)
コメント ( 0 ) | Trackback ( 0 )

共分散構造分析

( ゜д゜) ふらふらー

ただ今,共分散構造分析を勉強中。
雪本さん的には「多変量解析の王様」と位置づけておりますので,従来の多変量解析である重回帰分析やら因子分析などを包括したものだという点を強調して学習を進めております。

んで,この共分散構造分析なるものは,それまでの多変量解析における「計算式の制約」を自在にいじくるものなので,共分散構造分析をきちんと理解するためには,数式展開で学習しなければならないなぁ,と痛感しております。

んで,数式展開などを学習中……正直涙が出そうです(T_T)

ひとまず,「RAM構造による数式表現」で学習を進めて,とっかかりはつかんだ感じではありますが……

ふぅ……大変です。
コメント ( 0 ) | Trackback ( 0 )

社会集団のAGIL機能

( ゜д゜) 階段を歩いて息切れ

んで。なんとなくパーソンズのAGIL図式について。

社会学とは,社会を調べる学問となるわけですが,パーソンズという人は社会システムを認識する抽象的な道具を開発してくれました。この認識道具がなかなかの優れもので,応用範囲が広かったらしく,一時期は統一理論として普及していたそうです。

ただし,道具というのは須く適用範囲があって,使用上の注意を守らなければなりません。あまり便利だからといって,本来その道具が想定していない対象についても,強引に使うのはよろしくないわけです。
このAGIL図式は,均衡的社会を想定した場合,いわば比較的短いスパンの社会システムを認識する道具としては良いわけですが,長期的な社会システムに適用しようとする,ダイナミクス的な社会メカニズムを捉えられないわけです。まあ,そんなところから,この認識道具に対する批判が出たりするわけですな。

とはいえ,比較的静的な社会集団を認識する道具としてはまだまだ有効ではないかと考えています。

んで,そのAGIL図式というのは何でしょうか?

社会集団には主要な機能があるとパーソンズは考えたわけです。機能なので,集団の大きさとか,そういうのは無視しています。また,あくまでもその集団を一つのシステムとして捉えるので,その集団の所属メンバー個々人に注目するわけではありません。

その主要な機能というのがAGILなのです。これは英単語の頭文字を取っています(集団がどのようなものなのかを考えながら機能を説明します)。

集団というものは,その「集団たらしめる何か」雰囲気というかパターン(○○らしさ)があるわけです。この「○○らしさ」があるからこそ所属メンバーが変化しても,集団だと認識できるわけです。このような「○○らしさ」を作って,維持する機能が【L(潜在性/パターン維持)機能】です。

(´-`).。oO(集団内部の教育的機能)

ただし,このような「○○らしさ」があるからといって集団は保たれるわけではないです。例えば僕たちは「日本人社会集団」に所属しており,「日本人らしさ」を教育されています。しかし,人には個性がありますから,そのような教育に比較的素直な反応を示す人がいれば,反発をする人もいます。ましてや「同じ日本人だから……」という雰囲気で,対人関係がスムーズにいくわけではありませんよね? 当然集団内部を調整する機能が必要になります。これが【I(統合)機能】です。

(´-`).。oO(集団内部を統制する司法機能)

さて,そんな「そこそこまとまっている集団」は,その集団単独で存在しているわけではありません。他にも集団があり,それらを含めた外部状況の中にいるわけです。すると,その外部状況の中で何かの役割を果たすことになります。何かの目標を設定して,その目標を達成しようとするわけです。この目標達成機能が【G機能】です。

(´-`).。oO(集団外部に対する政治(外交)機能)

このように目標達成に向けて活動を行うわけですが,それほど簡単に目標が達成されるわけではありません。長期的な活動になるでしょうから,その目標活動を達成できるまでの間,外部環境の中に生存し続けなければなりません。これは外部環境に適応することを意味します。これが【A機能】ですね。

(´-`).。oO(集団外部から集団を維持するサービスを得る経済機能)

んー,本当は「外部/内部」「手段的/目的的」と絡めて話をするのならば,L機能は内部+手段的,I機能は内部+目的的に説明しなければならないんだけど……ま,いいや。
コメント ( 0 ) | Trackback ( 0 )

鍵言葉

( ゜д゜) きーわーどっ! きーわーどっ!

このブログでは「アクセス解析」を導入しているので,どんなキーワードでこのブログにたどり着いたかを調べることができます.

最近の多重比較ネタに反応してか,holm法とか,SNK法とか,かなり具体的な多重比較の種類で検索されている方が結構多いです.まあ,多重比較推進運動?をしている雪本さんにとっては大変嬉しいことです.

がっ! 結構びっくりしているのが,一度しか書いていない「パーソンズのAGIL図式」で,このブログを見ていただいている方が多いのです.ほぼ毎日コンスタンスに検索キーワードに含まれています.

うーむ,雪本さん,ちっとびっくりです.
コメント ( 0 ) | Trackback ( 0 )

日本の夏

( ゜д゜) 雪本さんは生きてるサー

あんまり書き込みがないと,忘れ去られてしまいそうなので,ここら辺で何かを書くっ!

今年の夏は最初雨が降らずにやばげでしたが,今ではすっかり「日本のじめじめとした夏」を自己主張しております。

(´-`).。oO(あっ,今,涼やかなる風が吹いた)

恒例の日本の夏を味わっている雪本さんでした。
コメント ( 0 ) | Trackback ( 0 )