K5の雑記帖

日々の出来事や感じたこと、新しく知ったことetcをだらだらと書いていってます。更新は気まぐれです。

部分時系列クラスタリング

2006-07-12 10:42:11 | DataMining
IBMの井出剛さんの論文「部分時系列クラスタリングの理論的基礎」を読む。

部分時系列クラスタリング(subsequence time-series clustering;STSC)
・時系列データからのパターン抽出方法としてもっとも有名なもののひとつ
・1本の時系列から部分系列を多数生成し、それらを独立なベクトルとしてクラスタリングを実行することで、クラスタ中心を「パターン」として取り出す手法
・固定窓サイズwの滑走窓方式(sliding window technique)が使われるのが典型的

k平均STSCを実行して、クラスタ中心を計算~~僕の場合はSOMSTSCになるのかな?
→波長wの正弦波が得られる
→STSCにおけるこの正弦波効果について、理論的にわかっていることは少ない
→本稿で、正弦波効果に完全な理論的説明を与えた!

正弦波効果
→部分系列を列ベクトルとして持つ行列Hの特異ベクトルにおいても生じる
→k平均とHの特異値分解(SVD)が、ある共通の数学的構造を持っている
→その構造にこそ、正弦波効果を生み出す原因がある!

僕の使ってるデータでは列ベクトルは計測した部位(各筋の筋電データ)だけど、
これにも正弦波効果が見られるのかなぁ。


滑走窓方式のSTSCについての理論解析→正弦波効果を理論的に説明
①k平均法をspectralクラスタリングの形に再定式化
②その解を、1次元周期格子モデル上の併進演算子を使って調べた
           ↓
DFTにおいて支配的な|fq|があれば、結果として同一の|fq|を持つ正弦波の集まりをクラスタリングしているのと同じとわかった。
k平均とspectralクラスタリングでは、クラスタ中心間の相互作用に相違があるが、正弦波形成機構においては本質的に変わりはない。


投稿できるかは別として^^;、今の研究でやっていることは、まさにこのSTSCだからなぁ。k平均とSOMの違いは位相の保持。アルゴリズム的には同じ。
てことで、僕のやろうとしてる?SOMSTSCの理論的説明でもあるわ、これは。
理論的説明のとこの詳細はあとでまとめます。いや、むしろ手で追って理解が先か。機会があれば、資料作ります。

最新の画像もっと見る