くっ・・・難しい。
領域①はだいたい前置きの部分。綺麗な300[Hz]程度。
領域②は「く」を発している部分の振動。2000[Hz]後半。またノイズが結構乗っている。
領域③は「く」を発し終えた後の空気の振動かなぁ・・・。「っ」に該当するであろう部分。350[Hz]ぐらいでしょうか。
領域④は息継ぎと行ったところ。こちらは概ね1000[Hz]程度か。
また正弦波を眺めると発音した直後は共振でしょうか、振幅が大きくなり、徐々に減衰していく様が見て取れます(領域③)。
ただ、領域①、④の振幅が安定的な理由がわからん。そしてこれらは恐らく母音の特性や、発し方(感情などにも左右か)、またや湿度、センシングの特性と言った部分でも変わるのでしょうか。
知識がなさ過ぎて妄想が膨らみます。某事務員のように7~8割妄想で楽しんでいる現状。
また、wavファイルと言うことで、データが直。サンプリング周期は2.27e-5と、数値演算上でもまずまずの信頼性が確保できるんじゃないかな。FFT結果でも雑音はそこまでヒドいデータではなさそう。
即ち、結構綺麗な環境が整っているように見えますが、この難しさ。
伝達関数を通して簡易ローパスも一応構築したので、一度ノイズを切ったデータをwavファイルに逆変換してどう変わるか、というのも楽しそう。時間があったらやってみよう。
知らない分野だけど、簡単に実験できるし、何て言うかtry and errorしやすく、変化する様が楽しい。
また、さり気なくscilabをちまちまいじるのも一興。scicos、xcos何ぞでモデル組んだのは3~4年前かそこら以来だ。まぁ超簡単モデルだけど。これをキッカケに少し覚えれたら良い。
あと地味にゲームとネット以外でPC使ってるな。家だとデュアルモニタをフル活用できる点もストレスが減って非常に良い。PCスペックはまだまだ問題ない。てか大規模モデルを自己啓発で組めるようになれたらかなり資金業務でも役立つだろうな。
とりあえず熱が冷めないうちに何か蓄えておきたいところ。
領域①はだいたい前置きの部分。綺麗な300[Hz]程度。
領域②は「く」を発している部分の振動。2000[Hz]後半。またノイズが結構乗っている。
領域③は「く」を発し終えた後の空気の振動かなぁ・・・。「っ」に該当するであろう部分。350[Hz]ぐらいでしょうか。
領域④は息継ぎと行ったところ。こちらは概ね1000[Hz]程度か。
また正弦波を眺めると発音した直後は共振でしょうか、振幅が大きくなり、徐々に減衰していく様が見て取れます(領域③)。
ただ、領域①、④の振幅が安定的な理由がわからん。そしてこれらは恐らく母音の特性や、発し方(感情などにも左右か)、またや湿度、センシングの特性と言った部分でも変わるのでしょうか。
知識がなさ過ぎて妄想が膨らみます。某事務員のように7~8割妄想で楽しんでいる現状。
また、wavファイルと言うことで、データが直。サンプリング周期は2.27e-5と、数値演算上でもまずまずの信頼性が確保できるんじゃないかな。FFT結果でも雑音はそこまでヒドいデータではなさそう。
即ち、結構綺麗な環境が整っているように見えますが、この難しさ。
伝達関数を通して簡易ローパスも一応構築したので、一度ノイズを切ったデータをwavファイルに逆変換してどう変わるか、というのも楽しそう。時間があったらやってみよう。
知らない分野だけど、簡単に実験できるし、何て言うかtry and errorしやすく、変化する様が楽しい。
また、さり気なくscilabをちまちまいじるのも一興。scicos、xcos何ぞでモデル組んだのは3~4年前かそこら以来だ。まぁ超簡単モデルだけど。これをキッカケに少し覚えれたら良い。
あと地味にゲームとネット以外でPC使ってるな。家だとデュアルモニタをフル活用できる点もストレスが減って非常に良い。PCスペックはまだまだ問題ない。てか大規模モデルを自己啓発で組めるようになれたらかなり資金業務でも役立つだろうな。
とりあえず熱が冷めないうちに何か蓄えておきたいところ。