scipy

Python

pythonで音声データを読み込んでfftする

今更FFTについてです。たくさんの人がやっているけど自分用メモ。 fft後のデータはdBに変換して各周波数での差が分かればいい場面が多いですが、実際の単位で振幅が知りたい時があります。 周波数成分だけでなく、縦軸の値が知りたいときに...
Python

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 精度よく...
Python

pythonで音声信号の前処理~VADとウィナーフィルタ~

自分で録音した音声信号や、データセットなどを用いて機械学習や深層学習によって処理を行う需要は多いと思います。 音声を使ったものには話者認識や音声認識、音声生成、音声変換などの様々なアプリケーションがあります。 その際、音声信号をそのまま...
Python

pythonで音声分析~LPC分析&ケプストラム分析~

今回は音声分析手法であるケプストラム分析とLPC分析をpythonを用いてやってみます。 音声は日本声優統計学会というところからお借りしました。 藤東知夏さんがテキストを読み上げている10秒ほどのデータ(fujitou_normal...
Python

pythonで信号にフィルタをかける

音や電気信号などの測定データなどのデータセットに対して、解析や機械学習の前処理としてフィルタをかけたくなることはよくあると思います。 その時に、他のデータとの時間同期をとるためなどの理由で位相遅れのないフィルタが欲しい、というのもまたよく...
Python

pythonで瞬時周波数推定~ヒルベルト変換~

今回は信号の瞬時周波数の推定(と、位相推定)をします。用いるのはヒルベルト変換です。前回と同様に、音源はESC-50というデータセットからお借りしました。データセットのリポジトリはこちら➡ siren(サイレン)のタグがついたファイルを借り...
Python

pythonで時間周波数解析~STFT~

概要 時間周波数解析(Time–frequency analysis)とは、音などの信号を時間軸と周波数軸に分解する解析手法のことです。 また、その結果を表示したグラフをスペクトログラムと呼びます。 時間周波数解析の手法は大きく分...
タイトルとURLをコピーしました