yukarifff

Python

pythonで時間周波数解析~メルスペクトログラム~

このブログでは、時間周波数解析としてSTFTとウェーブレット変換で、定Q変換をやりました。 今回はメルスペクトログラムをやってみます。 メルスペクトログラムは、周波数が人間の知覚に近いメル尺度(低周波数の音を良く知覚する)に変換されたSTF...
Python

pythonで信号にフィルタをかける

音や電気信号などの測定データなどのデータセットに対して、解析や機械学習の前処理としてフィルタをかけたくなることはよくあると思います。 その時に、他のデータとの時間同期をとるためなどの理由で位相遅れのないフィルタが欲しい、というのもまたよくあ...
Python

pythonの音響信号処理のおすすめライブラリ

このサイトでは主にpythonによる音響信号処理に関する紹介を行っています。 音響信号処理(ASP: Acoustic signal processing)とは、音声の信号を処理することです? このページでは自身がよく用いているライブラリを...
Python

pythonで音量を計算する

pythonによる信号処理です。今回は音声信号から音量波形を求めます。 音声信号の音量の変化を見たい時はたまにあると思います。 計算には二乗平均平方根(RMS: root mean square)を用います。 音声信号をある程度の範囲で区切...
Python

pythonで話者識別~定Q変換とCNN~

以前、LPC解析によって音声の特徴を抽出してSVMによって識別する方法で話者識別をしてみました。 今回は定Q変換による時間周波数解析で特徴抽出を行い、CNNで分類をしていきます。 tensorflowのチュートリアルでも時間周波数解析(ST...
Python

pythonで時間周波数解析~定Q変換~

以前、時間周波数解析をSTFTとウェーブレット変換でやりました。 今回は定Q変換(CQT: Constant-Q transform)をやってみます。 定Q変換の特徴として、低周波数で良い分解能を示します。 音色変換等の深層学習の前処理に使...
Python

pythonで話者識別~LPC解析とSVM~

今回は話者識別(Speaker Identification)をやってみます。 同じ話者認識(Speaker Recognition)の分野では、他には話者照合(Speaker Verification)というのがあるみたいです。 漢字、英...
Python

pythonで瞬時周波数推定~ヒルベルト変換~

今回は信号の瞬時周波数の推定(と、位相推定)をします。用いるのはヒルベルト変換です。前回と同様に、音源はESC-50というデータセットからお借りしました。データセットのリポジトリはこちら➡ siren(サイレン)のタグがついたファイルを借り...
Python

pythonで時間周波数解析~ウェーブレット変換~

以前、STFTを用いて時間周波数解析する記事を書きましたが、今回はウェーブレット変換を用いてやってみます。 連続ウェーブレット変換 (CWT) の絶対値を取ったものはスカログラムと呼ばれます。スカログラムは、非周期信号に対して良い分解能を示...
Python

pythonで時間周波数解析~STFT~

時間周波数解析(Time–frequency analysis)とは、音などの信号を時間軸と周波数軸に分解する解析手法のことです。 また、その結果を表示したグラフをスペクトログラムと呼びます。 時間周波数解析の手法は大きく分けて3つあります...