Python

Python

pythonで音量を計算する

pythonによる信号処理です。今回は音声信号から音量波形を求めます。 音声信号の音量の変化を見たい時はたまにあると思います。 計算には二乗平均平方根(RMS: root mean square)を用います。 音声信号をある程度の範囲...
Python

pythonで話者識別~定Q変換とCNN~

以前、LPC解析によって音声の特徴を抽出してSVMによって識別する方法で話者識別をしてみました。 今回は定Q変換による時間周波数解析で特徴抽出を行い、CNNで分類をしていきます。 tensorflowのチュートリアルでも時間周波数解...
Python

pythonで時間周波数解析~定Q変換~

以前、時間周波数解析をSTFTとウェーブレット変換でやりました。 今回は定Q変換(CQT: Constant-Q transform)をやってみます。 定Q変換の特徴として、低周波数で良い分解能を示します。 音色変換等の深層学習の前処理に使...
Python

pythonで話者識別~LPC解析とSVM~

今回は話者識別(Speaker Identification)をやってみます。 同じ話者認識(Speaker Recognition)の分野では、他には話者照合(Speaker Verification)というのがあるみたいです。 漢字...
Python

pythonで瞬時周波数推定~ヒルベルト変換~

今回は信号の瞬時周波数の推定(と、位相推定)をします。用いるのはヒルベルト変換です。前回と同様に、音源はESC-50というデータセットからお借りしました。データセットのリポジトリはこちら➡ siren(サイレン)のタグがついたファイルを借り...
Python

pythonで時間周波数解析~ウェーブレット変換~

以前、STFTを用いて時間周波数解析する記事を書きましたが、今回はウェーブレット変換を用いてやってみます。 連続ウェーブレット変換 (CWT) の絶対値を取ったものはスカログラムと呼ばれます。スカログラムは、非周期信号に対...
Python

pythonで時間周波数解析~STFT~

概要 時間周波数解析(Time–frequency analysis)とは、音などの信号を時間軸と周波数軸に分解する解析手法のことです。 また、その結果を表示したグラフをスペクトログラムと呼びます。 時間周波数解析の手法は大きく分...
Python

pythonでwavファイルを読んで波形を表示する

pythonでwavファイルを読み込んでmatplotlibでプロットするまでのチュートリアルです。10分程度でできると思います。
タイトルとURLをコピーしました