librosa

Python

pythonで時間周波数解析~メルスペクトログラム~

このブログでは、時間周波数解析としてSTFTとウェーブレット変換で、定Q変換をやりました。 今回はメルスペクトログラムをやってみます。 メルスペクトログラムは、周波数が人間の知覚に近いメル尺度(低周波数の音を良く知覚する)に変換されたSTF...
Python

pythonで音量を計算する

pythonによる信号処理です。今回は音声信号から音量波形を求めます。 音声信号の音量の変化を見たい時はたまにあると思います。 計算には二乗平均平方根(RMS: root mean square)を用います。 音声信号をある程度の範囲で区切...
Python

pythonで話者識別~定Q変換とCNN~

以前、LPC解析によって音声の特徴を抽出してSVMによって識別する方法で話者識別をしてみました。 今回は定Q変換による時間周波数解析で特徴抽出を行い、CNNで分類をしていきます。 tensorflowのチュートリアルでも時間周波数解析(ST...
Python

pythonで時間周波数解析~定Q変換~

以前、時間周波数解析をSTFTとウェーブレット変換でやりました。 今回は定Q変換(CQT: Constant-Q transform)をやってみます。 定Q変換の特徴として、低周波数で良い分解能を示します。 音色変換等の深層学習の前処理に使...
Python

pythonで話者識別~LPC解析とSVM~

今回は話者識別(Speaker Identification)をやってみます。 同じ話者認識(Speaker Recognition)の分野では、他には話者照合(Speaker Verification)というのがあるみたいです。 漢字、英...