音響信号処理

機械学習

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っているコロナにつ...
Python

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 精度よく...
Python

音響信号処理用の音データセット紹介と使い方解説まとめ

音響信号のデータセットについて、それぞれの内容とpythonでの使い方をまとめた記事になります。 随時更新予定です。 様々なデータセットが公開されているので、実際に使ったものを中心にデータセットの内容とpythonを用いた使い方を紹...
Python

pythonで音声信号の前処理~VADとウィナーフィルタ~

自分で録音した音声信号や、データセットなどを用いて機械学習や深層学習によって処理を行う需要は多いと思います。 音声を使ったものには話者認識や音声認識、音声生成、音声変換などの様々なアプリケーションがあります。 その際、音声信号をそのまま...
Python

pythonで音声分析~メル周波数ケプストラム係数(MFCC)~

以前、音声分析手法としてLPC分析とケプストラム分析をしました。 pythonで音声分析~LPC分析&ケプストラム分析~ 今回は人間の聴覚特性を考慮したケプストラム分析を用いてメル周波数ケプストラム係数(MFCC)を求めます。 ...
Python

pythonで音声分析~LPC分析&ケプストラム分析~

今回は音声分析手法であるケプストラム分析とLPC分析をpythonを用いてやってみます。 音声は日本声優統計学会というところからお借りしました。 藤東知夏さんがテキストを読み上げている10秒ほどのデータ(fujitou_normal...
Python

pythonで音響信号の特徴抽出方法まとめ

このサイトでは音声などの音響信号についての特徴抽出手法を実際にやってみています。 最近深層学習を用いた異常検知等が流行っており、音などの信号から特徴を抽出する手法が多く考えられてきました。 このページでは簡単なものから近年よく用いられる...
Python

pythonで音楽の拍子認識

今回はpythonを用いて音楽の拍子の認識を行います。 この技術はBeat Trackingと呼ばれています。 アルゴリズム 音声信号の節である音節はOnset(子音群)とRhyme(母音群)に分かれています。 このOnsetを用い...
Python

pythonでマイクを用いた音声認識

今回はpythonで音声認識をします。 マイクで入力した音声を文字に変換します。 本当に簡単にやってみるだけです。 色々なことに応用できそうです。 SpeechRecognitionで音声認識 pythonのライブラリのSpeec...
Python

pythonで時間周波数解析~メルスペクトログラム~

このブログでは、時間周波数解析としてSTFTとウェーブレット変換、定Q変換をやりました。 今回はメルスペクトログラムをやってみます。 メルスペクトログラムは、周波数が人間の知覚に近いメル尺度(低周波数の音を良く知覚する)に変換されたST...
タイトルとURLをコピーしました