もちお

Python

pythonでテキスト音声生成(gTTS/pyttsx3)

音声生成(speech synthesis)をします。 その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。 ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使って試すだけです。...
まとめ

音声に関する技術をまとめる~AIとのコミュニケーションツール~

 音声とは、「人の声」のことです。  人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。  私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします。  心理...
機械学習

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っているコロナにつ...
Python

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 精度よく...
Python

音響信号処理用の音データセット紹介と使い方解説まとめ

音響信号のデータセットについて、それぞれの内容とpythonでの使い方をまとめた記事になります。 随時更新予定です。 様々なデータセットが公開されているので、実際に使ったものを中心にデータセットの内容とpythonを用いた使い方を紹...
Python

pythonで音声信号の前処理~VADとウィナーフィルタ~

自分で録音した音声信号や、データセットなどを用いて機械学習や深層学習によって処理を行う需要は多いと思います。 音声を使ったものには話者認識や音声認識、音声生成、音声変換などの様々なアプリケーションがあります。 その際、音声信号をそのまま...
Python

pythonで音声分析~メル周波数ケプストラム係数(MFCC)~

以前、音声分析手法としてLPC分析とケプストラム分析をしました。 pythonで音声分析~LPC分析&ケプストラム分析~ 今回は人間の聴覚特性を考慮したケプストラム分析を用いてメル周波数ケプストラム係数(MFCC)を求めます。 ...
Python

pythonで音声分析~LPC分析&ケプストラム分析~

今回は音声分析手法であるケプストラム分析とLPC分析をpythonを用いてやってみます。 音声は日本声優統計学会というところからお借りしました。 藤東知夏さんがテキストを読み上げている10秒ほどのデータ(fujitou_normal...
Python

pythonで音響信号の特徴抽出方法まとめ

このサイトでは音声などの音響信号についての特徴抽出手法を実際にやってみています。 最近深層学習を用いた異常検知等が流行っており、音などの信号から特徴を抽出する手法が多く考えられてきました。 このページでは簡単なものから近年よく用いられる...
Python

pythonで音楽の拍子認識

今回はpythonを用いて音楽の拍子の認識を行います。 この技術はBeat Trackingと呼ばれています。 アルゴリズム 音声信号の節である音節はOnset(子音群)とRhyme(母音群)に分かれています。 このOnsetを用い...
タイトルとURLをコピーしました