このブログについて

概要

趣味でプログラミングをしていて、主にpythonのプログラムのメモ書きを投稿しています。

特に音響信号処理に興味があります。

初心者ですが同じところで躓いた人の助けになれば幸いです。

音声処理以外にも、機械学習、Webサービスとかやってみたいです。

プロフィール

電機メーカー勤務2年目の新社会人です。

拙いブログですが参考になればうれしいです。

勉強しながらの執筆なので、記事に間違い等ありましたらコメントで指摘していただけると助かります。

新着記事

今日の料理案をランダムで提案してくれるサイトを作った

なんか料理したいけどアイデアが思いつかないときがありますよね。 そんな時に使えるサイトを作ってみました。 ランダムな料理を表示してくれます。 是非見てみてください。↓ 使ってみるとこんな感じです。 Kung Po Pra […]

pythonでテキスト音声生成(gTTS/pyttsx3)

音声生成(speech synthesis)をします。 その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。 ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使っ […]

音声に関する技術をまとめる~AIとのコミュニケーションツール~

 音声とは、「人の声」のことです。  人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。  私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします […]

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っている […]

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 Emoti […]

音響信号処理用の音データセット紹介と使い方解説まとめ

音響信号のデータセットについて、それぞれの内容とpythonでの使い方をまとめた記事になります。 随時更新予定です。 様々なデータセットが公開されているので、実際に使ったものを中心にデータセットの内容とpythonを用い […]

pythonで音声信号の前処理~VADとウィナーフィルタ~

自分で録音した音声信号や、データセットなどを用いて機械学習や深層学習によって処理を行う需要は多いと思います。 音声を使ったものには話者認識や音声認識、音声生成、音声変換などの様々なアプリケーションがあります。 その際、音 […]

pythonで音声分析~メル周波数ケプストラム係数(MFCC)~

以前、音声分析手法としてLPC分析とケプストラム分析をしました。 pythonで音声分析~LPC分析&ケプストラム分析~ 今回は人間の聴覚特性を考慮したケプストラム分析を用いてメル周波数ケプストラム係数(MFCC […]

タイトルとURLをコピーしました