このブログについて

概要

趣味でプログラミングをしていて、主にpythonのプログラムのメモ書きを投稿しています。

特に音響信号処理に興味があります。

初心者ですが同じところで躓いた人の助けになれば幸いです。

音声処理以外にも、機械学習、Webサービスとかやってみたいです。

プロフィール

電機メーカー勤務2年目の新社会人です。

拙いブログですが参考になればうれしいです。

勉強しながらの執筆なので、記事に間違い等ありましたらコメントで指摘していただけると助かります。

新着記事

pythonで音声データを読み込んでfftする

今更FFTについてです。たくさんの人がやっているけど自分用メモ。 fft後のデータはdBに変換して各周波数での差が分かればいい場面が多いですが、実際の単位で振幅が知りたい時があります。 周波数成分だけでなく、縦軸の値が知 […]

pythonで音声強調(Speech Enhancement)

概要 今回はpythonを用いて音声データから音声強調(SE: Speech Enhancement)をやってみます。 音声強調はノイズのある音声から音声を強調し、ノイズを抑制する技術です。 雑音がある環境下での音声認識 […]

BitCoinの価格変動をニュースの見出しデータセットを用いた多変量LSTMで予測する

目次 はじめにLSTM(予備実験)多変量LSTM所感 はじめに 何年か前から仮想通貨が流行ってますよね。 今回はBitCoinの価格変動の予測を試してみます。 売りが売りを呼ぶときがある 引用:機械学習による株価予想の十 […]

今日の料理案をランダムで提案してくれるサイトを作った

なんか料理したいけどアイデアが思いつかないときがありますよね。 そんな時に使えるサイトを作ってみました。 ランダムな料理を表示してくれます。 是非見てみてください。↓ 使ってみるとこんな感じです。 Kung Po Pra […]

pythonでテキスト音声生成(gTTS/pyttsx3)

音声生成(speech synthesis)をします。 その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。 ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使っ […]

音声に関する技術をまとめる~AIとのコミュニケーションツール~

 音声とは、「人の声」のことです。  人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。  私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします […]

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っている […]

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 Emoti […]