音響信号処理

Django

音域を測定するwebアプリを作りました【音域チェッカ】

概要 特にカラオケが趣味の方とかは、自分の音域を数値として知りたいとき、あると思います。 今回はWebアプリにて音域を測定してくれるアプリを作ってみました。 早速ですが、作ったサイトはこちら↓ 実際の動作 ...
Python

pythonで自分の声を変換する~StarGAN~

概要 pythonで音声の変換をやってみました。 音声変換(VC:Voice Conversion)とは、人の音声を入力として、異なる人の音声を出力する技術です。 バーチャルが流行している現在、この技術も大事になってくると思い...
Django

声が似てる人を診断するWebアプリ作りました【声質チェッカ】

概要 自分の声が誰に似ているか気になりますよね! 今回はWebアプリにて似ている声の人を診断してくれるアプリを作ってみました。 早速ですが、作ったサイトはこちら↓ 実際の動作 スマホ上でこんな感じで動きます。 ...
機械学習

pythonで自分の声を使って音声合成する

概要 自分の声で音声合成をやってみます。 先人に倣って簡単にやっていきます。 内容としては、tacotron2を用いた転移学習によって自分の声を用いて音声を生成します。 英語の学習済みデータから一度大きな日本語のデータセット...
Python

pythonでリアルタイムのボイスチェンジャーを作る

概要 ボイスチェンジャーをpythonで作ります。 やることは、以下の2つ。 リアルタイムで音声を処理する 音声を変換する 1についてはsounddeviceというライブラリを使います。 2はピッチシフト...
Python

pythonで音声データを読み込んでfftする

今更FFTについてです。たくさんの人がやっているけど自分用メモ。 fft後のデータはdBに変換して各周波数での差が分かればいい場面が多いですが、実際の単位で振幅が知りたい時があります。 周波数成分だけでなく、縦軸の値が知りたいときに...
Python

pythonで音声強調(Speech Enhancement)

概要 今回はpythonを用いて音声データから音声強調(SE: Speech Enhancement)をやってみます。 音声強調はノイズのある音声から音声を強調し、ノイズを抑制する技術です。 雑音がある環境下での音声認識など、音声...
Python

pythonでテキスト音声生成(gTTS/pyttsx3)

音声生成(speech synthesis)をします。 その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。 ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使って試すだけです。...
まとめ

音声に関する技術をまとめる~AIとのコミュニケーションツール~

 音声とは、「人の声」のことです。  人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。  私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします。  心理...
機械学習

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っているコロナにつ...
タイトルとURLをコピーしました