概要
pythonについてのメモ書きなどを残していきます。
特に音響信号処理に興味があります。
初心者ですが同じところで躓いた人の助けになれば幸いです。
音声処理以外にも、機械学習、Webサービスとかやってみたいです。
新着記事
配信における音声のバーチャル化(音声変換)について考える
はじめに ここ数年、自分の容姿をアバターに投影し、バーチャル化する技術が身近になってきています。特に映像配信に触れる機会が多く、私もVTuberやミラティブのアバターを用いた配信を見たことがあります。 バーチャルYouT […]
pythonで自分の声を変換する~StarGAN~
概要 pythonで音声の変換をやってみました。 音声変換(VC:Voice Conversion)とは、人の音声を入力として、異なる人の音声を出力する技術です。 バーチャルが流行している現在、この技術も大事になってくる […]
声が似てる人を診断するWebアプリ作りました
概要 自分の声が誰に似ているか気になりますよね! 今回はWebアプリにて似ている声の人を診断してくれるアプリを作ってみました。 早速ですが、作ったサイトは↓ 実際の動作 スマホ上でこんな感じで動きます。 仕組み 使ったこ […]
pythonで自分の声を使って音声合成する
概要 自分の声で音声合成をやってみます。 先人に倣って簡単にやっていきます。 内容としては、tacotron2を用いた転移学習によって自分の声を用いて音声を生成します。 英語の学習済みデータから一度大きな日本語のデータセ […]
pythonでリアルタイムのボイスチェンジャーを作る
概要 ボイスチェンジャーをpythonで作ります。 やることは、以下の2つ。 リアルタイムで音声を処理する 音声を変換する 1についてはsounddeviceというライブラリを使います。 pip install soun […]
pythonで音声データを読み込んでfftする
今更FFTについてです。たくさんの人がやっているけど自分用メモ。 fft後のデータはdBに変換して各周波数での差が分かればいい場面が多いですが、実際の単位で振幅が知りたい時があります。 周波数成分だけでなく、縦軸の値が知 […]
pythonで音声強調(Speech Enhancement)
概要 今回はpythonを用いて音声データから音声強調(SE: Speech Enhancement)をやってみます。 音声強調はノイズのある音声から音声を強調し、ノイズを抑制する技術です。 雑音がある環境下での音声認識 […]
BitCoinの価格変動をニュースの見出しデータセットを用いた多変量LSTMで予測する
目次 はじめにLSTM(予備実験)多変量LSTM所感 はじめに 何年か前から仮想通貨が流行ってますよね。 今回はBitCoinの価格変動の予測を試してみます。 売りが売りを呼ぶときがある 引用:機械学習による株価予想の十 […]
今日の料理案をランダムで提案してくれるサイトを作った
なんか料理したいけどアイデアが思いつかないときがありますよね。 そんな時に使えるサイトを作ってみました。 ランダムな料理を表示してくれます。 是非見てみてください。↓ 使ってみるとこんな感じです。 Kung Po Pra […]
pythonでテキスト音声生成(gTTS/pyttsx3)
音声生成(speech synthesis)をします。 その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。 ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使っ […]
音声に関する技術をまとめる~AIとのコミュニケーションツール~
音声とは、「人の声」のことです。 人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。 私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします […]
咳・声の音を用いたAIによるコロナ診断の研究について調べた
最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っている […]