機械学習

Python

pythonで自分の声を変換する~StarGAN~

概要 pythonで音声の変換をやってみました。 音声変換(VC:Voice Conversion)とは、人の音声を入力として、異なる人の音声を出力する技術です。 バーチャルが流行している現在、この技術も大事になってくると思い...
機械学習

pythonで自分の声を使って音声合成する

概要 自分の声で音声合成をやってみます。 先人に倣って簡単にやっていきます。 内容としては、tacotron2を用いた転移学習によって自分の声を用いて音声を生成します。 英語の学習済みデータから一度大きな日本語のデータセット...
Python

pythonで音声強調(Speech Enhancement)

概要 今回はpythonを用いて音声データから音声強調(SE: Speech Enhancement)をやってみます。 音声強調はノイズのある音声から音声を強調し、ノイズを抑制する技術です。 雑音がある環境下での音声認識など、音声...
Python

BitCoinの価格変動をニュースの見出しデータセットを用いた多変量LSTMで予測する

はじめに 何年か前から仮想通貨が流行ってますよね。 今回はBitCoinの価格変動の予測を試してみます。 売りが売りを呼ぶときがある 引用:機械学習による株価予想の十八手 - Qiita 私は株はやったことがないので詳しいこと...
まとめ

音声に関する技術をまとめる~AIとのコミュニケーションツール~

 音声とは、「人の声」のことです。  人工知能(AI)の進化が目覚しいですが、そのインターフェースも日々進化しています。  私のよく知るAIは、カメラやディスプレイによる、映像を通したコミュニケーションは得意な気がします。  心理...
機械学習

咳・声の音を用いたAIによるコロナ診断の研究について調べた

最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。 新しい研究について知ることができて面白いです。 今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。 近年流行っているコロナにつ...
Python

pythonで音声から感情認識~メルスペクトログラム&CNN~

今回はpythonを用いて音声データから感情認識(Emotion Recognition)をやってみます。 感情認識は音声から話者の感情を認識する技術のことです。 ariXivの論文を参考に実装してみました。 精度よく...
Python

pythonで話者識別~定Q変換とCNN~

以前、LPC解析によって音声の特徴を抽出してSVMによって識別する方法で話者識別をしてみました。 今回は定Q変換による時間周波数解析で特徴抽出を行い、CNNで分類をしていきます。 tensorflowのチュートリアルでも時間周波数解...
Python

pythonで話者識別~LPC解析とSVM~

今回は話者識別(Speaker Identification)をやってみます。 同じ話者認識(Speaker Recognition)の分野では、他には話者照合(Speaker Verification)というのがあるみたいです。 漢字...
タイトルとURLをコピーしました