pythonでテキスト音声生成(gTTS/pyttsx3)

音声生成(speech synthesis)をします。
その中でも、文章から音声を作るテキスト音声合成(TTS:Text-To-Speech)をします。
ちゃんとやるのはまた今度で、音声合成モデルを用いたライブラリを使って試すだけです。

gTTS

googleが提供しているGoogle Text-to-SpeechというAPIを用いて音声を生成します。
従って動作にはインターネット環境が必要です。

gTTSのインストールにはpipを用います。

実行はこんな感じです。簡単ですね。
言語を指定することができます。

pyttsx3

PC内の音声合成モデルを用いてテキストから音声を生成します。

pyttsx3のインストールにはpipを用います。windowsの場合はpypiwin32を追加でインストールする必要があるみたいです。

実行はこんな感じです。
私のwindowsだとデフォルトで日本語が割り当てられてました。

使える言語は下のコードで分かります。

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_DAVID_11.0
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_ZIRA_11.0
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-GB_HAZEL_11.0

windowsの設定画面から言語は追加することができます。
中国語や韓国語などの日本語以外の言語でも、手軽に話してもらうことができます。

コメント

タイトルとURLをコピーしました