今回はpythonで音声認識をします。
マイクで入力した音声を文字に変換します。
本当に簡単にやってみるだけです。
色々なことに応用できそうです。
SpeechRecognitionで音声認識
pythonのライブラリのSpeechRecognitionを用います。
音声の認識にはPyAudioが必要です。
両方ともpipコマンドでインストールできます。
1 2 |
pip install SpeechRecognition pip install pyaudio |
※pythonのバージョンによっては入らないみたいです。
コードは下の通りです。
SpeechRecognitionはsrとしてインポートされることが多いらしいです。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import speech_recognition as sr if __name__ == "__main__": r = sr.Recognizer() with sr.Microphone() as source: r.adjust_for_ambient_noise(source) print("Listening...") audio = r.listen(source) try: query = r.recognize_google(audio, language='ja-JP') print(query) except Exception: print("Error") |
実行結果はこんな感じです。
ちゃんと聞き取ってくれました。
色々話してみましたがそこそこの精度です。
何かに試してみたいと思いました。
コメント