Google Cloud 文本转语音
Google Cloud 文本转语音 使开发者能够合成 100 多种声音的自然语音,这些声音支持多种语言和变体。它应用了 DeepMind 在 WaveNet 方面的突破性研究成果和 Google 强大的神经网络,以提供尽可能高的保真度。
它支持多种语言,包括英语、德语、波兰语、西班牙语、意大利语、法语、葡萄牙语和印地语。
此笔记本演示了如何与 Google Cloud Text-to-Speech API
交互以实现语音合成功能。
首先,您需要设置一个 Google Cloud 项目。您可以按照 此处 的说明进行操作。
!pip install --upgrade langchain-google-community[texttospeech]
实例化
from langchain_google_community import TextToSpeechTool
已弃用的 GoogleCloudTextToSpeechTool
from langchain_community.tools import GoogleCloudTextToSpeechTool
API 参考:GoogleCloudTextToSpeechTool
text_to_speak = "Hello world!"
tts = GoogleCloudTextToSpeechTool()
tts.name
我们可以生成音频,将其保存到临时文件,然后播放它。
speech_file = tts.run(text_to_speak)