OpenAI的新型语音合成器可以从短短15秒的音频中复制你的声音

2024-04-01 16:34:02深情的哈密瓜

去年,OpenAI一直在快速开发其ChatGPT生成式AI聊天机器人和SoraAI视频创建器,现在它有一个新的人工智能工具可以展示:语音生成,它可以从短短15秒的音频中创建合成语音。

OpenAI的新型语音合成器可以从短短15秒的音频中复制你的声音

OpenAI在博客文章(来自TheVerge)中表示,它一直在运行语音引擎的“小规模预览版”,该引擎自2022年底以来一直在开发中。它实际上已经在ChatGPT应用程序的朗读功能中使用,(顾名思义)它会读出答案给你。

一旦你从15秒的样本中训练了声音,你就可以让它以“情感和现实”的方式读出你喜欢的任何文本。OpenAI表示,它可以用于教育目的、将播客翻译成新语言、覆盖偏远社区以及支持非语言人群。

现在不是每个人都可以使用,但是您可以去听一下VoiceEngine创建的样本。OpenAI发布的剪辑听起来相当令人印象深刻,尽管其中有一点机械化和生硬的感觉。

对滥用的担忧是VoiceEngine目前仅提供有限预览的主要原因:OpenAI表示,它希望进行更多研究,以了解如何保护此类工具不被用来传播错误信息和未经同意复制声音。

OpenAI表示:“我们希望就合成声音的负责任部署以及社会如何适应这些新功能展开对话。”“根据这些对话和小规模测试的结果,我们将就是否以及如何大规模部署这项技术做出更明智的决定。”

推荐阅读

阅读排行