人工智能的声音正在接管互联网

你可能不会这样想,但你可能一直听到人工智能的声音。当你与Alexa或Siri交谈时,这是一个经过人类语音训练的模型,几乎可以说出任何内容。有没有名人在位智上给你指路?人工智能。每当你观看TikTok时,你都会听到那个有点过于清脆的声音大声朗读字幕,这就是人工智能。哎呀,苹果的人工智能甚至会在你睡觉前给你读一本言情小说。

人工智能系统越来越擅长将文本转化为几乎任何语言和任何声音的可信语音。在TheVergecast的这一集(我们关于人工智能的三部分迷你剧的第一集)中,这个声音是我的。我们用我的声音训练了一堆不同的人工智能机器人——有时阅读充满无意义句子的脚本,有时上传旧Vergecast剧集中数小时的现有音频,有时每种都上传一点——看看我们的表现如何以及速度如何。可以用人工智能复制我的声音。

这真是……相当狂野。这是这一集:

如果您想快速比较不同的工具,首先,这是我们使用的伟大的DwightSchrute的参考演讲:

我们转录了该文本并将其输入到我们测试的每个人工智能生成器中。以下是Podcastle用AIDavidPierce的声音对此的解读:

以下是Descript对同一件事所做的处理:

iOS17中新的个人语音功能:

最后,ElevenLabs无疑是我们测试的工具中最真实、最令人印象深刻的:

最终,我认为任何人工智能声音都不会取代我。但他们进步得非常快,他们提出了巨大的可能性和巨大的问题。我可以创建这么好的复制品,并且随着时间的推移它们只会变得更好、更容易,这意味着什么?作为制作者,我有什么责任?其他人有什么责任?

显然,我们现在对人工智能音乐有很多争论,因为艺术家的声音被用来训练模型,这些模型可以用任何人的声音创作出相当令人信服的歌曲。这将催生十年有趣的法庭案件和道德辩论,但同样的事情只会发生在你和我身上。我们如何使用这些工具?我们如何谈论他们?是否有可能从他们那里获得好的、有用的、民主化的东西,而没有所有的深度造假和问题?我们有很多事情要弄清楚,不能浪费时间。因为现在的技术非常好,而且进步得非常快。