OpenAI新出一键生成逼真语音神器，选举年风险倍增 - 2024年3月29日北美华人网存档

北美华人网

大约 2 个月

楼主 (北美华人网)

人工智能初创公司OpenAI周五发布了一个数字语音生成器的预览版，该生成器可以基于单个15秒音频样本产生自然的语音。这款名为Voice Engine（语音引擎）的软件是OpemAI推出的最新产品，该公司还开发了流行的聊天机器人ChatGPT和图像生成器DALL-E。
OpenAI在一篇博客文章中表示，已经对Voice Engine进行了多种可能的用途的测试，包括为儿童提供阅读辅助、语言翻译以及为癌症患者恢复声音。然而，一些社交媒体用户对此表示担忧，他们强调了潜在的滥用风险，如未经授权的语音模仿和深度伪造技术。
鉴于这些潜在的滥用风险，特别是在选举年期间，OpenAI表示暂时不会更广泛地发布该软件。该公司表示，它最早在2022年底开发了这一产品，并已在其他产品中的幕后使用。
“由于合成语音可能的滥用潜在性，我们正在谨慎而明智地考虑更广泛的发布策略。”公司在未署名的社交发文中表示。
“我们希望关于负责任地部署合成语音以及社会如何适应这些新能力开展更多对话。”公司继续表示，“基于这些对话和这些小规模测试的结果，我们将更加明智地决定是否以及如何大规模地部署这项技术。”值得注意的是，2024年的选举已经出现了首例伪造语音，一条在新罕布什尔州出现的自动电话模仿了总统拜登的声音。一名民主党工作人员后来承认，他使用了人工智能和一名新奥尔良街头魔术师的帮助来制作这个伪造语音。
在此事件之后，联邦通信委员会一致投票禁止了未经请求的AI自动电话。OpenAI在其博客文章中承认了这种技术的政治风险。
“我们认识到生成类人声音的语音具有严重的风险，这在选举年尤为引人关注。”公司表示。
OpenAI还表示，它正在与来自政府、媒体、娱乐、教育、公民社会等领域的美国和国际合作伙伴互动，以确保在构建这一技术时能够纳入他们的反馈。
为了防止滥用，OpenAI表示，其使用政策禁止未经同意或法律权利的冒充，并建议在广泛部署此技术时应伴随“语音认证体验”以验证原始发言者是否知情地将其语音添加到服务中。此外，OpenAI还呼吁设立“禁止语音列表”，以防止创建与著名人物过于相似的语音。然而，对于如何检测和标记AI生成的内容，技术行业尚未找到有效的方法。目前提出的一些解决方案，如“水印”，已被证明容易被移除或绕过。
新墨西哥大学心理学副教授米勒（Geoffrey Miller）在平台X上对OpenAI提出了问题，询问公司如何应对犯罪分子的潜在滥用问题。
“当数百万老年人因这些深度伪造语音而被骗走数十亿元时，OpenAI准备好迎接随后的诉讼海啸了吗？”他在发文中问道。目前，OpenAI尚未对他的问题做出回应。