Meta的Voicebox AI技术可以为您的数字助理提供熟悉的语音

文章:《Meta的Voicebox AI技术可以为您的数字助理提供熟悉的语音》_配图

Meta本周预览了(在一个新窗口中打开)一个基于语音的生成性人工智能模型,有朝一日它可能会用你的虚拟助理的声音交换你认识的人的声音。

“Voicebox可以制作高质量的音频片段,并编辑预先录制的音频–比如移除汽车喇叭或狗叫–所有这些都能保留音频的内容和风格,”梅塔说。该模型也是多语种的,可以产生六种语言的语音。

元调侃Voicebox是一种让虚拟助手听起来不那么机械化或为虚拟世界中不可播放的角色提供动力的方式。但就目前而言,我们只是先睹为快。

该公司表示:“由于存在误用的潜在风险,我们目前不会公开提供Voicebox模型或代码。”虽然我们认为与人工智能社区开放并分享我们的研究成果以推动人工智能的发展是重要的,但也有必要在开放和责任之间取得适当的平衡。

为此,Meta的人工智能团队分享了音频样本和一篇研究论文(在一个新窗口中打开),详细介绍了他们到目前为止所取得的成果。

在一段演示文本语音转换功能的视频中,我们看到Voicebox播放的音频片段以六种不同的语音风格产生相同的短语。它还拍摄了一个人说话的片段,让他们的声音读到一个他们在现实生活中从未说过的不同的短语。

它还去掉了会议背景中狗叫的音频,并在最终的录音版本中将一个单词(“Guys”改为“Everyone”)。而且,它还采集了某人用不同语言说某事的音频,并让那个声音用英语说出来,使用他们的声音风格。

几个月前,该公司首席执行官马克·扎克贝格表示,该公司正在Meta创建一个新的顶级产品团队,专注于生成性人工智能,以推动我们在这一领域的工作。Meta已经有几个团队致力于产生式人工智能,但它将这些团队合并为一个团队,专注于为Meta的各种应用和服务带来“愉快的体验”。

– – END – –

– – 转载请声明来源:www.lanpanpan.com – –

编译:盼盼云笔记

推荐阅读

文章:《微软的Copilot人工智能现在可以分析你的个人文件》缩略图

微软的Copilot人工智能现在可以分析你的个人文件

微软似乎已经将上传文档、截图和图片的能力推到了Windows11的S副驾驶人工智能助手上,允许你要求它理解存储在你电脑上的文档。 能够“查询”文档是一种微妙的强大功能,您可能从未使用过。而且它比在你自己的电脑上运行它快得多。不幸的是,这种新功能可能会遇到其他LLM可能会遇到的相同问题:持久性。 “查询”单据意味着向副驾驶询问有关单据的问题。“这是什么意思?”“用30个字为我总结一下。”“下一步我应…

文章:《苹果更新MacBook Air,配备M3芯片,支持多显示屏》缩略图

苹果更新MacBook Air,配备M3芯片,支持多显示屏

在去年10月推出14英寸MacBook Pro的M3芯片后,苹果更新了13英寸和15英寸的MacBook Air,采用了同样轻薄设计、速度更快的芯片。 除了M3芯片-基础13英寸型号的8核CPU/8核GPU;所有其他配置的8核CPU/10核GPU-Apple还将Wi-Fi从6升级到6E,并增加了对关闭盖子时最多两个外部显示器的支持。之前的MacBook Air机型只支持单一显示屏,M3 MacBo…

文章:《DDR6 RAM:下一代内存标准,解释》缩略图

DDR6 RAM:下一代内存标准,解释

DDR5内存标准于2020年7月正式敲定,AMD Ryzen7000(“Raphael”)和英特尔酷睿13000(“Alder Lake”)正式敲定,在过去两年里才真正开始在台式机上缓慢取代其前身DDR4,但即将推出的DDR6内存已经在敲门。 我们可以从新的DDR6内存标准中期待什么–我们已经掌握了哪些可靠的信息?我们将告诉您并为您提供关于PC、服务器和笔记本电脑中的下一代RAM的可靠…