在斯坦福大学新的人工智能透明度测试中,OpenAI、Meta和Google的得分低得惊人

文章:《在斯坦福大学新的人工智能透明度测试中,OpenAI、Meta和Google的得分低得惊人》_配图

如果你不确定人工智能模型实际是如何工作的,以及它们是否可以安全使用,你并不孤单。

为了拉开像ChatGPT这样的黑盒工具的帷幕,斯坦福大学公布了一个专注于透明度的新标准,被称为基础模型透明度指数(FMTI)。FMTI是与麻省理工学院和普林斯顿大学合作创建的,希望激励人工智能公司对其系统更加坦率。

这项研究的合著者萨亚什·卡普尔表示:“尽管基金会模式的社会影响力在增长,但透明度却在下降,这反映出过去困扰社交媒体等数字技术的不透明。”一篇大学博客文章补充道,透明度的降低使得“消费者更难理解模型的局限性,也更难为造成的损害寻求赔偿”。

FMTI在100个不同的透明度相关维度上对10名顶级人工智能模特进行了排名。这包括,例如,它们是如何构建的,它们所接受的培训的信息,以及所需的计算资源。它还考虑有关模型使用、数据保护和风险缓解的政策。

有关指标和方法的完整清单,请查看该研究附带的110页论文。

最透明的人工智能模型是什么?

所有模特的平均得分只有37分,或37%。这项研究不以为然,称没有一位模特的分数“值得炫耀”。没有一家银行接近于提供足够的透明度。

文章:《在斯坦福大学新的人工智能透明度测试中,OpenAI、Meta和Google的得分低得惊人》_配图1

Meta的骆驼2车型以54分(满分100分)位居榜首。博士生Rishi Bommasani在该大学基金会模型研究中心领导了这项工作,他说:“我们不应该把Meta视为每个人都试图达到Meta的目标。”“我们应该考虑到每个人都在努力达到80岁、90岁,甚至100岁。”

《拥抱脸》中的模特Bloomz排名第二(53分),紧随其后的是OpenAI的GPT-4(48分)。该研究称:“名称中有‘开放’一词的OpenAI已经明确表示,它将不会对其旗舰机型GPT-4的大部分方面进行透明。”

文章:《在斯坦福大学新的人工智能透明度测试中,OpenAI、Meta和Google的得分低得惊人》_配图2

稳定性AI的稳定扩散2模型得分第四(47)。为巴德提供动力的谷歌Palm2机型跻身前五名(40名)。

斯坦福大学在公布分数前与每家公司的领导都进行了审查,鼓励他们“质疑自己不同意的分数”。该团队考虑了他们的论点,并调整了分数,如果有效的话。

开放模型比封闭模型更好吗?

开放式模型总体排名高于封闭式模型。如果一个模型的代码以开源软件的形式公开发布,那么该模型就被认为是“开放的”。排名靠前的两款车型Llama 2和Bloomz都是开放的,而GPT-4则是关闭的。

例如,斯坦福大学使用Meta的骆驼模型构建了自己的人工智能模型–羊驼。任何拥有正确编码能力的人都可以下载它的代码,并开始为自己的目的定制它。

该研究称:“当今人工智能领域最具争议的政策辩论之一是,人工智能模型应该是开放的还是封闭的。”斯坦福希望基础模型指数将影响积极的政策变化,并计划每年发布FTMI,2023年是第一年。

文章:《在斯坦福大学新的人工智能透明度测试中,OpenAI、Meta和Google的得分低得惊人》_配图3

在这项研究中被评估的10家公司中,有9家致力于白宫负责任的人工智能倡议。Bommasani希望FMTI将激励这些公司履行这些承诺。

FMTI还可以帮助欧盟起草其下一代人工智能法案。博马萨尼说:“我认为,这将让他们清楚地了解目前的形势,现状的利弊,以及他们可能通过立法和监管做出哪些改变。”

– – END – –

– – 转载请声明来源:www.lanpanpan.com – –

编译:盼盼云笔记

推荐阅读

文章:《微软的Copilot人工智能现在可以分析你的个人文件》缩略图

微软的Copilot人工智能现在可以分析你的个人文件

微软似乎已经将上传文档、截图和图片的能力推到了Windows11的S副驾驶人工智能助手上,允许你要求它理解存储在你电脑上的文档。 能够“查询”文档是一种微妙的强大功能,您可能从未使用过。而且它比在你自己的电脑上运行它快得多。不幸的是,这种新功能可能会遇到其他LLM可能会遇到的相同问题:持久性。 “查询”单据意味着向副驾驶询问有关单据的问题。“这是什么意思?”“用30个字为我总结一下。”“下一步我应…

文章:《苹果更新MacBook Air,配备M3芯片,支持多显示屏》缩略图

苹果更新MacBook Air,配备M3芯片,支持多显示屏

在去年10月推出14英寸MacBook Pro的M3芯片后,苹果更新了13英寸和15英寸的MacBook Air,采用了同样轻薄设计、速度更快的芯片。 除了M3芯片-基础13英寸型号的8核CPU/8核GPU;所有其他配置的8核CPU/10核GPU-Apple还将Wi-Fi从6升级到6E,并增加了对关闭盖子时最多两个外部显示器的支持。之前的MacBook Air机型只支持单一显示屏,M3 MacBo…

文章:《DDR6 RAM:下一代内存标准,解释》缩略图

DDR6 RAM:下一代内存标准,解释

DDR5内存标准于2020年7月正式敲定,AMD Ryzen7000(“Raphael”)和英特尔酷睿13000(“Alder Lake”)正式敲定,在过去两年里才真正开始在台式机上缓慢取代其前身DDR4,但即将推出的DDR6内存已经在敲门。 我们可以从新的DDR6内存标准中期待什么–我们已经掌握了哪些可靠的信息?我们将告诉您并为您提供关于PC、服务器和笔记本电脑中的下一代RAM的可靠…