微软的必应聊天开始推出一些选项,让用户在聊天中做出有创意、平衡或更精确的回应。不过要小心:采用“创造性”选项一开始会降低必应AI聊天机器人的精确度,名义上是为了得到更有趣的回应。
微软在上周末开始推出新的必应聊天回应选项。(记者还无法通过他的个人账户访问这些信息。)微软公司设计与研究副总裁迈克·戴维森分享了一张截图:
我们一直在努力调整刻度盘,这样你就可以随心所欲地与新的必应聊天。从今天开始,一些用户将能够选择更精确的样式。
微软正试图平衡它显然认为必应的核心功能:“网络副驾驶”。目前还不太清楚这到底需要什么,但最初,微软似乎打算让必应聊天成为其传统搜索引擎的补充工具:汇总来自不同网站的结果,让用户不必自己挖掘这些结果。一些更具创造性的元素,比如讲故事和写诗的能力,显然被视为奖金。
也许对微软来说不幸的是,正是这些创造性的元素被用户抓住,建立在竞争对手OpenAI的ChatGPT允许的基础上。当记者和测试者开始挑战必应能做的极限时,他们得到了一些奇怪的结果,比如威胁和关于关系的奇怪询问。作为回应,微软严厉限制回复,基本上阻止了必应更具娱乐性的回复。
显然,微软正试图通过额外的控制来恢复必应更具创造性的冲动。但根据我自己向戴维森提出的问题,这么做显然是有代价的。大型语言模型有时会“幻觉”(编造)虚假事实,许多记者在仔细询问ChatGPT和其他聊天机器人时注意到了这一点。(这大概是Bing chat在脚注中引用其消息来源的原因之一。)
我问戴维森,创造性的或精确的模式是否会影响回复的事实准确性,或者必应是否会采用更有创意的语气或事实的语气。
是啊。你说的第一件事。不仅仅是口语化的语气。
戴维森的意思是,如果你选择更有创意的回应,你就面临着必应发明信息的风险。另一方面,“创造性”切换可能是为更有创造性的输出而设计的,而绝对精确度并不是优先考虑的。
为了确定,我要求澄清。戴维森接着说,如果用户想要一个完全准确的回复,这是以创造力为代价的。在不准确的基础上消除创造性的反应违背了目的。然而,随着时间的推移,这种情况可能会改变。
就目前LLMS的状态而言,这是一种权衡。我们的目标是尽快达到最高的准确率,但如果你现在对此过度纠正,聊天往往会变得非常安静。想象一下,你让一个孩子唱一首歌。现在想象一下,你把不完美音调的每个部分都调成了静音。哪种更好些呢?
因此,微软正在做出选择–你也将不得不做出选择。如果你想以搜索助手的身份使用必应聊天,请选择“精确”选项。如果你更看重创造力,而不是太在意必应提出的话题是否完全准确,那就选择“创意”选项。也许在未来,这两个人会相遇。
– – END – –
– – 转载请声明来源:www.lanpanpan.com – –
编译:盼盼云笔记