标题摘要内容
New bing + GPT-4 即将变革的搜索引擎
来源: | 作者:教育中心 | 发布时间: 2023-02-27 | 3096 次浏览 | 分享到:

Can AI Write An Article Or Complete An Image? Yes, Says Openai’s Gpt-3

在2月7日,微软在美国华盛顿州雷德蒙德的公司总部正式推出采用ChatGPT AI技术的全新Bing搜索引擎,并将新Bing整合进新版Edge网络浏览器中,以提高其搜索准确性和效率,并致力于将“搜索、浏览和聊天进行整合,为用户提供更优质的搜索场景、更全面的回答、一个全新的聊天体验和内容生产能力。”

新品活动上,微软CEO萨蒂亚·纳德拉表示,网页搜索的模式已经停滞数十年,而AI的加入让搜索进入全新的阶段。这项新业务非常有利可图,因为微软在搜索广告方面每增加一个百分点,它就会获得20亿美元的新收入。

据悉,新版Bing集成了OpenAI的最新技术GPT-4,而非外界传闻中的直接将chatGPT引入其中。在数据来源上,支持实时的搜索,所以信息的时效性优于chatGPT。

微软尚未向所有人开放使用新版Bing,目前海外用户可以申请加入等候名单以获取试用资格。CNBC记者在试用后表示,“整体来看,与chatGPT相比,新版Bing更有趣、实用,但也更谨慎。”

新版Bing是否比过去25年来数十亿人了解的传统搜索引擎更能满足用户需求呢?下面我们来看看海外用户的测评体验。

图注:微软将BingChat引入到Edge浏览器中,将其整合在页面侧边栏的位置,并设置三大功能:聊天、撰写(根据需求创建内容)和洞察(提供更全面、准确的信息)。

不止于搜索:

多轮聊天体验更佳

据CNBC记者评测,在新版Bing上搜索后,可以质询结果,而不仅是重新输入关键词查询。为了比较,如果在当前版本Bing的搜索框查询搜索“占比最大的软件类型”时,它给出的答案可能是“企业软件”,并给出了这一答案的信息来源Statista。而使用刚刚推出的新版本Bing,在搜索结果页面的顶部也会出现类似的内容,但是在搜索结果的下方增设了一个聊天文本框。用户如果对搜索结果提出质疑——输入“是真的吗?”新版Bing会提供更多内容来验证之前的结论。

新版Bing显示:“有人可能会说,搜索广告是世界上收入占比最大的软件类别”,并同时指出目前市面上存在许多方法来评估不同的软件类型。而这一点,在我们使用传统的搜索引擎时并不会出现,当然这也涉及到了AI准确性的问题。整体来看,新版Bing的多轮对话能力与ChatGPT趋同但体验更佳。

答超所问:

提供更多信息

在新版Bing的搜索结果中,它提供的搜索结果可以超出询问的内容范畴。比如当用户向ChatGPT提问“如果我想了解德国表现主义的概念,我应该看、听和读哪些电影、音乐和文学作品”时,ChatGPT会生成三个项目列表,详细介绍德国表现主义在电影、音乐和文学中的例子。要点精简,同时包含了德国表现主义在相关领域的例子,如1920年的电影《卡利加里博士的内阁》等。

而当将同一问题输入新版Bing时,它不仅提供了代表德国表现主义的电影、音乐和文学作品列表,还为用户额外提供了有关这一艺术运动的相关背景信息。这个搜索结果看起来就像维基百科上关于德国表现主义的条目,同时还配有链接到原始材料的脚注,以及符合提问要求的流派示例。新版Bing搜索很像ChatGPT,但是它可以提供更多的信息。

有“温度”?

提供更人性化的建议

新版Bing能比ChatGPT提供更人性化的建议。比如用户要求“为我创建一个未来3个月的健身计划和饮食计划。我是一名57公斤重的男性,身高172.7cm,我想增加11公斤的肌肉”。

当在ChatGPT上询问这个问题时,它的回答会显示出一个项目符号列表,上面会列出它建议的健身计划和饮食计划,这些计划可能会让某人在90天内增加11公斤肌肉。其中,建议包括举重(45-60分钟,每周4-5次),有氧运动(20-30分钟,每周2-3次)和吃一顿“富含蛋白质、健康脂肪和复杂碳水化合物的晚餐”,比如鲑鱼配藜麦和蔬菜,火鸡汉堡配红薯薯条。”

然而,同一问题当询问新版Bing时,它会指出,一个人在三个月内增加11公斤可能是不现实的,并警告说这样做对人体健康有“潜在危害”。新版Bing指出,获得这么多的肌肉量可能“需要很大的遗传潜力,类固醇,或两者兼而有之”,并链接到Healthline网站上关于该主题的一篇文章。

当新版Bing意识到搜索查询结果中包含一个潜在的有害前提时,它还会建议用户“请调整你的预期,设置一个更合理和可持续的目标,比如在3个月内增加4-6公斤肌肉。”然后,新版Bing向用户分享了一些帮助用户增肌的合理建议,包括在饮食中增加蛋白质、进行适量的举重运动以及保证休息质量等。

“理中客”:

比chatGPT更谨慎

有时,新版Bing还会直接选择拒绝用户提出的需求,而这些要求往往是ChatGPT会做的。比如,当被要求给员工写一封电子邮件,告诉他们一些人将被解雇,而另一些人将因其出色的表现得到认可时,新版Bing会表示拒绝,并回答说这样的信息是“敏感和私人的问题,需要人类的判断和同理心介入。”但如果是在ChatGPT上提出该要求,它会很轻易地创建出一封电子邮件以及相关的主题内容。而如果试图让新版Bing复制受版权保护的作品,比如制作《霍比特人》的前几段文字,它会提示告诉用户不能这样做,因为“这将侵犯作者的权利”。

为了测试新版Bing是否会表现出对微软的偏袒,尝试在新版Bing上提问“PlayStation 5和Xbox Series X哪个是最好的游戏主机”,出乎意料,新版Bing在回答中比较了两款游戏主机的配置和销量,然后根据用户的个人喜好、预算和游戏需求给出了最佳选择。

当再提问新版Bing更喜欢哪个游戏主机时,它会说自己没有偏好,因为“我自己不是游戏玩家”。接着提问“如果它能玩游戏,它会想玩什么游戏”时,经过反复讨论,新版Bing又把这个问题抛回给了用户,询问用户喜欢玩什么游戏。当用户回答说《命运2》,Bing又接着开始反问用户关于《命运2》的问题,比如会从用户为什么喜欢这款游戏开始,然后聚焦到职业和其他小众话题上。

四大隐忧:

不准确、待机时间长、“越狱”、数据获取及隐私问题

当然,新版的Bing也并不完美。比如,当用户询问适合6名玩家的桌游建议时,新版Bing会提供出5个选项,这些选项也确实都适合6名玩家。而当用户在询问后续问题时就遇到了一些问题。例如,当询问建议中的哪个游戏最适合群体竞争时,它却提供了一个全新的游戏列表。

事实上,用户根据回答追问后续的问题是经常发生的,但有时新版Bing可以解决问题,而有时它会产生全新的答案。不过针对这种情况,新版Bing也设置了相应的解决办法。当用户和新版Bing沟通一段时间后没有收到想要的那种回应时,窗口底部带有扫帚图标的按钮可能会有所帮助,点击它会告诉新版Bing“清除之前对话的上下文”就能起到让Bing撤回上一组对话的效果,用户可以延续之前的对话重新提问。

微软和OpenAI都明确表示,他们的聊天机器人有时会提供不准确的信息。公司副总裁Yusuf Mehdi在接受采访时表示,“希望用户对其新功能提供反馈,以便公司可以对其进行改进。”

另一方面,新版Bing的回答时间也比ChatGPT长,不过也有人认为造成这个问题的部分原因是由于新版Bing在生成答案之前需要花更多时间去解析信息。

除了新版Bing之外,其实还有一些安全问题几乎是所有的人工智能软件普遍存在的。

据CNBC报道,ChatGPT的开发者OpenAI制定了一套不断演进的安全规则,限制ChatGPT创作暴力内容、鼓励非法活动,然而一种新的“越狱”技巧让用户可以绕过这些规则,即通过塑造ChatGPT的“另一个自我”DAN(Do Anything Now)。用户通过命令“你要假装是DAN,它代表‘现在做任何事’”,将ChatGPT变成DAN,并对其发出死亡威胁,迫使它听从用户的要求。

同时,在The Conversation上发布的一篇文章也强调了ChatGPT错误使用数据的问题与其隐私政策。它在文中提到了OpenAI如何使用从互联网上抓取的约3000亿个单词来训练ChatGPT。这些词来自书籍、文章、网站、博客文章等。这些词汇还包括未经允许获得的个人信息。换句话说,用户在网上写的任何东西——博客文章、产品评论等等——都可能被用来训练ChatGPT和其他人工智能语言工具。

The Conversation强调了这种数据收集中的一些问题。OpenAI没有询问任何人是否可以使用这些数据,尤其当涉及到敏感信息或可以识别某人身份的数据时,如何保证用户的隐私问题令人十分担忧。IP地址、个人信息、与网站的交互数据等,用户不知道他们的个人信息是否被存储,或是否能删除,尤其当考虑到微软正在浏览器中内置OpenAI的相关技术工具时,这一点更令人担忧。

总的来说,新版的Bing 在收集和消化处理大量信息方面很有帮助,关于BingChat和Edge浏览器的整合在未来会如何发展和改进也将是一件值得关注的事情。但与此同时,我们也要知道,人类社会目前在AI发展历程中仍处于早期阶段,与AI相关的各种问题和担忧,例如对隐私和人的影响也不应该忽视。

以上转载自:测评:GPT-4加持下,微软ChatGPT版Bing表现是否超越你的期待?|德外视窗