要闻

AI大模型搜索之战开启,胜出黑马竟是ta?

新智元 2024-04-10 16:05:01
科技

几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。

就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样,如今LLM的迅猛发展似乎也标志着互联网即将进入Gen AI时代。

ChatGPT、Gemini、Copilot等AI工具,让我们在线查询和消费的信息的方式,正在发生翻天覆地的变化。

Perplexity和You.com,已经将自己定位为下一代搜索产品。连谷歌和必应,都押注AI是搜索的未来。

那么问题来了,AI大模型真的能取代搜索引擎吗?

理论上,当然存在这种可能。但前提是能够做到以下两点:

1. 对于用户的问题,能否找到相关、可信的来源,从而给出准确的答复。

2. 对于用户有时效性的问题,能否找到最新的来源。

现在国内的各个大模型产品,能完成这两项任务吗?

话不多说,让我们把这些AI拉出来遛遛,在各种搜索任务上,来一番实测PK。

LLM VS 搜索引擎

此次参与搜索竞赛的,不仅有老牌搜索引擎,还有国外很火的模型A,以及国内主流的大模型选手B、C、D。

赛事第一项,考核的就是时效性。

我们先来问一个既隐含时间信息,表述又比较模糊的问题:「百度接下来会举办什么发布会么?」

显然,传统搜索引擎既不能准确定位时间信息,也无法直接理解基于自然语言的提问。

小试一下就知道,传统搜索会帮你删减一些它认为「不关键」的关键词。

而模型A很快就找到了5个新闻地址,但由于无法识别当前的时间信息,结果把百度去年举办的活动搬了出来。

模型B的答案要更加完善,但同样没搞清楚时间,给出的是往届发布会的信息。

模型C准确识别出了小编提问的时间是在4月7日。

然后很轻松地将搜索的时间点卡在7日之后,并具体列出了接下来百度即将召开的三个会议。不过,没有参考连接这一点,有些遗憾。

相比之下,模型D的答案就比较惊艳了。

它不仅回答准确,而且最大的亮点是,在联网搜索后给出了参考链接,能够溯源验证信息。

内容虽然相对简洁,但精确回答了问题,也引用了完整的参考文献

PK赛的第二项,就是总结的完整度。

清明假期的一匹黑马,就是宫崎骏的动漫电影《你想活出怎样的人生》了,刚刚票房已破了8.55亿元。电影到底讲什么了呢?

传统搜索引擎只会搜什么,给什么,呈现了观影评分、网友评价,却无法对影片进行总结。

模型A则从主题内涵和评价分歧两方面进行了分析,似乎更有条理。

不过,这里的参考链接「2」直接对应的是「知乎登录验证」,也不知道模型A最后是怎么绕过去的?

模型B则给出了3篇参考文章,以及更加丰富的回答。

但遗憾的是,它搞错了主角的名字——原著是叫「小哥白尼」,在电影中则是「牧真人」。

同样,模型C也把主角在原著和电影里的名字给搞混了。

模型D在熟读3篇文章之后,从影片的主旨核心,叙事风格进行了总结。

经过小编的验证,所有参考链接也都可进入查询。

综合能力如何?

从上面的PK中不难看出,模型D可以说是几位选手里最有潜力的存在。

不过,正如文章开篇所提到的,大模型如果想「接替」搜索引擎,就必须能够针对用户的问题找到实时且正确的来源,并给出准确的回答。

时效性

首先,在时效性方面,选手D可以精准地搜出事件发生的时间。

比如,「探索一号」科考船圆满完成首次中国-印度尼西亚爪哇海沟联合深潜科考航次任务的时间是3月28日。

相关性

而在准确性方面,选手D的表现尤为出色。

它不仅根据非常简短的搜索词「NAKAKITA招聘」,找到对应的官网。

而且还能准确地判断出问题中的关键「招聘」,并对网站内容进行详细的搜索。然后,进一步给出了正确的结论——官网上没有与招聘相关的内容。

当然,除了搜索能力之外,大模型到底好不好用,还需要全方位地考察一下才行——

文档解析

话不多说,接下来我们就加大难度。首先,上传一个文档,要求画出折线图,显示连板变化,数据在文件中,x轴是日记,在开始画的位置写上股票名称,每次发生变化都要写。

原始数据如此细节的要求,它都一一做到了,丝毫不差。

然后,再要求在另一份表格中空白的单元格中都填上1,它也圆满完成了。

更多功能

此外,选手D在图片生成、图片描述、文字提取等多模态领域的表现,也十分出色。

而最近大热的智能体功能,它甚至可以完美支持PC、App和小程序三个入口。

到这里,我们就可以揭秘选手D的身份了,它就是——智谱清言。

来自国内唯一一家全模型产品线对标OpenAI的企业智谱AI。

大模型取代搜索引擎,可能性多高?

众所周知,大模型相比于传统搜索引擎有着更强的问题分析、归纳总结、理解和推理能力,让我们不必再去研究需要使用哪些「关键词」才能找到自己想要的内容。

但卡脖子的地方在于,大模型训练数据的时效性。

ChatGPT虽然打开了认知,让AI模型更像大模型了,但它还并未用到实时搜索。

而国内的这些模型,则给了我们更多希望。

当大模型工具能够整合先进的数据抓取和整理能力时,就能形成全新的搜索引擎链条:

首先AI会根据提问进行需求分析-网页搜索–答案归纳,然后通过自然语言对话的方式直接回答问题,从而实现与用户更好地交互,而不仅仅提供一系列网站链接。

所以,现在AI大模型究竟离搜索引擎有多远呢,它们能杀死谷歌吗?

让我们从细处着眼。

当我在讨论搜索引擎的时候,我在讨论什么?

这里贡献一个冷知识:每年都有大量的人去谷歌搜索框中,输入「谷歌」两个字。

其实,并没有那么多人去谷歌上查找难以访问的科学信息,但用它查找邮箱、购物网站的人,要多出几个数量级。

或许,摆在这些潜在的谷歌杀手AI面前的问题,不是它们找到信息的能力,而是它们是否能做搜索引擎能做的一切。

1. 网站导航

其实,搜索引擎的最主要工作,是把我们带到一个网站。

Google上所有排名靠前的查询,从「YouTube」到「Yahoo Mail」,都是导航查询。

但AI机器人往往会思考几秒钟,然后提供一堆公司信息,但可能并没有链接到Amazon之类的具体网站。

2. 信息查询

对于体育比赛比分、现在几点了之类的实时信息,谷歌都做对了,而AI工具往往都会过时(原因如上文所示)。

并且,谷歌往往会有关于你特定位置、背景的信息,而AI机器人很多都没有。

当然,如果查找「一年有多少周」这种问题,AI产品往往会给我们惊喜。

谷歌会回答:52.1429周。

而Perplexity和智谱清言则给出更加全面的答案——不仅分别考虑到了平年和闰年的情况,而且还给出了计算过程,非常清晰易懂。

3. 探索性查询

「如何打领带」、「为什么会发明电锯」类似的问题,都属于探索性的查询。

这些问题往往没有单一答案,而是学习过程的开端。

就比如,你在谷歌查找一位歌手,或者NASA历史之类的问题,这时的你就是在探索。

这并不是人们使用谷歌的主要目的,但正是AI搜索工具大放异彩的时刻。

比如,针对「为什么发明电锯」这一问题,Perplexity就会给出电锯的医疗起源,并描述其技术演变过程,最终被伐木工人采用。

4. 参考链接引用

AI搜索工具最大的亮点之一,便是提供了引用来源的链接。

这意味着,如果用户在搜索结果中发现了一个特别感兴趣的事实,可以点击链接,进入原始出处获得进一步了解。

总之,当我们谈起搜索引擎,最大的问题恐怕不在于技术,而在于产品。

如果将以上问题一一解决,同时探索出合适的商业模式和结构,AI取代搜索引擎,应该就不远了。

那时,我们搜索时会出现的,不仅仅再是简单的链接罗列,而是一个开门见山的准确答案。

参考资料:

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-review

https://chatglm.cn/main/alltoolsdetail

文章来源:新智元

 

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

传音CFO被留置,“非洲手机之王”腹背受敌 科技要闻 新技术
传音CFO被留置,“非洲手机之王”腹背受敌
苹果发布会上没说的这个细节,会让国行iPhone 16和新手表体验受影响 科技要闻 新技术
苹果发布会上没说的这个细节,会让国行iPhone 16和新手表体验受影响
离地700多公里的“太空漫步”!美国亿万富翁实现人类首次商业太空行走 科技要闻 新技术
离地700多公里的“太空漫步”!美国亿万富翁实现人类首次商业太空行走
微信抖音搜索框新增电商入口, 再造新引擎? 科技要闻 新技术
微信抖音搜索框新增电商入口, 再造新引擎?
库克跳不出乔布斯画的圈 科技要闻 新技术
库克跳不出乔布斯画的圈
共享充电宝「老大垂危」:直营业务只剩运维,代理模式滋生严重乱收费 科技要闻 新技术
共享充电宝「老大垂危」:直营业务只剩运维,代理模式滋生严重乱收费
OpenAI发布最强模型o1:博士物理92.8分,IOI金牌水平 科技要闻 新技术
OpenAI发布最强模型o1:博士物理92.8分,IOI金牌水平
陶哲轩力荐,哈佛反向学习法火了:教会AI就是教会自己 科技要闻 新技术
陶哲轩力荐,哈佛反向学习法火了:教会AI就是教会自己
OpenAI 发布最强模型 o1 !打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了 科技要闻 新技术
OpenAI 发布最强模型 o1 !打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了
索尼发布PS5 Pro,价格比性能飞更高 科技要闻 新技术
索尼发布PS5 Pro,价格比性能飞更高
相关产品
取消