您的位置:首页 > 互联网

AI大模型搜索之战开启,胜出黑马竟是ta?_aida模型

发布时间:2024-04-09 17:37:48  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】距离AI杀死搜索引擎,到底还差几步?

几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。

就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样,如今LLM的迅猛发展似乎也标志着互联网即将进入Gen AI时代。

ChatGPT、Gemini、Copilot等AI工具,让我们在线查询和消费的信息的方式,正在发生翻天覆地的变化。

Perplexity和You.com,已经将自己定位为下一代搜索产品。连谷歌和必应,都押注AI是搜索的未来。

那么问题来了,AI大模型真的能取代搜索引擎吗?

理论上,当然存在这种可能。但前提是能够做到以下两点:

1. 对于用户的问题,能否找到相关、可信的来源,从而给出准确的答复。

2. 对于用户有时效性的问题,能否找到最新的来源。

现在国内的各个大模型产品,能完成这两项任务吗?

话不多说,让我们把这些AI拉出来遛遛,在各种搜索任务上,来一番实测PK。

宏碁vg270u显示器评测

LLM VS 搜索引擎

此次参与搜索竞赛的,不仅有老牌搜索引擎,还有国外很火的模型A,以及国内主流的大模型选手B、C、D。

赛事第一项,考核的就是时效性。

我们先来问一个既隐含时间信息,表述又比较模糊的问题:百度接下来会举办什么发布会么?

显然,传统搜索引擎既不能准确定位时间信息,也无法直接理解基于自然语言的提问。

小试一下就知道,传统搜索会帮你删减一些它认为不关键的关键词。

而模型A很快就找到了5个新闻地址,但由于无法识别当前的时间信息,结果把百度去年举办的活动搬了出来。

模型B的答案要更加完善,但同样没搞清楚时间,给出的是往届发布会的信息。

模型C准确识别出了小编提问的时间是在4月7日。

然后很轻松地将搜索的时间点卡在7日之后,并具体列出了接下来百度即将召开的三个会议。

不过,没有参考连接这一点,有些遗憾。

相比之下,模型D的答案就比较惊艳了。

它不仅回答准确,而且最大的亮点是,在联网搜索后给出了参考链接,能够溯源验证信息。

内容虽然相对简洁,但精确回答了问题,也引用了完整的参考文献

PK赛的第二项,就是总结的完整度。

清明假期的一匹黑马,就是宫崎骏的动漫电影《你想活出怎样的人生》了,刚刚票房已破了8.55亿元。电影到底讲什么了呢?

传统搜索引擎只会搜什么,给什么,呈现了观影评分、网友评价,却无法对影片进行总结。

模型A则从主题内涵和评价分歧两方面进行了分析,似乎更有条理。

soul如何使用背包

不过,这里的参考链接2直接对应的是知乎登录验证,也不知道模型A最后是怎么绕过去的?

模型B则给出了3篇参考文章,以及更加丰富的回答。

但遗憾的是,它搞错了主角的名字——原著是叫小哥白尼,在电影中则是牧真人。

同样,模型C也把主角在原著和电影里的名字给搞混了。

模型D在熟读3篇文章之后,从影片的主旨核心,叙事风格进行了总结。

经过小编的验证,所有参考链接也都可进入查询。

综合能力如何?

从上面的PK中不难看出,模型D可以说是几位选手里最有潜力的存在。

不过,正如文章开篇所提到的,大模型如果想接替搜索引擎,就必须能够针对用户的问题找到实时且正确的来源,并给出准确的回答。

时效性

首先,在时效性方面,选手D可以精准地搜出事件发生的时间。

比如,探索一号科考船圆满完成首次中国-印度尼西亚爪哇海沟联合深潜科考航次任务的时间是3月28日。

相关性

而在准确性方面,选手D的表现尤为出色。

它不仅根据非常简短的搜索词NAKAKITA招聘,找到对应的官网。

而且还能准确地判断出问题中的关键招聘,并对网站内容进行详细的搜索。然后,进一步给出了正确的结论——官网上没有与招聘相关的内容。

当然,除了搜索能力之外,大模型到底好不好用,还需要全方位地考察一下才行——

文档解析

话不多说,接下来我们就加大难度。

首先,上传一个文档,要求画出折线图,显示连板变化,数据在文件中,x轴是日记,在开始画的位置写上股票名称,每次发生变化都要写。

原始数据

如此细节的要求,它都一一做到了,丝毫不差。

然后,再要求在另一份表格中空白的单元格中都填上1,它也圆满完成了。

更多功能

此外,选手D在图片生成、图片描述、文字提取等多模态领域的表现,也十分出色。

而最近大热的智能体功能,它甚至可以完美支持PC、App和小程序三个入口。

到这里,我们就可以揭秘选手D的身份了,它就是——智谱清言。

来自国内唯一一家全模型产品线对标OpenAI的企业智谱AI。

大模型取代搜索引擎,可能性多高?

众所周知,大模型相比于传统搜索引擎有着更强的问题分析、归纳总结、理解和推理能力,让我们不必再去研究需要使用哪些关键词才能找到自己想要的内容。

但卡脖子的地方在于,大模型训练数据的时效性。

ChatGPT虽然打开了认知,让AI模型更像大模型了,但它还并未用到实时搜索。

而国内的这些模型,则给了我们更多希望。

当大模型工具能够整合先进的数据抓取和整理能力时,就能形成全新的搜索引擎链条:

首先AI会根据提问进行需求分析-网页搜索–答案归纳,然后通过自然语言对话的方式直接回答问题,从而实现与用户更好地交互,而不仅仅提供一系列网站链接。

所以,现在AI大模型究竟离搜索引擎有多远呢,它们能杀死谷歌吗?

让我们从细处着眼。

当我在讨论搜索引擎的时候,我在讨论什么?

这里贡献一个冷知识:每年都有大量的人去谷歌搜索框中,输入谷歌两个字。

其实,并没有那么多人去谷歌上查找难以访问的科学信息,但用它查找邮箱、购物网站的人,要多出几个数量级。

或许,摆在这些潜在的谷歌杀手AI面前的问题,不是它们找到信息的能力,而是它们是否能做搜索引擎能做的一切。

1.网站导航

其实,搜索引擎的最主要工作,是把我们带到一个网站。

Google上所有排名靠前的查询,从YouTube到Yahoo Mail,都是导航查询。

但AI机器人往往会思考几秒钟,然后提供一堆公司信息,但可能并没有链接到Amazon之类的具体网站。

ai模型是什么意思

2.信息查询

对于体育比赛比分、现在几点了之类的实时信息,谷歌都做对了,而AI工具往往都会过时(原因如上文所示)。

并且,谷歌往往会有关于你特定位置、背景的信息,而AI机器人很多都没有。

当然,如果查找一年有多少周这种问题,AI产品往往会给我们惊喜。

谷歌会回答:52.1429周。

而Perplexity和智谱清言则给出更加全面的答案——不仅分别考虑到了平年和闰年的情况,而且还给出了计算过程,非常清晰易懂。

3. 探索性查询

如何打领带、为什么会发明电锯类似的问题,都属于探索性的查询。

这些问题往往没有单一答案,而是学习过程的开端。

就比如,你在谷歌查找一位歌手,或者NASA历史之类的问题,这时的你就是在探索。

这并不是人们使用谷歌的主要目的,但正是AI搜索工具大放异彩的时刻。

比如,针对为什么发明电锯这一问题,Perplexity就会给出电锯的医疗起源,并描述其技术演变过程,最终被伐木工人采用。

4. 参考链接引用

AI搜索工具最大的亮点之一,便是提供了引用来源的链接。

这意味着,如果用户在搜索结果中发现了一个特别感兴趣的事实,可以点击链接,进入原始出处获得进一步了解。

总之,当我们谈起搜索引擎,最大的问题恐怕不在于技术,而在于产品。

如果将以上问题一一解决,同时探索出合适的商业模式和结构,AI取代搜索引擎,应该就不远了。

那时,我们搜索时会出现的,不仅仅再是简单的链接罗列,而是一个开门见山的准确答案。

参考资料:

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-review

https://chatglm.cn/main/alltoolsdetail


返回网站首页

本文评论
小米集团开盘大涨近15% 小米汽车SU7大定近9万辆_小米汽车股
4月2日 消息:今日港股开盘,小米集团股价飙升,涨幅高达14.99%,市值随之攀升至4142亿港元。小米汽车的首款车型SU7于3月28日晚7点正式上市,市场反应热烈。根据小米汽车官方数据,新...
日期:04-02
《FORTUNE》深度|Trax帮助零售商消灭空货架的秘诀竟是摄像头
     1929年创立的“FORTUNE”杂志是世界上最领先的商业媒体品牌之一,它以专业的文字与权威的内容在世界闻名,深入浅出地报道着商业界所关注的主题。近日,新加坡独角兽企...
日期:07-01
苹果秋季发布会 9 月 8 日凌晨举行;英伟达二季度游戏收入暴跌 30%;老虎基金创始人去世
苹果秋季发布会官宣北京时间 9 月 8 日凌晨 1 点举行8 月 25 日讯,苹果正式发布邀请函,官宣秋季发布会将于北京时间 9 月 8 日凌晨 1 点举行。苹果 9 月的发布活动的重点是 iP...
日期:08-26
劳力士最新款手机高端气质拉满_realme或将推出劳力士定制版手机
来源:中关村在线元宇宙中国据外媒报道,realme真我12 Pro和12 Pro+即将上市,并通过了TENAA认证。近日,realme宣布将与奢侈手表品牌合作推出定制版手机。根据泄露的图片显示,该定制...
日期:01-11
懂车帝汽车测评「懂车帝冬测邀车企现场观测 吉利总裁评论:眼不见心不烦」
快科技12月13日消息,近日,车企相继质疑懂车帝冬测”引起关注。为此,懂车帝官方表示,将邀请参与冬测车型的车企前往现场观测,包括长城、问界、吉利、比亚迪等车企。而日前,有大V发...
日期:12-13
第五代扩音器得胜DA5迷你扩音器集麦克风、功放、扩音器于一体
  6月11日,第五代扩音器“得胜DA5迷你扩音器”在国内正式亮相。   为解决前代扩音器中使用时间短,易啸叫、携带笨重等问题,得胜研发出一款轻巧便捷,集麦克风、功放、扬声器...
日期:07-15
单月涨粉超4W!向近期涨粉最快的小红书博主学习什么?_小红书涨粉平台
声明:本文来自于微信公众号 江河聊营销(ID:jiangheliaoyingxiao),作者:江河Team,授权转载发布。如何去发现行业热门选题?找到平台的热门趋势,最快捷的方法,就是看到行业哪些博主涨...
日期:11-20
从明天开始 28个城市可申领电子驾驶证:2022年全面推行(2020年电子驾照支持的城市)
  8月31日消息,据媒体报道,北京、长春、南宁等28个城市9月1日起将开始推广应用驾驶证电子化。   事实上,从今年6月1日起,天津、成都、苏州3个城市开始试点发放电子驾驶证,目...
日期:07-17
华为荣耀50一亿像素「honor x50i首销:一亿像素超清主摄,售价1499元起」
荣耀x50i今日首销,主打一亿像素超清主摄,6.7英寸超窄边护眼全视屏。售价从1499元起。荣耀x50i的主要配置包括:一亿像素超清主摄6.7英寸超窄边护眼全视屏,93.6%超高屏占比,90hz刷...
日期:04-25
这些“收割”未成年人的明星小卡 到底是啥?_明星小卡规格
  数量庞大的“追星”群体,种类繁多的小卡样式,逐渐催生出了买卖小卡的“卡圈”。在这里,大量未成年粉丝融入规则,交易买卖。但是,诈骗、售假、“跑路”等问题却层出不穷,绝大多...
日期:10-25
海尔马来西亚收到一封用户感谢信「海尔马来西亚收到一封用户感谢信是真的吗」
近日,海尔马来西亚收到了一封来自当地用户的感谢信,该位用户在信中表达了对海尔空调、洗衣机送装服务的由衷感谢。小米平板6百度百科苹果15pro max2022年几月上市在这封感谢信...
日期:07-13
我国成功发射齐鲁二号/三号卫星等14颗卫星_一箭9星!我国成功发射齐鲁一号等9颗商业卫星
北京时间2023年1月15日11时14分,我国在太原卫星发射中心使用长征二号丁运载火箭,以“一箭十四星”发射方式,成功将齐鲁二号/三号卫星及珞珈三号01星、吉林一号高分03D34星等14...
日期:01-15
别人家的公司!特斯拉柏林超级工厂开通首条轻轨专列:可载400人「特斯拉 柏林」
快科技9月5日消息,就在今日,特斯拉官方账号发布于推文称柏林超级工厂开通轻轨专列,设计满载400 人,连接附近的Fangschleuse车站和柏林工厂。据悉,这趟轻轨专列于周一到周五运行,每...
日期:09-05
vivos9e天玑820相当于骁龙「vivo有望首发!天玑9000系迭代芯片即将登场:跑分高于骁龙8 Gen2」
今日消息,博主数码闲聊站爆料,联发科天玑9000系迭代芯片已被各大品牌开案测试,进度最快的是蓝厂,目前工程机跑分高于骁龙8 Gen2。由此看来,vivo有望首发联发科天玑9000系迭代芯片...
日期:09-30
苏宁易购双十一战报_苏宁双十一战报:家装建材同比增长312%
  双十一全民嘉年华已接近尾声,作为苏宁全面渗透的品类,苏宁家装也交上了满意的答卷。据苏宁发布的双十一家装战报显示,截至11月11日24时,全品类销售额同比增长312%。   ...
日期:07-26
Redmi Note 11T Pro新版本今天开始预约:8+256GB售价2099元「redmi note10 pro首发价」
9月28日消息,今天Redmi Note 11T Pro新版本:8+256GB的开始预约,售价2099元。这款手机搭载的是LCD屏幕,是目前为数不多的LCD屏,一直想买LCD屏手机的小伙伴可以预约,9月30日晚上8点...
日期:10-01
高等学校数字化建设「OOOK:助力推进高等教育数字化转型向深、向实、向新发展」
以科技创新为基因的安博扎根教育事业二十余年,助力推进高等教育数字化转型向深、向实、向新发展。一、创新赋能,打造数字化转型主引擎近年来,大数据、人工智能等技术正在改变高...
日期:10-07
无奈!高管数次哽咽,OPPO芯片公司解散视频曝光_oppo入股的芯片设计公司
悲壮!哲库(ZEKU)宣布解散的会议上,高层数次哽咽落泪 (来源:科技大佬见闻) 作者|静静出品|网易科技《态℃》栏目盲人会用电脑吗“自古多情空余恨,...
日期:05-15
美FTC征求公众意见 拟出台新规逼科技巨头保护消费者隐私
飞桨人工智能扎克伯格大学创业爱普生r330手机打印世纪宽带网络   讯 北京时间8月12日早间消息,据报道,日前,美国联邦贸易委员会(FTC)向社会公开征集意见,内容是科技公司应该如何...
日期:08-12
消息称华为Mate60系列即将更新AR测量 工程师加鸡腿_ar测量 华为mate30
  【手机中国新闻】1月2日,有数码博主爆料称,华为Mate60系列近期会更新AR测量。使用华为AR测量,无需卷尺,也能快速测量身高、长度、体积等数据。  不过,使用华为手机AR测量测...
日期:01-03