您的位置:首页 > 互联网

谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快「googleat」

发布时间:2023-03-23 23:32:20  来源:互联网     背景:

杨净 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌吃了大亏之后,这次一声不吭,放了大招:

对标ChatGPT的Bard测试版,刚刚正式对外发布。

而且这次用户在申请候补名单之后,无需经历漫长的等待时间。

没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)



实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。

奔驰汽车视频广告

甚至有时候还略胜当前GPT-4一筹!



谷歌 chat



谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。



话不多说,我们现在就来开始体验。

LG电视21年新品

Bard VS GPT-4

首先在聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。
不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

(严谨而又体贴)



而在人类这边的发送端,可以选择键入和语音输入两种方式。

首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?

(不错不错,秒秒钟响应。目前暂不支持英文,但可以借助谷歌翻译插件)



从答案结构上看,采用的是总分总结构。

先总结发言:闪电可以袭击同一个地方两次。

随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。

特斯拉德国工厂投产

最后再给人类提出切实的建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。

而从功能上看,确实是十分完备的。

回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下。

右下方还有一个more的功能,你可以进行复制和(反手一个)举报**操作。



既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。

1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)

(很快啊,这次也是几秒钟响应)



从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。

而GPT-4这边,几乎是不加思考地给出了答案。



从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。

2、小学加减法:356+132等于多少?

结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!



那直接再上点难度,两个数直接相乘:356*132等于多少?

结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!



再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!



不过提醒它错了之后,它就又回答正确了。



3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。



而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。



不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。



最后的最后,再考验一下它了解事实性的能力。(狗头)

你知道量子位吗?



回答错咯~Bard。

m2芯片加持apple推出新一代ipad pro

咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?



可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。



那竞争对手呢?(我在搞事)



不过到这里,就有点问题了。

关于Bard

谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。

我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。

谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。

不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。

由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。

因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。

例如在下面的案例中,Bard就搞错了一个植物的学名:



除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。

最后,奉上申请候补名单的地址,感兴趣的小伙伴可以抓紧尝鲜了:

https://bard.google.com/



返回网站首页

本文评论
短视频“小鲜肉”刷宝冠名《天天向上》:这个舞台曾走出哪些“前辈”?
  近日,《创造营2019》的学员登上《天天向上》,不少观众直呼期待。   11年来,《天天向上》经久不衰的口碑证明了其影响力,无论明星还是品牌方,登上《天天向上》便有利于自身...
日期:02-25
京东“奔富计划”已带动乡村实现产值超6200亿元
11月17日消息,中国农业电影电视中心与中国中小企业协会共同主办的“乡村振兴·区域公用品牌培育计划”启动仪式暨高端论坛近日在北京举行。京东集团作为联合支持单位参与此次...
日期:11-20
联想控股最新消息新闻「联想控股惨遭“腰斩”」
中国基金报记者 南深8月31日,联想控股在港交所发布了2022年上半年业绩。报告期内,公司实现营业收入2376.85亿元,同比增长4%,实现股东应占净利润21.31亿元,同比下降55%,以此测算联...
日期:09-26
报告称今年女性平均月薪8689元 比男性少1253元「中国女性平均月薪」
三八妇女节到来之际,智联招聘发布《2023中国女性职场现状调查报告》,从职场发展、婚育家庭、职场性别平等维度,洞察职场女性生存发展状况。从薪酬来看,2023年,女性的平均薪酬为86...
日期:03-08
Edge浏览器version100版本发布(edge浏览器版本大全)
  微软今日推出了 Edge 浏览器稳定频道的 version 100 (100.0.1185.29) 版本,带来了一些不痛不痒的更新。这也算是一个重大里程碑,但有趣的是它误将这个版本标记为 Edge ve...
日期:07-18
估值500亿,一只独角兽倒下_2000亿独角兽
声明:本文来自于微信公众号投资界PEdaily(ID:xxxxx),作者:戴昌洲 刘福娟,授权转载发布。一切来得猝不及防。本周,福特官方一纸声明震撼创投圈:由福特、大众联手投资的自动驾驶公司Ar...
日期:11-11
苹果Mac mini发布:最高配备M2 Pro 4499元起_2018 Mac mini
今日晚间,苹果Mac mini发布,官网提供了M2和M2 Pro两种版本,其中M2+8GB+256GB售价4499元,M2+8GB+512GB售价5999元,M2 Pro+16GB+512GB售价9999元。对于Mac mini而言,性能是最大看点,...
日期:01-18
三亚海鲜坑人「美食博主三亚买3888元海鲜被好心人提醒多花1700:当事人心累」
2月25日消息,海南三亚一美食博主到市场买海鲜,花了3888买了龙虾、花对虾、椰子螺、螃蟹、青衣鱼、芒果螺。当他拿着买好的海鲜去加工店,店主表示他被宰了,700元一斤买的龙虾实际...
日期:02-25
快手最新处置欺骗诱导行为违规账号4388个「快手近期账号存在作弊行为」
12月21日 消息:快手发布了关于欺骗诱导行为的处罚公告第十三期内容,本次平台共处置此类违规账号4388个。公告称,近期,平台发现部分账号利用用户的情感和心理,通过发布虚假或低质...
日期:12-21
谷歌 Chrome App 将于 2022 年 6 月停用,向 PWA 应用转型
  10 月 15 日消息,根据外媒 9to5Google 消息,谷歌 Chrome OS 的 Chrome App 功能,将于 2022 年 6 月停用,全面向基于网页的 PWA 应用转型。这些应用除了谷歌自家的 Gmail、G...
日期:07-17
元年教育赴上海师范大学商学院实践教学预算管理
  随着大数据、人工智能、移动互联网和云计算等数字技术应用带来的变革不断涌现,财务数字化转型迫在眉睫,会计人员的角色和职能由核算记录转向决策支持,“核算型”会计逐步...
日期:06-04
指环王三部曲国内重映_在家重温《指环王》三部曲,如何实现不输影院的观影体验?
  每年到了暑期,面对热浪炙烤,可供人们选择的户外娱乐项目就变得格外有限。在这段时间的周末或假日里,很多家庭会退而求其次,选择更加消暑的居家娱乐方式。随着超高清大屏电...
日期:04-28
AI(人工智能)绘画艺术中决定创作思想的是?「不明觉厉的AI绘画,对内容创作者来说有什么用?」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:卷毛,授权转载发布。AI绘画的发展速度已经超乎我们的想象了。可能不少人会觉得惊讶,两年前AI只能画一些难以辨认的模糊图片,如...
日期:10-01
淘特淘宝特价「淘特公布双11玩法 主推搜索“比价”可享五折」
10月11日 消息:双十一就快到了,各大电商平台纷纷公布了今年的玩法。主打性价比的淘特,今年的玩法也还是围绕性价比,主推搜索比价功能。10月22日、11月11日,淘特搜索“比价王者”...
日期:10-28
从财务规划到股票交易 ChatGPT将从六个方面影响华尔街
2月5日消息,据外媒报道,当前爆火的AI聊天机器人ChatGPT将被用于提高生产力和改进现有工具。ChatGPT将对多个行业产生影响,在金融服务领域发挥关键作用,华尔街似乎也不能例外。自...
日期:02-05
港股恒生指数收盘_香港恒生指数开盘涨0.33% 网易、京东集团涨超2%
查看最新行情   讯 8月16日上午消息,香港恒生指数开盘涨0.33%,恒生科技指数涨0.72%。网易、京东集团涨超2%。美团涨超1%。 小米POCO F3 GTtwitter的ceoR...
日期:08-18
瑞士推广加密货币支付,65000个商户将接受比特币(瑞士推广加密货币支付,65000个商户将接受比特币申请)
《瑞士推广加密货币支付,65000个商户将接受比特币》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成...
日期:08-01
谷歌前并购主管参与创立的风险投资公司Merus Capital计划_谷歌并购多少企业
  北京时间12月24日早间消息,由谷歌前并购主管参与创立的风险投资公司Merus Capital计划新融资1亿美元。   Merus Capital的有限合伙人透露,该公司位于美国加州帕罗奥尔...
日期:07-25
招聘员工要露出松鼠式微笑,叫顾客主人!三只松鼠店主:企业文化
快播王欣上线新APPiPad 乔布斯   8月5日消息,三只松鼠门店招聘店员及营业员,要求“保持松鼠式微笑,为主人主动提供服务”的要求近日引发网友讨论。据共富财经报道,涉事店铺三...
日期:08-06
特斯拉投资者日开幕 全球副总裁朱晓彤:目标为每45秒生产一辆车
北京时间3月2日,特斯拉首次投资者日开幕,特斯拉全球副总裁朱晓彤上台分享了相关成果。朱晓彤首先宣布,特斯拉产量达到了400万辆的里程碑,第400万辆车今天在得州工厂生产,而特斯拉...
日期:03-02