您的位置:首页 > 媒体评论

谷歌版ChatGPT突然公测!上手实测结果在此 体验申请通过飞快

发布时间:2023-03-23 02:03:25  来源:互联网     背景:

谷歌吃了大亏之后,这次一声不吭,放了大招:

对标ChatGPT的Bard测试版,刚刚正式对外发布。

而且这次用户在申请候补名单之后,无需经历漫长的等待时间。

没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)

实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。

甚至有时候还略胜当前GPT-4一筹!

谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。

话不多说,我们现在就来开始体验。

Bard VS GPT-4

首先在聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。

不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

(严谨而又体贴)

而在人类这边的发送端,可以选择键入和语音输入两种方式。

首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?

(不错不错,秒秒钟响应。目前暂不支持中文,但可以借助谷歌翻译插件)

从答案结构上看,采用的是总分总结构。

先总结发言:闪电可以袭击同一个地方两次。

随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。

最后再给人类提出切实的建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。

而从功能上看,确实是十分完备的。

回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下。

右下方还有一个more的功能,你可以进行复制和(反手一个)举报操作。

既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。

腾讯 智能硬件

1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)

(很快啊,这次也是几秒钟响应)

从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。

而GPT-4这边,几乎是不加思考地给出了答案。

从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。

什么是第二代苹果手表

2、小学加减法:356+132等于多少?

结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!

那直接再上点难度,两个数直接相乘:356*132等于多少?

结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!

再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!

不过提醒它错了之后,它就又回答正确了。

苹果打折部分产品最高优惠600元

如果换稍微难一点的高数题呢?比如:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

正确答案应该是(-3)!,也就是-6。

但Bard这回就不太行了,并没有理解题目的意思。

至于GPT-4,思路倒是没啥问题,但最后计算又拉胯了……

不过同样,只要你告诉它算得有问题,GPT-4就能马上纠正。

3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。

而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。

不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。

4、代码能力:写一段斐波那契数列的代码。

Bard很快生成了正确的代码,并且代码习惯不错。

GPT-4则更积极主动一些,除了递归法,还给了迭代法的方案。

乐视手机最大内存

最后的最后,再考验一下它了解事实性的能力。(狗头)

你知道量子位吗?

回答错咯~Bard。

咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?

可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。

那竞争对手呢?(我在搞事)

不过到这里,就有点问题了。

另外比较遗憾的是,Bard目前并不支持中文。

关于Bard

谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。

我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。

谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。

不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。

由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。

因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。

例如在下面的案例中,Bard就搞错了一个植物的学名:

除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。


返回网站首页

本文评论
“先涨价再降价”老套路为何难禁止_直接降价没有套路
摩飞厨房用品作者/张涛漫画/陈彬10月24日晚8点,各大电商平台的“双十一”预售正式开启,今年“双十一”大促进入实质性阶段。近日有网友发现某平台在售的手机在悄然涨价。山东...
日期:11-03
华为钱包上线健康码卡片 支持部分NFC机型「华为钱包nfc功能」
  8月27日消息,昨天,华为钱包迎来了9.0.18.362更新,上线钱包健康码卡片,已经支持部分NFC机型,用户可以通过双击电源键快速领取。国美117内购会xbox series x官网缺货  华为钱...
日期:08-28
airpods降价吗_强如AirPods 也不得不走上“降价走量”之路
尽管至今仍然有人对3.5mm耳机接口的逝去而感到惋惜,但不可否认的是,苹果在2016年推出的初代AirPods真无线蓝牙耳机开创了这一全新的产品形态与市场。根据Counterpoint统计,2021...
日期:01-11
ChatGPT没出现在中国是因为差钱?
作者 | 史林随着GPT-4的上线,ChatGPT又完成了一波升级,在粉丝摇旗呐喊之际,难免也有人心生疑惑,为什么又是美国先搞出来的?最常听见的说法莫过于“国内AI与相关企业急功近利,投资...
日期:03-18
日系车之王_“车界卷王”日系车跌落神坛
7万多的日产轩逸,8万出头的丰田卡罗拉,12万的日产逍客,13万的本田皓影……十多万价格的热销车型,动辄两三万的降价,这既非“双十一”,也非“清库存”,而是10月底在北京的新车市场价...
日期:10-31
微软 Win10 中发现 TPM、安全启动要求文件,用于为 Win11 铺路
  8 月 28 日消息,微软 Windows 11 作为全新一代操作系统,对于设备要求包括 TPM 2.0、安全启动、基于虚拟化的安全(VBS)等,导致部分设备无法升级。  而根据最新发现的文件...
日期:08-29
ChatGPT爆出隐患,数字水印突然大火,龙头股汉邦高科倒下后,新概念还有机会吗?
ChatGPT的火爆已席卷全球各行各业,对于这项技术来说,似乎无所不能。不过,科技在给人带来便捷的同时,对于其担忧与警惕的声音也随之而来,“反ChatGPT”开始成为一股新的势力。电商...
日期:02-16
比亚迪一年要卖500万台车,特斯拉慌不慌?「比亚迪卖不过特斯拉」
作者 | 李鑫编辑 | 刘杨有关如何在一个巨型且充满不确定的市场里获胜,硅谷知名投资人里德·霍夫曼在《闪电式扩张》这本书里总结:要有海盗精神,快速扩张就是一切,甚至快速、野蛮...
日期:01-20
腾讯等来游戏版号,拯救增长疲态?_腾讯游戏更新
图片来源:Pixabay迟迟拿不到版号的腾讯游戏,等到了新版号“救急”。2022年12月,国家新闻出版署分别公布了12月国产网络游戏审批信息和2022年进口网络游戏审批信息,共计128款游戏...
日期:01-17
目前手机快充_岂单止于快!盘点近年手机快充闪充发展史
近些年来,随着手机性能的不断提升,以及人们生活对手机依赖性的增强,对快充的需求也与日俱增。2022年7月19日,iQOO发布了iQOO10Pro,这是第一款突破200W功率快充的手机,从最初的5V1A...
日期:10-21
adobe账号被拒绝访问_Adobe突然查封中国账号 设计社区Behance无权访问
8月17日,一条消息让整个设计圈炸锅了。Behance的网站内容忽然无法查看了,给出的提示是:您无权访问本产品。这事儿看着有些眼熟啊。今年3月,Figma封停了大疆及其他被美国制裁公司...
日期:08-23
张勇是阿里云的“救火英雄”吗?_阿里张勇演讲
作者/何必出品/新摘商业评论正值新年交替之际,阿里巴巴宣布了最新一轮组织调整。2022年12月29日,阿里巴巴集团董事会主席兼CEO张勇发出全员邮件宣布:张剑锋(花名:行癫)不再担任阿...
日期:01-07
改BUG、编故事、绘画 我不如AI_作画bug
写代码、修复BUG、编故事......这些看似只有人类才能完成的任务,都出自同一个聊天机器人之手。当地时间11月30日,OpenAI发布了一个全新的对话式大规模语言模型ChatGPT。作为GP...
日期:12-09
上市三年就换代,卖车真成了卖手机?_即将换代的车型能买吗
撰文 | 吴雪编辑|杨光出品|汽车产经快速增长的新能源车,也在马不停蹄地“制造”着新问题。最近,理想ONE因为换代停产问题再次被推上了风口浪尖。而在此之前,2021款理想ONE换代时...
日期:09-22
将切入3nm生产,台积电冲破重重障碍在美设厂究竟图什么?_台积电的3nm工艺
集微网报道,当地时间12月6日,台积电美国亚利桑那州晶圆厂举行了首批机台设备到厂典礼,台积电邀请了包含客户、供应商、学术界和政府代表在内嘉宾,一同庆祝这一重要里程碑。此前...
日期:12-10
百度终于等到ChatGPT「百度一下了」
作者/何必出品/新摘商业评论在“ChatGPT热”已经全球风靡两个月之后,百度决定入局。近日有多家媒体都报道,百度将在3月份推出类似OpenAI旗下ChatGPT的人工智能聊天机器人服务...
日期:02-04
后滴滴时代,华为腾讯要抢谁的4000亿蛋糕?
天猫的消费群体失意的滴滴,各怀心思的科技巨头作者 | 瀚 星苹果2月销量封面来源 | 摄图网App下架一年后,滴滴的网约车市场份额从巅峰时期的九成跌至七成,强敌环伺,蓄力待发。7...
日期:08-31
CES 2023向消费者释放了哪些行业趋势?_ces电子消费展
今年的CES 2023真可谓精彩不断,各大品牌纷纷发布了旗下最新的技术产品,在展会上大秀肌肉。如英特尔发布了13代酷睿移动端处理器,有U系列、P系列、H系列和HX系列。AMD的动作就比...
日期:01-11
打麻将是中国_中国麻将风靡全球 全世界都在喊“hu le”
2021年3月11日,一位澳大利亚艺术家创作了一个香港麻将店的微缩雕塑。(图/ 视觉中国)在中国,逢年过节,人们吃完饭转头就会坐上麻将桌。无论是走亲访友,还是朋友聚会,在家里热腾腾打...
日期:10-05
台湾为什么造不好电动车?「台湾自行车做得为什么那么好」
7年前,马斯克为了炫耀自家工厂,略带几分不屑地踩了一脚富士康:“相比手机,汽车工业非常复杂,你总不能去找富士康这样的供应商,告诉他‘给我造辆车’。”马斯克怎么也没想到,自己的...
日期:11-04