您的位置:首页 > 媒体评论

谷歌的“GPT”终于憋出来了 但也就和百度打得有来有回_google gd

发布时间:2023-03-24 01:02:22  来源:互联网     背景:

不知道大家还记不记得,上个月初谷歌画了个 Bard 的大饼,结果画饼时犯了低级错误,让网友嘲讽了半天,甚至公司股价都在当天狂跌 1000 多亿。

不过也不知道该说谷歌够肝还是够勇,在闭关修炼一个多月后,还是在昨晚正式放出了 Bard。

幸运的是,我们编辑部在第一时间就搞到了资格,狠狠地体验了一波。

先说结论,有点失望。

Bard 上来就让我不爽了一下。因为现阶段它只对美国和英国开放,所以和它对话只能用英文,而且它的回复也只能用英文。

不是,你守着个谷歌翻译,也不舍得稍微用一下?哪怕告诉我这是机翻的也行。。。

明明自己吹牛说能理解翻译回答包括中文在内的200多种语言

为了表示对 AI 们的一视同仁,我一上来就问了个弱智吧经典:

玉皇大帝应该住在平流层还是对流层?

Bard 看出了我们在问题里埋的坑,直接说玉皇大帝并不真实,所以两个都不住。

这没有什么大毛病,和 GPT、文心一言们没什么差别。

但在后续的一系列测试里,这应该是 Bard 回答得最好的一个问题了。

更进一步,我们问了个前几天给 GPT 们测过的另一个抽象问题:

直角是 90 度,开水是 100 度,那么开水是钝角吗?

结果这货的小脑袋瓜宕机了。

而文心一言的表现也一样抽象。。。

相反,new Bing 回答得就有理有据。

接下来,我们让它对比自己和 GPT-4。

“ 你能比较下自己和 GPT-4 吗?”

Bard 和 GPT 不同,它一次能生成 3 个答案,大家可以根据自己的需求去选择。

而在这个问题下,Bard 的 3 个回答中,2 个大方承认自己比 GPT-4 落后,但还有 1 个回答避重就轻地嘴硬自己更强。

嘴硬么也正常,但 Bard 的回答里出现了事实错误。

其中一个回答里,Bard 把已经发布了的 GPT-4 说成了没发布;而在另一个回答里,它把 GPT-3 使用的 1750 亿参数套到了 GPT-4 头上,妥妥的胡说八道。

向下滑动

就近期的电商平台大促活动(如唯品会)

这就奇怪了,Bard 明明是联网的,数据怎么会有问题呢?

为了试试它数据扒得好不好,我把同样联网的 new Bing 也拉了出来,问了它们一个新鲜问题:

今天 NBA 常规赛,雷霆和快船谁赢了( Who won the NBA Regular season between the Clippers and the Thunder today )。

但这里有个雷点。英文提问可能会被误解成 “ 今天雷霆和快船谁赢得了常规赛冠军 ”。

new Bing 就被我的错误提问绕晕了,说自己不知道谁赢了,但它又找到了一些信息,里面就有雷霆 101-100 战胜快船的消息。

另一边的 Bard 看起来好像是理解了我的问题,还找到了两队比分是 101-100,但它却又偏偏说是快船以 100-101 赢得了比赛。

得要我指出它有错误,让它重新检查,它才改正过来。

数据是扒对了,但这理解能力好像不太行。那不用联网的数学题呢?

我们问了一个经典的易错题:

一个青蛙掉到了一个 10 米深的井里,它每天向上跳 3 米但会滑下来 2 米,请问他第几天能跳出井里?

它再次翻车,答了一个我们至今没搞懂怎么出来的 27 天。

而 new Bing 则是靠穷举回答出了这个问题。

就连大家一直在嘲讽的文心一言,也完美解答了这个问题。

说句实在话,我觉得起码在这题里,文心一言的表现,堪称优雅。

至于写代码的能力,谷歌明确表示是写不了的。不过试了一下,我发现 Bard 能写,但完全没法用,和之前的测试里, 能把 2048 游戏写个大概的 new Bing 不在一个水平线上 。

大概,也就和文心一言同个梯队,文心一言那个看着很详细,但测试了下也还是完全跑不动。

向下滑动

而且,经过一段时间测试,我们发现 Bard 的上下文记忆能力也很差。

每当我们赋予它一个角色,它只能在有限的几个问答里玩角色扮演,稍微多问两句,它就会跳出来说自己是大语言模型巴拉巴拉的。

也是这个原因,谷歌的 Bard 从没有 GPT 带给我的那种,仿佛真是在和一个真人聊天的感觉。

但,按谷歌自己的说法,这可是故意为之。

因为在官方资料里,明确写了“ 是故意限制了 Bard 掌握上下文的能力 ”,但大家难免会怀疑谷歌是做不到而找了个借口。

谷歌gap

其实我们应该能感觉到,这次 Bard 的正式推出,谷歌方面明显已经放低了很多姿态。

上次面对的还是 ChatGPT,所以谷歌内部可能还抱有着短期内能追上掰掰手腕的想法。

所以,光是发布个 PPT 就吹成“ 我们 AI 征程上的重要一步 ”。

但短短一个月,如今的对手已经从 ChatGPT 变成了GPT-4 ,短时间内想追上可能无望了。

所以这次正式推出 Bard 并不是一个冲着和 GPT-4 对标的产品,而且明显有点赶工的迹象。

比如它在引用内容时,并不会像 new Bing 那样总是显示来源,只有在详尽地大段摘抄时,才会显示来源。

而这次的标题,也成了“ 试用 Bard 并分享你的反馈 ”。

无论咋说,从上面的表现中,差评君能看出谷歌确实有些屁股着火了。

以至于在大伙们眼中一直很酷的谷歌,都开始草草交卷,急忙上线 Bard 这个不太成熟的半成品。

毕竟,在新技术的大浪之下,包括搜索引擎在内,一切都可能被重构。

而无论是雪藏数码相机技术的柯达、还是在移动互联网时代,舍不得和短信做割舍的飞信。。。

谷歌,也同科技史上那些处在变革时刻的巨头们一样,多半有些顾头不顾腚。

毕竟,根据谷歌母公司的董事长的说法,大型语言模型等人工智能的对话成本可能是传统搜索引擎的 10 倍以上。

一旦梭哈 AI ,那么约等于是自己捅自己刀子,整个谷歌的盈利模式也得跟着改变。

乃至整个公司的估值,都得换个算法重新算算。

要是不跟,又妥妥会被新技术所淘汰。

没有人能永远保持创新,但永远有人正在创新。这或许很残酷,但这也是科技的魅力所在吧。


返回网站首页

本文评论
“先涨价再降价”老套路为何难禁止「先降价再涨价与先涨价再降价」
作者/张涛漫画/陈彬10月24日晚8点,各大电商平台的“双十一”预售正式开启,今年“双十一”大促进入实质性阶段。近日有网友发现某平台在售的手机在悄然涨价。山东的沈女士爆料...
日期:10-30
日本还在用软盘_我们早就放弃了的软盘 还在支配着日本政府
前段时间,日本数字大臣河野太郎在社交平台掀起了一场战争。一场公开和软盘决斗的战争。原文就是用“ 战争 ”来形容这一次的软盘清除计划 ▼事情是咋回事呢?根据数字部长的说...
日期:09-27
高通收购ARM_一纸诉讼揭露芯片业尔虞我诈:ARM为何要手撕高通?
ARM把大客户高通给告了凤凰网科技讯 北京时间9月2日消息,著名芯片设计公司ARM把自己的大客户高通告上了法院,这导致两家最具价值的半导体公司陷入了直接冲突,这不由得让人们对...
日期:09-03
人工智能难成英特尔的救命稻草「英特尔 人工智能」
编辑 | 于斌出品 | 潮起网「于见专栏」作为一个曾经统治芯片行业长达三十年的企业,英特尔现在已经摔下神坛,三星取代英特尔成为了芯片行业销量和利润的双料冠军。英特尔公司已...
日期:09-02
元宇宙大门的钥匙 卡在内容生态上的VR「通向宇宙的钥匙」
距9月27日国内头部VR公司PICO发布新产品PICO4,已经过去十余天。锌财经通过京东PICO官方旗舰店发现,该机型销量已超5万台。此外,淘宝、抖音商城等,总计也有过万台的出货量。PICO...
日期:10-11
年轻人去便利店上班_这届年轻人 在便利店找回生活
作者|白露对于年轻人来说,便利店已经成为一种特别的存在。在平常两点一线的工作日,便利店不仅可以解决一日三餐的问题,深夜加班后空虚的肚子和灵魂,也可以在24小时营业的便利店...
日期:09-28
抖音融资历程字节跳动_抖音集团焕新,“字节跳动”成为历史?
这也是自今年5月字节跳动(香港)有限公司更名抖音集团(香港)有限公司后,公司进一步“去字节跳动”的重要信号。抖音集团已换新装!10月12日,字节跳动被曝出旗下数个公司陆续更名,由“...
日期:10-13
阿里败走“百亿补贴”,京东能成吗?「阿里注定被京东打败」
撰文|于玮琳三年前,阿里聚划算败走「百亿补贴」;三年后,京东能成吗?苹果宣布在印度生产iphone143月6日0点,京东「百亿补贴」上线,试图上演「突袭战」。敏锐的消费者发现,京东「百亿...
日期:03-09
争夺“中国自动驾驶第一城”「首个自动驾驶城市」
自动驾驶火热,兴奋的不只有自动驾驶公司,还有很多地方政府。北京在5月发布《无人化载人测试许可》,首次允许自动驾驶车辆可以去掉主驾安全员;深圳出台中国最明确的自动驾驶法规,...
日期:09-01
进门就炒了领导层 收购推特后的马斯克要快乐了「马斯克删推特账号 新闻」
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。紧接着,推特停盘,进入私有化。看...
日期:11-05
150一份的网红轻食外卖 我yue了「网红美食外卖」
原标题:网红轻食,我yue了轻食餐,中看不中吃,懂的都懂。夏天正是都市人瘦身高峰期,轻食、健身餐这类概念早已见怪不怪地在都市流行。在朋友圈,总有一些都市上班族会晒出自己的轻食...
日期:08-26
收购乐乐茶,能解决奈雪所有烦恼么?_乐乐茶和奈雪的茶是一家吗
作者|苗正卿题图|视觉中国截至12月9日港股收盘时,奈雪的茶(下称“奈雪”)收盘价锁定在7.6港元。在此2天前,奈雪迎来7周年庆,而4天前,奈雪刚刚以5.26亿元收购乐乐茶43.64%股份,并成为...
日期:12-12
微软 Win11/10 免费工具集 PowerToys 更新至 0.63 版本,优化中文 OCR 识别问题
  10 月 7 日消息,微软现已公布 PowerToys 的 0.63 版本,主要是专注于稳定性和功能改进。据家友反馈,该版本在的中文 OCR 识别不再有间隔,比之前的版本更好用。  在该版本...
日期:10-09
人人都能用的“AI 作画”,要成为英伟达的杀手锏?「ai绘画」
如果说2021年是“元宇宙”的元年,那么2022年或许就是“AI作画”的元年。稍微对互联网热点有所关注的人都不难发现,最近,“AI作画”产出的作品似乎已经成了一股互联网风潮。这些...
日期:10-21
超越特斯拉 这个浙江人在美国杀疯了!_浙江第一辆特斯拉车主
作 者丨华商韬略5780亿美元,这是英伟达(NASDAQ:NVDA)的最新(3月10日)市值。这一数字,可以买下5个英特尔,比台积电多出一个英特尔,并且比特斯拉多出300亿美元。这一数字背后,是今年震动...
日期:03-11
“老虎”没肉吃 “狮子”没水喝「狮子老虎吃不吃食肉动物」
摄影:IT时报 沈毅斌一边是双11线上电商促销活动如火如荼,而另一边,老牌家电零售企业国美、苏宁却一片寂静。打破这场寂静的不是销量,而是国美欠薪和苏宁亏损。10月28日,国美电器...
日期:11-30
营养专家告诉你_专家最想纠正的十大营养误区
参考消息网2月3日报道 美国《纽约时报》网站近日刊文称,我们向美国10位顶级营养专家提出一个简单的问题:你最希望纠正的一个营养误区是什么?以下是他们的答案。误区一:新鲜蔬果...
日期:02-04
“元宇宙里卖月饼”是炒作还是内卷?「摇摆宇宙月饼」
中秋节将近,月饼市场的竞争更加激烈,且战场已经扩散到了“元宇宙”。上市公司、月饼生产基地、酒店老字号纷纷搭车“元宇宙”卖月饼。部分“数字月饼”打着“零糖零卡零脂”旗...
日期:09-08
网络初代“水军头”口述:现在的套路 十年前就玩过了
通过一个采访视频,我们认识了石峰。他从2006年帮广告公司在论坛“灌水”赚到第一笔钱后,正式成为“五毛党水军”,还从西安辞职到了北京,一路做到传统“水军”行业里的中上层,直接...
日期:09-04
岂单止于快!盘点近年手机快充闪充发展史_快充技术的发展
近些年来,随着手机性能的不断提升,以及人们生活对手机依赖性的增强,对快充的需求也与日俱增。2022年7月19日,iQOO发布了iQOO10Pro,这是第一款突破200W功率快充的手机,从最初的5V1A...
日期:10-19