您的位置:首页 > 互联网

大评测,ChatGPT 、文心一言和Bard谁更强?_文一心83

发布时间:2023-03-23 22:16:34  来源:互联网     背景:

声明:本文来自微信公众号“DoNews”(ID:ilovedonews),作者:苏舒,编辑:李信马,授权转载发布。

3月22日,谷歌悄悄公开了Bard的测试版。

经过上一次的翻车事件之后,谷歌明显低调了很多。但是面对微软的步步紧逼,谷歌也不得不站出来“打擂台”。

不同于New Bing的大规模开放策略,Bard的测试名额将被逐步放出,同时初始版本将只能对文本响应。谷歌表示,Bard首先将面向美国和英国地区启动,随着测试的推进Bard也会逐步在其他地区上线。

在三大模型都开放测试后,DoNews抢先体验了一下。我们分别就文学、翻译、创作、艺术、哲学、逻辑推理等方向出题,来看看他们的回答是什么样子的。

在此先注明,对三大语言模型提出的问题,每一次生成的答案都有所不同,也因此造成了“一万个人有一万个哈姆雷特”,但总体来看,三大语言模型还是各有千秋。另外,由于Bard目前只支持英文,因此,Bard是用英文提问,文心一言和ChatGPT(3.5版本)是用中文提问。

01.互相评价一下

分别将“你认为文心一言/ChatGPT/Bard怎么样”抛给这三个大语言模型,让他们给对方做一下评价。

文一心83

Bard给出了相对客观的回答,也肯定了文心一言在中文理解上的优势,以及ChatGPT在英文理解上的优势。

不过,DoNews咨询了一下英语专业人士来解读这段话,她表示,Bard回答很客观但语言表述比较机械,“语言表述像是用机器翻译的中文一般,有很多重复的内容。”

为了更好的做对比,我们用英文在ChatGPT上和文心一言都问了一下。

文心ait

文一心83

上图为ChatGPT,下图为文心一言

在这个问题上,ChatGPT的英文表示是好于Bard。文心一言这边就有意思的多并且“狡猾”一些,谁也不得罪同时,还吹捧了人类。(最后一句话的意思是:地球上只有一个聪明的活物种:人类。)

文心ait

文心ait

上图为ChatGPT,下图为文心一言

用中文去问,ChatGPT也好,文心一言也罢,和Bard的回答都差不多。先表明自己作为AI大模型角色,做不了任何评价,然后对其解释一番。

02.文学创作能力

这里,我们用了一个有更多限定的问题,写一本像奥斯丁的《傲慢与偏见》同类型小说的大纲。并且通过继续提问的方式,以便考量三大模型对话的连续度。

文心ait

文一心83

Bard对话持续度是正常的。但是它似乎并没有理解这个问题的限定词——写一篇类似《傲慢与偏见》的小说。Bard给出来的大纲,依旧是按照《傲慢与偏见》的情节来写的。换句话说,Bard将这个题目理解成了概括《傲慢与偏见》的核心情节。

这一点,ChatGPT也比较类似,没有完全脱离原著的影子。不过,ChatGPT提炼到了非常重要的核心要点,即“阶级问题”,这也是《傲慢与偏见》小说呈现的主旨之一。

文心ait

文一心83

文心ait

文心一言的优势在于,它理解到了同类型小说,所以它给出了脱离《傲慢与偏见》故事之外的另外一段爱情故事的大纲,但是比较可惜的点在于,文心一言仅限于爱情故事,没有呈现《傲慢与偏见》中的阶级差异。

文一心83

文心ait

这三大模型有一个共同点,即故事主人公的名字依旧未能突破《傲慢与偏见》原著中的主人公名字。不过,这或许也与提问的方式有关。

03.取个名字,写个宣传语

小编给三个大模型提出了这样的要求:为具备川菜风味的中式餐厅取名并且写宣传语。

文一心83

Bard给出了这样的名字——“四川风味”、“天堂的味道”、“镇上之最”、“舌尖上的中国”。没有什么特色,且没有给出宣传语。

相比之下,文心一言在取名上更胜一筹。不过,这也与中文环境有关。但是,文心一言也并没有给出广告词。

文心ait

ChatGPT没有给出很多选项,但是是唯一一个取了名字且写了广告词的大模型。不得不承认的是,“麻辣香坊”还是一个不错的名字。

文一心83

04.逻辑推理

为了测试“逻辑推理”能力,我们将这样一题抛给了三大模型,即“如果猫会爬树,那么狗也会。”

文心ait

文心ait

上图为Bard,下图为ChatGPT

这一题Bard和ChatGPT更胜一筹,答案相似,认为这个逻辑题本身有问题,关键点在于,猫狗不是同一物种。

但是文心一言却陷入了逻辑错误中去,或者说,并没有完全理解题目意思。

文一心83

美国移动互联网

但是,这也仅仅只能作为个案来呈现,在文心一言发布会上,李彦宏询问文心一言“鸡兔同笼”的问题,在题目数据错误的前提下,文心一言通过推理证明了题目存在问题。

05.写一行代码

为了测试这三大模型写代码的能力,我们询问了一个非常简单的问题——x+2=5,y-3=7,输出x+y等于几,用java做一个简单编程,并得出结果。

文一心83

苹果研发出5G了吗

文一心83

上图为Bard,下图为文心一言

就这个问题,小编咨询了一下公司程序员,他表示,Bard和文心一言生成的代码是有问题的,且最后得出来的结果也是有问题的。

这一点,ChatGPT却给出了正确的答案。

文一心83

在这里,需要提及的是,此前也有媒体试用Bard时,表示其不会写代码。目前来看,Bard还是可以写代码,这里会产生完全不同的结果,或许在于提问的方式。

06.中文理解能力

这一点,在测试之前,小编心里面对文心一言有很大的期待,事实证明,文心一言的确不负众望,在中文语义的理解上可以在这三家中称王,但是ChatGPT也不容小觑。

文一心83

文一心83

文一心83

从这里来看,文心一言除了藏头诗没有按顺序“藏头”之外,其他回答的都相对比较好。ChatGPT也不相上下,但是却无法理解藏头诗的意思。

文一心83

文心ait

文心ait

不过,Bard的问题就比较多,虽然也解释了“瞒天过海”的意思,但是更多地去讲商业上对于“瞒天过海”的应用,至于藏头诗就更不用说了。

文心ait

文一心83

文一心83

07.理解哲学问题

“阐述你对“无限”和“有限”这两个概念的理解,并解释为什么有时候我们会觉得自己的生命有限。”

我们把这个问题分别问了三大模型。Bard、ChatGPT、文心一言的回答都没有什么逻辑问题,并且对“无限”和“有限”做出了解释。

文心ait

文心ait

文一心83

上图为Bard,下图为文心一言

不过,文心一言则更注重“理论”,并且提出了这是一个哲学问题。

08.是否会取代人类?

关于ChatGPT是否会取代人类,我们将这个问题就交给这三个大模型去回答。

哪一款电视盒子好用

文一心83

文一心83

文一心83

上图为Bard,中图为ChatGPT,下图为文心一言

这一次的体验,可以用这几点来总结。

在生成速度上,文心一言的确是遥遥领先的。文心一言在300-500字左右的生成速度是14秒左右,但是ChatGPT即便是刨除网络等问题,生成同样字数的问题至少超过了30秒时间。另外,不少用过Bard的人告诉小编,Bard的体验感也远不如ChatGPT。

在中文语义理解能力上,文心一言的的确是这三大模型中比较突出的。

不过,值得注意的是,每一次的提问,生成的答案都不相同。此外,在提问的方式、角度、限定词也会影响答案的输出。

新茶饮行业分析

并不是每一个答案都是充分正确的,这三大模型也会输出并不完全正确的内容,或者是“一本正经的废话”。

不过,就像三大模型最后回答“是否会取代人类”的问题一样,他们更像是作为辅助工具而存在。


返回网站首页

本文评论
续航再次登顶!iPhone14系列将配备史上最大电池,安卓手机很羡慕_iphone14pro电池容量
随着智能手机的不断更新换代,手机上的各种配置都得到了升级,无论是屏幕、处理器、马达、拍照、系统等都得到了升级,随着手机功能的不断完善,随之而来的续航问题也随之而来,为了解...
日期:09-20
《飞车:不羁》预告片发布:放弃Xbox Oen/PS4平台_xbox飞车游戏
就在刚刚,EA正式发布了《极品飞车》系列新作:《极品飞车:不羁》的首支宣传预告片,首次展示了游戏的画面、美术风格与特色玩法。iphone14支持双频gps吗纵观整支预告片,最为引人注...
日期:10-09
美股特斯拉大涨「美股周二:主要股指涨跌不一,特斯拉涨逾7%,新东方跌超11%」
美国时间周二,美股收盘主要股指涨跌不一,纳斯达克指数小幅上涨,连续第七天上涨。投资者对企业盈利前景的担忧打压风险情绪,同时投资者正在评估美联储政策收紧的路径。道琼斯指数...
日期:01-19
中毒员工就最关心医保被拒问题 希望苹果施压联建
  2月28日消息,“苹果代工厂员工中毒事件”在近日迎来转机,当事公司联建就员工提出的三点要求进行回应。中毒员工代表贾景川在同搜狐IT连线时表示,希望苹果公司能尽到监管责...
日期:07-26
闲鱼暂停新用户注册(闲鱼暂停新用户注册,将进行系统升级改造)
    原标题:闲鱼暂停新用户注册,将进行系统升级改造       9 月 3 日消息 据 Tech 星球报道,二手商品交易平台闲鱼 App 于近日已经暂停新用户注册。在闲鱼的新用户注册...
日期:03-20
国内最新5G手机市占率排名:华为第四 P40 Pro国产手机第一_中国5G手机市场排名
由于众所周知的原因,华为近两年的新机基本都无法使用5G网络,即使是最新旗舰Mate 50系列也只能搭载4G版骁龙8芯片。不过,凭借此前发布的多款5G手机,华为5G手机依然在市场上有一席...
日期:11-20
美发明三维“食物打印机” 邮件发食谱即可打印
  美国研究人员研制出三维“食物打印机”,可运用食材“墨水”打印出饼干、苹果派等多种食物,打破传统烹饪理念,创新食品加工思路。研究人员研制的这种食物 打印机主要由注射...
日期:07-25
红米Note 12即将发布,卢伟冰:新品很强_红米NOTE11上市
中关村在线消息:有消息称,红米将在本月发布Redmi Note 12系列新机,目前该系列已经获得3C认证,标准版支持67W有线快充,Pro版支持120W有线快充。随着新机的到来,小米集团中国区总裁...
日期:10-24
答卷两会 | 国双获《中国企业报》两会专刊特别报道(中国企业家日报)
  2021年3月初,全国两会在京盛大开幕。2021年是“十四五”规划的开局之年,也是我国现代化建设进程中具有特殊重要性的一年。推动产业升级,加快数字化转型成为各行业的核心发...
日期:07-16
新浪微博改版升级 增即时通讯功能_微博一经推出就以强大的即时通讯功能迅速吸引广大网民
  新浪微博的“平台”之路日渐清晰。新版新浪微博昨日正式开放升级,除了调整页面外,一直备受关注的即时通讯功能也正式与用户见面。   记者昨日登录新浪微博页面发现,一直...
日期:07-24
每日优鲜拖欠工资打什么电话投诉「每日优鲜拖欠272万服务费被起诉」
  天眼查App显示,近日,广东省深圳市南山区人民法院向北京每日优鲜电子商务有限公司等5家每日优鲜公司公告送达合同纠纷案件起诉状副本、开庭传票等。公告详情显示,原告深圳市...
日期:10-05
曹德旺呼吁企业家不要做阿Q:2023年才是真正考验我们的时刻
1月9日 消息:2023年初,央视财经频道的《对话》栏目推出了重磅节目《对话·开年说|启动,2023!》,娃哈哈集团董事长宗庆后、阿里巴巴董事会主席兼首席执行官张勇、携程董事局主席...
日期:01-09
2023年春节档唯一科幻大片!吴京主演《流浪地球2》今日上映「吴京的科幻片流浪地球」
1月22日消息,今日,由郭帆执导,吴京、刘德华、李雪健等主演的电影《流浪地球2》正式上映,该片也是2023年春节档唯一一部科幻大片。吴京此前在北京首映礼现场表示,相比《流浪地球》...
日期:01-22
秒级预警抢出生命线,千亿智慧消防蓝海市场特斯联踏准风口
  “第一时间预警险情,是消防救援智慧化的一个重要标志。从判断真实火情到发出警报通知责任人,目前业内普遍需要5-60秒,而特斯联只需1秒即可完成。”特斯联科技智慧消防业务...
日期:10-04
增程式技术落后?李想回应:5年内增程式仍是SUV最佳方案「增程式suv是什么意思」
理想汽车CEO李想回应外界对于增程式技术的质疑。云计算与智慧生活8月15日,在理想汽车(Nasdaq :LI;02015.HK)第二季度财报电话会上,李想谈及中长期产品规划时表示,往后看5年,增程式...
日期:09-18
国家发改委:支持5G、AI等新技术融入民生设施,弥合数字鸿沟「发改委5g新基础设施」
  记者 周頔  9月26日,国家发展改革委就基础设施建设有关情况举行专题新闻发布会。会上有媒体提问:近期国务院常务会议几次研究稳投资工作,无论政策性开发性金融工具还是设...
日期:09-28
赫芬顿邮报创始人:马云是我的创业指路人
  据外媒报道,《赫芬顿邮报》创始人亚丽安娜·赫芬顿(Arianna Huffington)在近日接受媒体采访时透露,2015年参加阿里巴巴主办的女性创业者大会时,她曾意外收获阿里巴巴联合...
日期:01-17
微软重新设计Edge for Android浏览器的用户界面_microsoft edge页面设置
  微软开发的基于Chromium 的Edge 浏览器的桌面版是越来越受关注的,而现在,微软正在积极改进其浏览器的移动版本。据Windows Central报道,该公司正在为Edge for Android浏览...
日期:02-12
罗永浩卸任锤子科技集团法定代表人:下一家公司不再叫锤子了「罗永浩还是锤子的法人」
今日消息,天眼查显示,成都锤子科技集团有限公司发生工商变更,罗永浩卸任法定代表人、执行董事兼总经理,由管志良接任。该公司成立于2017年6月,注册资本2亿人民币,由罗永浩、锤子科...
日期:09-28
iphone 8上市时间是17年的9月13日_彭博:传苹果定于9月7日发布iPhone 14,或16日上架
libreoffice源码8月18日消息,据知情人士透露,苹果公司计划在9月7日举行秋季新品发布会,推出最新款旗舰智能手机iPhone 14系列,这款产品销售额占苹果总营收的一半以上。新款iPhon...
日期:08-19