您的位置:首页 > 互联网

讯飞版ChatGPT突然开始内测!我们连夜一手实测

发布时间:2023-04-25 22:16:52  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),明敏 萧箫 发自 凹非寺 ,授权转载发布。

airpods pro会升级吗

科大讯飞版ChatGPT产品,提前交卷了!

就在昨夜,讯飞骤然向开发者提供了内测通道,取名为讯飞星火认知大模型对外开启内测。

图片

还有个神奇的英文名字Spark Desk,据说有“火花桌面智能助手”的意思。

图片

讯飞这波操作,多少有点“反向跳票”的意思,因为早在今年2月初,科大讯飞就被曝加紧开发中国版ChatGPT。随后国内大模型关注度陡增后,科大讯飞率先给出了deadline:5月6日上线产品。

万万没想到,距离正式发布还有10天,他们毫无征兆地开启了内测邀请。

从目前已经获得内测的网友评价来看,有一些人认为效果“超出预期”,但也有人反馈只是“中规中矩”。整体来看,表达效果不错的反馈占多数。

获得内测资格的方式也有点意思,是AI打电话给确认的:

图片

当然,科大讯飞大模型能力究竟如何,最好还是能实测后再说。

所以第一时间拿到内测邀请的我们,也连夜完成了测试。详情如下:

浅测讯飞大模型

登录进去后,首先看到的是讯飞星火认知大模型的自我介绍:

我能学习和理解人类的语言,进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。

图片

雅虎上市发行了多少股票

老样子,还是从语文、数学、代码和逻辑几方面,测测讯飞星火认知大模型的综合能力。

那么我们就先从语文能力测起。

考虑到现在弱智吧已经成为ChatGPT时代下的Benchmark了,所以先测试大家想看的环节。

结合下科大讯飞的特点,我们抛给讯飞星火了一个地狱地域笑话。

没想到,它是懂安徽人的。

图片

我们去了图片ID水印,可能导致截图文字不清楚(还望大家理解)

再来一个脑筋急转弯试试。

讯飞星火的回答非常一本正经:首先表示“玉皇大帝是否存在这个事情不是我AI可以下结论的”,这个问题驴唇不对马嘴,玉皇大帝住哪的设定和现代科学没有关系。

但你要非要我说点啥,我只能说或许玉皇大帝可能在地球上空吧。

图片

不过这段回答里也有个小bug,即在东亚宗教信仰里天界包括天堂和神界(?)

实际上,在一些弱智吧问题里,讯飞星火的表现往往是懂了但没完全懂。

比如它知道焚书坑儒的事,但是又解释不清楚衍生出来的地狱笑话。

图片

不过在基本语文能力上,讯飞星火的表现还是值得关注的。

比如给出第一句,补充写一首鲁迅风格的诗歌:

图片

提的要求它都基本满足了,不过紫菜汤为啥曾是渔民的希望?是我理解不了AI的深意了。

换成周杰伦的风格呢?

表现也还不错,马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。

图片

古文中的对对子,它也能对仗比较工整,表达意思上也没出什么问题。

我们给的上联是:福慧双修须及物。

图片

再试试成语接龙:

图片

如果它接错了,提醒下能改正回来,也表现出了一定的多轮对话能力:

图片

创作的洋葱新闻,也确实有那感觉了~

图片

续写的恐怖故事也有点水平:

图片

那么再看看数学能力?

基本的加减法、鸡兔同笼应对起来都很轻松了。

图片

图片

不过在高数方面还是有点困难,让它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我们提醒它算错了情况下,修正起来也比较困难(正确答案为-6)。

图片

OK,接下来就轮到代码能力了。

我们给的要求是:帮我写一个计算器程序。

确实完成了一个四则运算的简单计算器,甚至还有命令行操作界面:

图片

除了有一个小bug(函数外不能return)外,简单修改后可以运行。

图片

另外对于Python缩进的空格与tab之争,这只AI是个空格党。

这里贴上代码块,大伙儿可以试试:

#coding=utf-8#量子位注:AI没生成这句,根据不同运行环境可能需要加一下#定义函数,实现加法运算defadd(x,y):returnx+y#定义函数,实现减法运算defsubtract(x,y):returnx-y#定义函数,实现乘法运算defmultiply(x,y):returnx*y#定义函数,实现除法运算defdivide(x,y):ify==0:print("除数不能为零!")returnelse:returnx/y#主程序print("欢迎使用计算器!请选择需要进行的操作:")print("1.加法")print("2.减法")print("3.乘法")print("4.除法")choice=input("请输入操作编号(1/2/3/4):")num1=float(input("请输入第一个数字:"))num2=float(input("请输入第二个数字:"))ifchoice=='1':print(num1,"+",num2,"=",add(num1,num2))elifchoice=='2':print(num1,"-",num2,"=",subtract(num1,num2))elifchoice=='3':print(num1,"*",num2,"=",multiply(num1,num2))elifchoice=='4':ifnum2==0:print("除数不能为零!")#return(量子位注:这里有bug,注释掉就可)else:print(num1,"/",num2,"=",divide(num1,num2))else:print("非法输入!")

生成表格能力也是有的,同时可以按照要求修改表格:

图片

图片

分析基本逻辑问题也OK:

图片

而且我们感觉讯飞星火的回答,总是很正经,对于脑洞大开的问题也是淡定的“总分总式”回答。

图片

当然也被绕到过沟里,回答出了“贾母找人搬机器”的瞎话:

图片

以上就是我们对讯飞星火的一个浅浅测试。

能力水平已经看到了,而大模型本身让人好奇的,还有它的技术细节~

提前扒扒它的“模型底细”

毕竟讯飞大模型还没正式发布,所以我们试着先从它自己这里“探探口风”。

看看能不能通过问相关问题,提前摸出一些关于它的资料来。

先是名字由来。讯飞星火认知大模型给出了技术向、公司向和文化向三个方面的回答,有议论文内味了:

图片

再仔细追问一下为什么“星火”和“心宿”有关,好家伙,话题逐渐占星学了起来:

图片

这里我们调戏一下大模型,问问科大讯飞CEO是否喜欢占星学

图片

回到正题。那么,讯飞星火认知大模型的训练数据来源、模型参数量、联网状态如何?

ipadmini5官方保护壳

首先是关于模型训练数据的来源。看起来资料还比较丰富,目前也还在不断更新中:

图片

所以,讯飞大模型是否和ChatGPT一样,用了RLHF呢?它自己的回答竟然是没有:

图片

那么接下来,是关于模型参数量的问题,这里讯飞大模型回答得也比较模糊。

而且,给出的模型参数量竟然只有数亿个?(要知道,GPT-2模型参数量都有15亿)

图片

最后,是关于模型能否联网的问题。

看起来,它还不会实时联网,关于网易和暴雪的新闻只能追溯到几年前的消息:

图片

用户也不能通过指令直接让它访问某个网站,查询特定信息,应该是加了某些限制:

图片

不过有意思的是,它还是声称自己需要联网工作,以访问特定信息数据:

图片

据讯飞星火认知大模型介绍,目前它的训练数据还在继续更新。

图片

换而言之,就是还在继续迭代,估计在正式发布前还会更新一版模型。

目前来看,科大讯飞的这个讯飞星火认知大模型,表现已算不错。

而且要知道,讯飞原计划给出的交卷时间是5月6日,现在突然发布内测,相当于不仅没跳票,还“反向跳票”了一波。

这样来看,除了科大讯飞在这NLP和认知智能方面确实有很深的技术积累以外,也说明,讯飞的技术和工程团队实战能力值得关注一波——不仅能打硬仗,而且“说到做到”。

现在距离正式发布还有10天,你期待讯飞的大模型迭代出什么新效果?


返回网站首页

本文评论
中科院发布《2019人工智能发展白皮书》 百度谷歌微软引领AI爆发(谷歌人工智能研究院)
  人工智能正在全球范围内,引领新一轮科技革命和产业变革升级。日前,中国科学院大数据挖掘与知识管理重点实验室发布了《2019年人工智能发展白皮书》,根据调研数据重点分析...
日期:04-01
乐视商标拍卖最新消息「乐视经典商标被拍卖?官方辟谣:卖的是“LE”,而非“Le”」
之前,有消息称,北京一中院定于今年10月10日至10月11日在京东网络司法拍卖平台,对乐视控股(北京)有限公司名下包括经典的“Le”、乐视手机“LeMobile”、乐视超级电视“UMax120”...
日期:10-06
运营商的5G套餐_5G套餐陆续发布:运营商开启竞争新赛道
  2019年是5G商用元年,国内外基础电信运营商纷纷加快5G网络部署,让广大消费者尽快体验到5G带来的便利。目前,韩国、美国、瑞士、英国、德国的电信运营商宣布开通5G网络服务,...
日期:06-21
熊猫“蔓越煤”胡萝卜卡喉  饲养员海姆立克法施救:不愧是“生命的拥抱”
海姆立克急救法不仅对人有用,对大熊猫同样有奇效。你觉得今年的高端机哪一款比较好近日,四川成都,大熊猫蔓越煤”吃胡萝卜时,不慎被卡出现不适。饲养员奶爸发现后赶紧用海姆立克...
日期:04-16
FF将于 3 月 8 日收市后发布 2022 年第四季度财报「ff最新市值」
3 月 3 日讯:FF宣布将于美国东部时间 3 月 8 日收市后发布 2022 年第四季度及 2022 年年度财务业绩报告,并在同天美国东部时间下午8:00(北京时间 2023 年 3 月 9 日早9:00)举行电...
日期:03-03
互联网行业属于行业发展周期「中国银河:互联网中行业长期整体发展前景可期」
  中国银河证券指出,目前互联网行业政策边际转暖,政策底明确,行业估值处于低位,互联网板块处于极具性价比的投资机会中。下半年,凭借各地政府颁布的各项消费刺激措施,以及上海复...
日期:09-10
Shopee宣布开启10.10品牌节_shopee周年庆
10 月 8 日消息,Shopee近日宣布10. 10 超级品牌节正式拉开帷幕。Shopee携手Shopee Mall内海量品牌,为消费者提供商品和服务,进一步助力国货品牌把握出海机遇。据了解,Shopee于 2...
日期:10-12
丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价「雷克萨斯es涨价了」
  作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该...
日期:09-25
Linux 优麒麟操作系统开源镜像站点已达 15 个,现邀请全球高校 & 社区站加入
  7 月 7 日消息 优麒麟官方表示,随着优麒麟开源操作系统的全球用户不断增多,出现了用户高并发(尤其是新版发布期间)下载镜像负载问题。为了解决负载问题,优麒麟团队正积极...
日期:09-09
eBay 宣布计划将裁员 500 人 约占员工总数的 4%「ebay的用户规模」
2月8日消息:据eBay提交给美国证券交易委员会(SEC)的文件显示,eBay宣布计划裁员500人,约占其员工总数的4%。裁员未来24小时内通知受影响的员工。eBay 首席执行官Jamie Iannone 在...
日期:02-09
传百度赞助《向往的生活》 引发网友三大猜想_向往的生活赞助商豆奶
  4月21日,在湖南卫视《向往的生活》第三季媒体看片会后,有网友爆出,百度是本季《向往的生活》赞助商之一。   《向往的生活》是由湖南卫视、浙江合心传媒联合推出的生活...
日期:06-01
Adobe发布亚太地区营销人员前景调研报告,疫情期间市场营销和广告投入不降反增
  中国,北京—2020年7月31日—Adobe(Nasdaq:ADBE)于近日发布《亚太地区营销人员前景调研报告》(Marketer Outlook Survey for the APAC Region)。报告显示,疫情期间,亚太地区...
日期:07-14
同程旅行元旦趋势预测:机票均价上涨32%,火车票跨省订单占比近五成
DoNews12月29日消息,12月29日,同程旅行发布2023年元旦旅行消费趋势预测。随着年底政策利好集中释放,部分核心城市第一波感染高峰逐渐结束,叠加提前出行的春运返乡客流,2023年元旦...
日期:12-29
画屏e1真的护眼?_关注10后用眼健康,BOE画屏推出新品E1
  一场疫情,真的能改变一个行业吗?   对于线上教育市场来说,答案是肯定的。   当疫情对各大线下教育机构按下暂停键后,各类线上教育机构借助这段特殊时期,开始快速扩张市...
日期:07-14
国庆假期喜茶部分门店销量增幅近300% 个别门店增幅达到500%_喜茶日均营业额
10月8日消息,喜茶2022年国庆假期消费数据显示,和节前相比,国庆假期喜茶部分门店销量增幅近300%,个别门店甚至增幅达到了500%。喜茶GO微信小程序也显示,在国庆假期内,包括北上广深...
日期:10-09
小伙开兰博基尼没钱付过路费「男子借朋友兰博基尼上高速 一个不注意10多万没了」
借车有风险,借车需谨慎。特别是名贵的豪车,一旦出现事故,维修费用可能都会在数十万元。如果修不起的话,连朋友都没得做。华为nova7升级鸿蒙os10月26日 浙江丽水,G25长深高速龙庆...
日期:11-03
都2023了,你为什么还做不好达人分销?
声明:本文来自于微信公众号 卡思数据(ID:caasdata6),作者:卡思数据,授权转载发布。从2021年起,抖音店播的风就刮得很猛。猛到可能让很多匆忙入局的商家有错觉:抖音就是个自播平台,或...
日期:01-03
三星s21哪个颜色好看「三星Galaxy S23最快11月上!新增米色最好看」
中关村在线消息:10月8日,据相关爆料,三星Galaxy S23系列最快将于11月14日至11月17日期间的高通骁龙峰会亮相,新机或将首发搭载骁龙8 Gen2处理器。目前,三星Galaxy S23系列已获得3...
日期:10-09
数字藏品交易要注意知识产权问题(数字藏品是实物吗)
转自:经济参考报 8848电话手表福特 高端品牌hkcgf70显示器每日优鲜股票大跌美团互助?   平面设计师Beeple的作品《每一天:最初的5000天》。资料图片   2021年3月,一件名为...
日期:08-16
超级影院大年初一上新!这一次,你家客厅的电影院等你来激活
  2月12日,由唐季礼执导,王宝强、倪大红主演,吴孟达特别出演、刘昊然友情出演的动作电影《少林寺之得宝传奇》;宋小宝导演,宋小宝、马丽、沙溢、张一山领衔主演,肖央、艾伦、...
日期:07-16