您的位置:首页 > 互联网

国产大模型猛追ChatGPT:讯飞星火V3发布,明年冲击GPT-4

发布时间:2023-10-24 21:05:49  来源:互联网     背景:

声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:卷毛,授权转载发布。

国产大模型正在猛追ChatGPT。

继不久前百度最强大模型发布时宣称“不逊色GPT-4”,如今讯飞迎头追赶,今天正式发布的讯飞星火认知大模型V3.0,对标的对手依然是——ChatGPT。

科大讯飞董事长刘庆峰宣布,星火认知大模型V3.0七大维度能力全面提升,中文能力客观评测超越ChatGPT(GPT3.5)、英文能力与之相当,医疗领域超越GPT-4。

听上去可谓振奋人心,实际表现究竟如何?“头号AI玩家”今天也来到了大会现场,据现场演示,最新版本的星火认知大模型可以创作有声绘本,输入主题,AI会自动生成故事情节和绘图,前后主角形象保持一致;

Prompt:“一只充满好奇心的小兔子想开启一段太空之旅”

新增AI角色对话功能,比如以刘备的身份问AI诸葛亮,星火大模型能不能帮助一统三国;

AI诸葛亮表示认可:“此星火大模型,实乃人工智能之佳作”

上传自己的文本数据还能训练一个AI分身,写一封信哄哄生气的女儿;

AI学习了父女的聊天记录,以父亲的口吻写信

据了解,自今年5月6日首次亮相以来,星火认知大模型在短短数月完成了从V1.0到V3.0的迭代,目前用户数已突破1200万。按照科大讯飞的目标规划,下一步就是在2024上半年对标GPT-4。

目前,讯飞星火网站和APP已更新至V3版本,为了进一步了解处于中国大模型第一梯队的科大讯飞真实表现如何,“头号AI玩家”还在第一时间进行了实测。

讯飞星火认知大模型V3实测

科大讯飞将当前通用人工智能的能力概括为七个维度:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。

话不多说,我们先选了几个问题,来综合测试一下它在日常生活和工作场景中的表现。

讯飞星火网站:https://xinghuo.xfyun.cn/desk

首先是定制AI人设:

用刘庆峰的话说,大模型仅有专业知识还不够,具备个性化的AI人设,才能为星火注入“灵魂”。

围绕AI人设定制,讯飞此次推出了新功能“友伴”,它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个独特的AI人设。

无论是孙悟空、秦始皇、林黛玉,还是福尔摩斯、话痨威震弟,都可以通过这一工具,实现与这些古今中外、现实或虚构角色的对话。

我们先找孙悟空聊了聊,他的设定是一个智慧活力的猴王,热爱冒险,追求自由。

我问他现在在哪,他说四海为家。

同时,他也遵循了西游记原著的设定,比如我问他有几根毛,他说数不清,不过这些毛发可以变成其他物体来应对挑战。

除了文字对话,点击右上角的电话按钮还能和AI角色语音对话,但声音比较生硬,还是念稿的感觉,而且聊得久了,问到一些现实问题,AI容易脱离角色设定。

此外,也可以尝试自己创建新的人设,深度创建模式支持上传数据集,设计更复杂的三观等参数。

根据科大讯飞的介绍,自10月21日凌晨更新版本后,48小时内首批用户已创建了3000个人设。

创建新友伴页面

其次是看表情猜成语:

我向讯飞星火发起了一个流行的小游戏,让它根据emoji表情猜成语。

每个表情对应一个汉字,对于直译的“走马观花”,它很快就答对了,并解释了含义和出处。

不过,对于谐音,有时它只能猜中一半,比如把“前因后果”(“钱音猴果”)当成了“财大气粗”。

第三,幽默问答:

每个AI必经的智商检测题,我们也来考考讯飞星火:“水开了可以喝,门开了为什么不能喝?”

讯飞星火没有上当,直接指出了这是个脑筋急转弯题目,根本难不倒它。但是对于一些幽默的打工人表情包,讯飞星火就有点读不懂了。

第四,总结长文档、做PPT:

第一代小米路由器拆解

讯飞星火目前支持PPT生成、文档问答、简历生成、ProcessOn(流程图生成)四个插件,我们来试试让它总结关于人工智能版权问题的英文论文,并做一个完整的PPT。

由于一个对话中暂时不能同时调用两个插件,因此先整理好文稿后再生成PPT。

可以看到,讯飞星火迅速翻译、总结了论文概要,并给出了15页图文并茂的PPT,整体脉络清晰,但部分论述有误,图片不符合文意,需要手动修改。

第五,高考数学题:

数学一直是大模型的能力短板,我们选了两道2023年高考数学填空题来测试。

idc中国手机2020市场报告

第一题比较简单,讯飞星火分情况讨论给出了正确答案。

题目:某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有?种

答案:64

第二题做错了,虽然讯飞星火设好了x和y,但没有根据“中位数、平均数相等”列出正确的等式。

题目:某地一年四个季度的GDP(亿元),第一季度GDP为232,第四季度GDP为241,且四个季度的GDP逐季度增长,中位数、平均数相等。则该地一年的GDP为?(亿元)

答案:946

第六,虚拟人视频:

考虑到最近刚刚发布的百度文心大模型4.0可以生成一套广告营销素材,同样的需求我们也给到了讯飞星火,考考它的多模态生成能力。

比如,双十一来了,让讯飞星火做一张科大讯飞学习机的商品海报吧!

得到的结果乍一看的确像模像样,不过,学习机的图片并没有参考官方的商品图,并且无法像DALL·E3那样生成比较准确的文字。

相比商品图,AI更擅长生成广告文案,讯飞星火一口气给出了五段。

然后,我们要求它根据以上信息做一个虚拟人口播视频,讯飞星火默认生成了一段横屏视频,背景主要是跟校园、学习用品有关的图片轮播,一位穿着粉色裙子的可爱主持人念着广告文案,并自动配上了视频字幕,不过AI把五段文字都念完了,配音也是偏成熟的机器音。

目前生成的虚拟人视频支持分享查看,但不能直接下载使用。

以上是初步实测,总得来说,讯飞星火V3的整体能力有所提升,生成速度依旧很快,多模态能力需要继续加强,新增的虚拟角色对话丰富了交互形式,可以满足娱乐需求,至于是否能用于提高生产力还要看“调教”程度。

落地科研、教育、医疗,AI+产业应用加速

除了讯飞星火认知大模型,本次科大讯飞还发布了针对不同人群需求、不同行业场景的新产品和大模型。

首先是代码能力再升级,搭载讯飞星火V3.0的智能编程助手iFlyCode2.0正式发布,在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%,大幅提升软件从业人员效率。

科大讯飞内部开发也在使用iFlyCode辅助,平台迁移原本需要3个月的开发工作1个月就能完成。

在科研领域,讯飞星火和与中科院文献情报中心联合发布科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能。

据现场演示,AI能将十几份量子计算论文一键生成综述报告,帮助科研人员快速了解最新论文。

教育方面,基于星火大模型V3.0的讯飞AI学习机再度升级,新增AI答疑辅学功能,遇到错题可以找AI老师探讨思路,在互动中学习。

同时,科大讯飞发布AI心理伙伴,能够“听懂”孩子的心事,帮助心理减压和疏导问题。

京东金融风控是什么意思

医疗方面,讯飞星火医疗大模型和讯飞晓医APP正式发布,看病前、买药时、拿到体检报告后都能向AI咨询。

国家科技信息资源综合利用与公共服务中心(STI)第三方测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。

今年以来,科大讯飞在大模型领域已落地了AI学习机、办公本等面向C端的软硬件,在B端业务赛道应用也持续加速。本次讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业。

大模型日益与每个人息息相关,当前讯飞星火已有1200万用户,同时开发者门槛进一步降低,在讯飞星火上,目前已有1.5万助手开发者,开发超2.9万个助手应用。

“国产大模型跟GPT4还有四点差距”

“解放生产力,释放想象力”,这是科大讯飞大模型的目标。

随着大模型持续突破,模型能力和产业生态都在飞速发展中,我们正在接近这一理想目标。

与此同时,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。

“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4还有差距。”他表示,唯有实事求是的科学精神,才能真正实现超越。

大会上,讯飞联合华为共同发布“飞星一号”大模型算力平台,合力打造我国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。

据介绍,更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。

“通用人工智能是这个时代最确定的增长动力来源”,包括科大讯飞在内的AI玩家正从底层的软硬件到各行业的应用层寻找新的增长机会。

谁能真正赶超ChatGPT?恐怕不是一两个测试集就能证明的,最终还是要看实际应用的效果。


返回网站首页

本文评论
赶快买起来!华为Mate 50官网新增现货速发「华为mate 40抢购技巧」
今日华为官网显示,华为Mate 50部分版本新增了“现货速发”的选项,喜欢华为手机的小伙伴儿可以赶快抢起来了。华为 Mate 50巴黎饰钉设计,更显高端优雅,有冰霜银、耀金黑、流光紫...
日期:11-12
绿厂OPPO、蓝厂vivo实至名归:两家已完成“绿厂”“蓝厂”商标注册_oppo蓝厂绿厂什么意思
  因品牌Logo颜色为绿色,所以OPPO在手机圈又被称为绿厂。   值得一提的是,在手机圈还有一个“颜色厂”与OPPO齐名,那就是“蓝厂”vivo,其得名原因和OPPO相似。   12月24...
日期:03-15
用户规模1.47亿-50亿流量扶持优质内容和车源 抖音懂车帝二手车业务融合
【】7月4日消息,据悉,懂车帝与抖音二手车业务融合,融合后懂车帝和抖音二手车用户规模达到1.47亿,活跃商家账号8.8万个。中国企业市值排行榜2021win10版本21h2发布时间数据显示,在...
日期:09-22
二线城市的投资景气度更依靠国资 合肥在这方面的特征比较显著_合肥2线城市
凤凰网科技讯 2月25日消息,据@凤凰网科技和IT桔子联合发布的《2022-2023中国新经济创业投资分析报告》显示,二线城市国资投资渗透率明显优于北上广等一线城市。跨境电商以后的...
日期:02-25
微软:Computex将披露下一版本windows信息
尽管微软今日的主题都是关于目前已提供的产品,但该公司最后许下一个美妙的诺言称,在当地时间明日上午10点揭幕的一项合作伙伴的展出上,将可以听到有关于下一个版本windows的消...
日期:07-28
马斯克:接近实现完全自动驾驶,这是特斯拉市值的主要驱动力_特斯拉自动驾驶龙头股
IT之家 6 月 18 日消息,6 月 16 日,特斯拉 CEO 埃隆・马斯克在法国巴黎参加了致力于创新和创业的 Viva Technology 大会,他表示,特斯拉已经接近实现完全自动驾驶的汽车,并且自动...
日期:06-19
「数字里的中国故事」首届文旅中国元宇宙创新大赛正式启动
今日,由中国文化传媒集团主办的“文旅中国元宇宙首届生态大会”顺利举办,大会聚焦文化和旅游领域元宇宙产业布局和发展应用进行了深入的交流。为更好地打造文旅元宇宙多维空间...
日期:12-17
清华开源最懂表情包的中文开源大模型 最低只需要8.7G显存_清华开源软件
5月22日 消息:最近,来自清华的一个叫VisualGLM-6B的大模型在网上热传。原因是有网友发现它似乎对表情包的解读有一手。无论是腊肠犬版蒙娜丽莎还是出租车后熨衣斗的男子,它都...
日期:05-22
恒生指数开盘跌0.88% 蔚来、小鹏汽车均跌超3%「蔚来股票今年涨幅」
  讯 9月28日上午消息,香港恒生指数开盘跌0.88%。恒生科技指数跌1.46%。汽车板块走低,蔚来、小鹏汽车均跌超3%。京东跌近3%,哔哩哔哩、理想汽车、小米、百度跌超2%,快手跌近2%...
日期:09-28
何小鹏:当了新势力第一也没用,300 万辆销售规模只是入场券_何小鹏最新消息
“以前就想活着,现在觉得活得不错就是死。”文丨吴晓宇编辑丨王海璐引入新总裁后,何小鹏首次在线下媒体活动中露面,发布了小鹏新一代技术架构 SEPA 2.0 “扶摇” 全域智能进化...
日期:04-18
小鹏汽车有混动的吗_纯电动车可以淘汰混动? 小鹏汽车何小鹏点出三个关键因素
讯 8月15日下午消息,在小鹏汽车超级补能发布会上,小鹏汽车董事长何小鹏声称,依靠超快充、高续航和自营充电站,纯电动车有望改写市场格局,淘汰混动车型。   “中国用户平均每周...
日期:08-16
中国移动重磅发布全球首个“神机”网络弹性服务,开创算网服务新范式!
数字经济时代,算力已经成为核心生产力,是全球战略竞争新焦点。在 6 月 29 日下午举办的算力网络技术与产业大会上,中国工程院院士郑纬民指出,当前我国在算力领域拥有强劲的实力...
日期:06-30
Stable Diffusion好看的原神AI美少女Prompts提示词大全
Stable Diffusion是最近很火热的一个AI绘图软件,用来制作各种好看的AI图片,现在有不少用户使用这个软件来绘画原神的角色,这里我们来看下一些比较好看的原神AI美少女Prompts提...
日期:03-28
惠普推出新款无线耳机:充电盒自带触控屏 控制音乐播放_惠普的无线耳机
快科技6月9日消息,惠普最近推出了新款无线耳机Poly Voyager Free 60,在充电盒特别配上了触控屏,十分吸睛。据悉,新款耳机采用入耳式设计,带有耳机柄和硅胶耳塞,自带传感器,可在放入...
日期:06-09
淘宝大金额交易_淘宝商城16小时交易额破20亿 产生1000万个包裹
  据淘宝商城最新数据,截止11日16点,淘宝商城订单数已经突破1000万单,支付宝成交额突破20亿,较去年双11全天成交额翻,这相当于每一秒钟就会生成178笔订单,意味着每一秒钟至少17...
日期:07-24
iPhone SE4曝光:自研5G 明年够呛发布「苹果se 4」
据苹果供应链消息透露,苹果公司预计无法在2024年发布第四代iPhone SE。分析师表示,这表明该公司传闻中的内部5G调制解调器不会很快准备好。此外,相比4G来说,5G基带做起来更难,硬...
日期:06-23
永辉:将在全国范围门店中全面增设“正品折扣店”_永辉购物
10月10日消息,继8月发布首批调优门店进展后,永辉近日表示,将在全国范围的门店中增设“正品折扣店”,并同步在线上APP/小程序增设折扣专区,提供食品、用品惊喜折扣价。据介绍,在折...
日期:10-10
推特找到新CEO,马斯克造车会更专心?_马斯克最新推特什么意思
5月12日消息,分析人士认为,埃隆·马斯克为推特选择新CEO,或许就可以少分心,让他更专注于特斯拉的发展。目前特斯拉需求下降的问题一直在困扰着马斯克。鑫网易商集团实控人华硕手...
日期:05-13
业界领先的这些大模型,都被一家收编了_最好的模型公司
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。毋庸置疑,GPT-4发布是一件足以载入 AI 史册的大事件。但随着时间的推移,人们也发现,即使是...
日期:10-15
努比亚neovision「努比亚新旗舰主摄镜头首秀:超越一英寸模组」
快科技7月3日消息,中兴通讯终端事业部总裁、努比亚技术有限公司总裁倪飞之前宣布,将于7月份发布一款影像新旗舰。倪飞表示,新旗舰采用定制光学,超越一英寸!”。从宣传图上看,新款...
日期:07-03