您的位置:首页 > 互联网

讯飞星火V3.5整体接近GPT-4 Turbo!首个13B开源大模型发布,深度适配国产算力

发布时间:2024-01-31 17:25:44  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】首个基于全国产化算力平台飞星一号的大模型,正式开源!

1月26日,美国商务部长雷蒙多表示,拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。

美国的云计算公司,都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。

雷蒙多表示:我们不能让非国家主体、中国或我们不希望访问我们的云计算系统的人,来训练他们的模型。

显然,在被算力卡脖子的当下,深度适配国产算力的开源大模型,意义格外重大。

就在1月30日,科大讯飞重磅发布首个全国产算力训练的全民开放大模型——讯飞星火V3.5。

实测结果显示,讯飞星火V3.5在七大核心能力上都获得了全面提升。甚至,在数学、语言理解和语音交互能力上还超越了GPT-4Turbo。

而同时发布的星火语音大模型,也在首批的37个主流语种上,实现了对OpenAI Whisper V3的超越。

此外,科大讯飞还首次开源了深度适配国产算力,拥有130亿参数的iFlytekSpark-13B模型(星火开源-13B)。不仅场景应用效果领先,而且还对学术和企业研究完全免费。

昇思MindSpore开源社区:https://xihe.mindspore.cn/modelzoo/iflytek/introduce

启智社区:https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B

Gitee地址:https://gitee.com/iflytekopensource/iFlytekSpark-13B

首个全栈国产化开源模型来了

具体来说,此次开源不仅包括基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,还有微调工具iFlytekSpark-13B-Lora,以及人设定制工具iFlytekSpark-13B-Charater。

基于这些全栈自主创新的套件,企业和机构可以方便地训练自己的大模型了。

电动汽车快速充电

那么,基础模型和精调模型性能如何?

可以看到,在C-EVAL、MMLU、CMMLU、AGIEVAL、FinancelQ等多项榜单测试中,与同尺寸开源模型相比,iFlytekSpark-13B更胜一筹。

而针对典型的应用场景,iFlytekSpark-13B在文本生成上提升23%,在语言理解上提升13%,文本改写提升25%,行业问答提升50%,机器翻译提升17%,头脑风暴提升29%。

苹果10月还有发布会吗

正是科大讯飞团队对学习辅助、语言理解等领域的深入研究和优化,大幅提升了模型实用性,使得处理复杂任务时更得心应手。

这种优化不仅提高了模型的理解能力和生成质量,还确保了其在面对多样化和专业化的应用场景时能够保持高效和准确。

这对于追求高性能、低成本的企业来说,无疑有着巨大的吸引力,同时为各行各业的企业提供了一种性价比高的解决方案。

深度适配国产算力

面对算力的紧缺,只有国产算力取得突破,才能为大模型行业的发展提供强有力的支撑。

为此,讯飞星火与昇腾强强联合,打造了全国产的通用智能新底座,和基于自主创新的算力平台。

2023年8月15日,星火一体机正式发布——不仅可以为大模型提供源源不断的算力,还能提供大模型的训练、推理、优化、部署等全流程能力。

紧接着,在2023年10月24日又发布了国内首个可以训练万亿浮点参数大模型的大规模算力平台飞星一号。

合作期间,科大讯飞发挥多年积累的算法优势,深度参与大模型底层算子库开发和优化、大模型算法迁移和超大规模集群智能化运维软件开发等工作。

而攻关团队也放弃了中秋等节日的休息,才加班加点地推出了飞星一号平台。

具体来说,飞星一号平台采用的是昇腾AI集群和大容量交换机构建无损ROCE组网,以及高空间的全闪和混闪并行文件系统。

模型通过昇思MindSpore AI框架的训练效率提升了40%,与昇腾AI硬件协同实现超强性能。

此外,训练策略针对昇腾算力进行了极致优化,充分展示了国产算力在追赶国际先进水平方面的决心和能力。

有了国产软硬件环境的深度优化,模型的训练效果也直接翻番。

如今星火开源-13B的发布,距离1024讯飞星火认知大模型V3.0的升级才刚刚过去三个月。

自主创新开源生态

而开源,则是为了推动人工智能和机器学习领域的协作,在全球范围内促进技术革新。

它可以让更多的做理论研究和学术探索的科研院所、企业和个人加入进来,以此增进学术合作,增进产业探索。

因为,只有当开源有更多的落地场景,才能更好地促进生态合作。

一直站在开源派阵列的图灵三巨头之一LeCun曾在AI Native大会上称,我认为开放是必然之路。因为大模型将成为社会人人依赖的基础设施,所以必须是开放的。

对于国内的大模型生态来说,亦是如此。

此前,科大讯飞开源的中文预训练模型,成为许多高校和企业打造创新应用的基石,推动了业界在语音和语言处理技术上的快速发展。

而现在,iFlytekSpark-13B的发布,成为中国在自主创新和科技自立自强道路上的重要里程碑。

针对算力安全问题,科大讯飞提出了一种全新的实践方案——全栈国产化开源。

自主开发的大模型和算力平台,不仅能促进国内科研人员和企业的创新,还可以推动相关领域科技进步,增强国家技术安全,加速AI技术的社会和经济应用。

为此,科大讯飞还在2023年7月正式成立了星火军团,负责助力客户大模型产品打造和应用落地,赋能千行百业。

未来,在全国产化算力平台的支撑下,星火认知大模型将进一步对标国际先进水平,而星火开源大模型,也将使国内开源生态更加欣欣向荣。

苹果12手术级不锈钢边框


返回网站首页

本文评论
咬伤女孩 狗主人最高能判7年!多人遛狗不牵绳引热议 宝妈带铁扳手防身
10月16日,四川成都一幼童遭恶犬撕咬,伤情严重,引发广泛关注。京东商业版图事发后,重庆一位宝妈快速反应,考虑到自家小区很多人养狗不栓绳,出门遛娃时特意带上了一把大扳手。四川成...
日期:10-18
AI智能推荐!小米商城新功能上线_小米AI智能助手
很多用户有升级手机的需求,但是面对眼花缭乱的型号却不知如何下手,近日小米商城就推出了一个新功能,AI能帮你智能推荐问题。用户在小米商城App顶部搜索栏输入“手机”后,选择“...
日期:12-08
苹果的闪电接口「闪电接口10年了!苹果终于要改变 iPhone 15启用USB-C」
10年了,闪电接口虽然一路被吐槽,但依然被苹果坚持了10年,当然这背后有他们自己的思考,封闭生态下赚钱也是很客观的。彭博社记者Mark Gurman今天透露,苹果正准备明年用全新的"Ultr...
日期:09-26
5G手机普及者 Redmi Note 11R上架:联发科天玑700加持_Redmi Note 10 Pro 5G 天玑
今天上午,Redmi宣布Note 11R将于9月30日正式发售,价格未公布。Redmi表示,Note 11R为普及5G手机而来,把5G手机普及到每个人,我们坚定不移。据悉,Redmi Note 11R对应的国际版机型是...
日期:09-30
超值手机2020「超值手机」
近年来越来越受到消费者的喜爱,在市场上占有一席之地。这类手机价格相较于旗舰手机更为亲民,但并不意味着它们的性能逊色。以下是有关的相关信息。3070会出ti吗首先,的价格通常...
日期:05-31
ChatGPT回答编程问题的准确率比抛硬币还要差「编程问题解答」
本文概要:1. 普渡大学研究发现,ChatGPT 在软件编程问题上的准确率不到五成。2. ChatGPT 的答案虽然经常是错误的,但由于其全面性和清晰的语言风格,仍然具有欺骗性。3. ChatGPT...
日期:08-08
达播什么意思「达播、店播双爆发,淘宝开始两条腿走路」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:云飞扬,授权转载发布。这届天猫双11,淘宝达播、店播双双爆发。官方数据显示,今年双11正式启动首日,淘宝就有29个直播间成交额破...
日期:11-10
首批搭载酷睿Ultra处理器!联想小新Pro AI超能本2024官宣_联想小新air pro价格
快科技12月4日消息,今天,联想小新官方宣布,小新Pro AI超能本2024将首批搭载全新酷睿Ultra处理器,并号称要挑战酷睿Ultra轻薄平台最强性能”。从官方发布的海报来看,该款笔记本将...
日期:12-04
京东快递保价最高保多少「京东快递全新保价服务“全额保”上线:快件全损全额赔」
9月29日消息,从京东快递方面获悉,今日,京东快递面向个人寄递场景推出全新保价服务全额保。官方表示,消费者在寄递物品时购买该服务,可在保价范围内享受足额赔偿,同时将有专人专线...
日期:10-04
X5_2023年度动作巨制《锋行任务》10月17日上映 谢霆锋站台华为Mate
来源:中关村在线10月16日,华为手机官方微博发布了一则预热海报,宣布即将迎来谢霆锋代言的华为Mate X5。海报中,谢霆锋手持华为Mate X5,下方配文为“够硬核、够风潮、够机智”。与...
日期:10-16
ofo小黄车被恢复执行2276万,押金能退了?「ofo小黄车被恢复执行2276万,押金能退了吗」
凤凰网科技讯 1月10日消息,天眼查App显示,ofo关联公司东峡大通(北京)管理咨询有限公司新增一则恢复执行信息,执行标的2276万余元,案由为买卖合同纠纷,执行法院为上海市浦东新区人民...
日期:01-10
“台商一起来,融入大湾区”主题活动暨第14届东莞台博会9月开幕
 两岸台商共襄盛事、电子龙头名企云集! 8 月 15 日,东莞召开2023“台商一起来,融入大湾区”主题活动暨第十四届东莞台湾名品博览会(下称“台博会”)新闻发布会。发布会介绍了...
日期:08-17
长城汽车业绩预告2021「长城汽车:2023年上半年预计净利润最高15.5亿 同比大降超7成」
快科技7月14日消息,长城汽车股份有限公司今天下午发布了2023年半年度业绩预告。五菱宏光mini ev日本长城汽车称,经财务部门初步测算,预计2023年半年度实现归属于上市公司股东的...
日期:07-14
第一位 AI 摄影师?Photo AI只需上传几张照片就能生成逼真照片_ai照相馆
8月25日 消息:Photo AI 是一种革命性的人工智能工具,用于在各种设置中生成逼真的图像。无需昂贵的摄影师,只需上传几张照片就可以在电脑或手机上进行照片拍摄。iPhone12准备发...
日期:08-26
网易云音乐人会暴露信息吗「QQ音乐、网易云音乐下架李易峰作品 个人介绍无法搜到」
  9月11日,李易峰相关消息公布后,多品牌紧急宣布与李易峰解约,包括真果粒、Prada普拉达、六福珠宝、京都念慈菴、HONMA高尔夫等等。  而现在包括QQ音乐、网易云音乐、芒果...
日期:09-15
2023年“天爱杯”第二届创新创业创意大赛收官 12个项目巅峰对阵
(原标题:2023年“天爱杯”第二届创新创业创意大赛收官 12个项目巅峰对阵) 11月1日下午,由杨浦区人力资源和社会保障局指导,四平...
日期:11-02
上千师生操场烧烤缓解考前压力 老师:学校自费 图个好寓意「学校组织烧烤」
据报道,山西朔州怀仁一中学上千名师生在操场烧烤,场面壮观引网友羡慕。学校老师介绍,在场均为高三学生和教师,共有上千人,学校自费组织烧烤活动是希望帮高考生缓解压力。同时因烤...
日期:06-06
博雅2020「BOYA博雅品牌嘉年华:12月6日新品盛宴,超值优惠狂欢!」
引言:自2011年创立以来,BOYA博雅麦克风品牌秉承创新与品质,现已成为国内音频领域的领头羊。据悉BOYA博雅麦克风为了感恩新老用户的十数年来的支持即将在2023年12月6日国内全线...
日期:12-06
全球6G动态之美国:意图重返全球领导地位「美国重回大国竞争」
6G对未来经济、社会、军事等领域具有革命性影响,是中美科技竞争中最关键的技术领域之一。美国试图以6G研发为新起点,重新夺回全球移动通信技术的主导权。美国采取一系列措施加...
日期:08-02
3小时挪动300米堵哭了!去海南自驾请注意:需预约购票「春节自驾海南岛 堵车」
春节即将到来,不少北方的朋友会选择去温暖的海南过节,大量游客的同时涌入,给当地交通带去了极大的压力。400块的ipad近日,有报道称,有游客驾车进入海南岛之前,遭遇了世纪大堵车,三...
日期:01-22