您的位置:首页 > 互联网

百川智能ipo「百川智能发布大模型Baichuan3 称中文评测超越GPT-4」

发布时间:2024-01-29 14:45:07  来源:互联网     背景:

1月29日 消息:百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和代码方面的评估,如MATH、HumanEval和MBPP等,也有着优秀的成绩,证明了Baichuan3 在自然语言处理和代码生成领域的强劲实力。

pc市场出货量

百川智能还表示,其在逻辑推理能力和专业性要求很高的MCMLE、MedExam、CMExam等权威医疗评估上的中文效果也超过了GPT-4,成为中文医疗任务中表现最好的大型模型。Baichuan3 还突破了“迭代式强化学习”技术,进一步增强了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现出色,领先于其他大型模型。

为了保证在数千张GPU上高效且稳定地训练超千亿参数模型,百川智能同时优化了模型的训练稳定性和训练框架,并采用了“异步CheckPoint存储”机制,可以在不损失性能的情况下增加存储的频率,减少机器故障对训练任务的影响,使Baichuan3 的稳定训练时间达到一个月以上,故障恢复时间不超过 10 分钟。

百川智能科技有限公司

训练效率方面,百川智能针对超千亿参数模型的并行训练问题进行了一系列优化,如高度优化的RoPE, SwiGLU计算算子;在数据并行中实现参数通信与计算的重叠,以及在序列并行中实现激活值通信与计算的重叠,从而有效降低了通信时间的比重;在流水并行中引入了将激活值卸载至CPU的技术,解决了流水并行中显存占用不均的问题,减少了流水并行的分段数量并显著降低了空泡率。通过这些技术创新,Baichuan3 的训练框架在性能方面相比业界主流框架提升超过30%。

官方表示,作为参数规模超过千亿的大语言模型,Baichuan3 不仅英文效果达到接近GPT- 4 的水平,还在多项通用中文任务的表现上实现了对GPT- 4 的超越,是百川智能的全新里程碑。Baichuan3 全面的通用能力以及在医疗领域的强大表现,将为百川智能打造“超级应用”,把大模型技术落地到诸多复杂应用场景提供有力支撑。

百川300614


返回网站首页

本文评论
 AWE2023|京东家电家居打造“家场景” 将发布京东艺术电视标准「京东家电视频」
【网易科技4月27日报道】时隔两年,中国家电及消费电子博览会(AWE2023)终于在4月27日于上海隆重召开。其中,京东家电家居以“焕新家 一站购”为主题的展位也在上午10点正式开启。...
日期:04-28
桔多多商城:打造领先的智能风控体系_桔多多科技有限公司
  2022年作为“十三五”收官之年,我国各级政府继续高度重视网络安全工作,密集出台了众多网络安全政策法规,从2022年1月出台的《中华人民共和国密码法》到2022年12月公布的《...
日期:07-10
植物基热度不减, 肉、奶为何不同命
作者:栾立;;责编:陈姗姗   8月2日晚,网红燕麦奶品牌OATLY公布了上半年业绩,疫情下亚洲市场依然实现4成以上的增长。   第一财经记者注意到,近年来备受市场关注的植物基产品热...
日期:08-04
amd财报2021q2「AMD公布2023年第三季度财报」
加利福尼亚州圣克拉拉市— 2023 年 10 月 31 日—AMD(NASDAQ: AMD)今日公布 2023 年第三季度营业额达 58 亿美元,毛利率47%,经营收入2. 24 亿美元,净收入2. 99 亿美元,摊薄后每...
日期:11-01
“中国医师节”向人民健康守护者致敬(致敬首个中国医师节)
  有这样一个群体,他们是“夜空中最美的星”。在疫情防控一线,他们白衣执甲,逆行而上;临床手术台上,他们承载着患者生的希望;技术实验室里,他们数十年如一日推动医疗科技发展;...
日期:07-17
两年半存款20万 95后涌向养猪场:包吃住、一天要洗四次澡_投资20万养猪一年利润多少
在这个大众创业万众创新的时代,年轻人的工作选择越发多元化。日前,市界观察就分享了年轻人去养猪的话题,其中不乏一些95后甚至00后开办猪场或者进入养猪场工作。以1999年出生、...
日期:04-02
周杰伦与快手合作再度升维,前方到站元宇宙
声明:本文来自于微信公众号 娱乐资本论(ID:yulezibenlun),作者:不空,授权转载发布。在华语乐坛中,周杰伦是公认的“怪才”。离经叛道是大众对他最初的认知,不过,出道二十余载,他前卫...
日期:01-01
闫妮主演电影上映!网友:看完《最后的真相》被闫妮演技震撼到了
8月26日消息,由黄晓明监制,李太阁执导,黄晓明、闫妮主演的电影《最后的真相》于8月25日正式上映。有观众看完电影后表示,被闫妮演技震撼到了。在电影《最后的真相》中,闫妮饰演了...
日期:08-27
马斯克和推特CEO取证时间推迟_马斯克有推特吗
  讯 北京时间9月27日消息,马斯克与推特因为收购纠纷闹到法庭,按照原计划,周一马斯克与推特CEO帕拉格·阿格拉瓦尔(Parag Agrawal)将会接受质询,完成取证。但知情人士透露,取证已...
日期:10-02
iPhone 15标配三星M12屏:全局1500尼特!_三星屏幕材质m11
iPhone 15的屏幕将迎来升级,全系换成三星M12材质的屏幕,手动峰值亮度超过了1000尼特,全局峰值亮度超过了1500尼特,意味着在户外可以享受更清晰的显示效果。据Elec报道,今年iPhone...
日期:04-11
今年会出现罕见的寒冬吗?气象局回应_中国气象局今年冷冬
9月29日,中国气象局举行10月例行新闻发布会。小米路由器ax1800穿墙其中就今年冬季气候预测怎么样?在拉尼娜现象的影响下,是否会出现罕见寒冬?”这一问题,官方答疑如下:今年冬季预...
日期:10-02
华为p60系列推出harmonyos 3.1_huawei p60
华为p60系列于3月份推出了harmonyos 3.1操作系统,该操作系统注重安全性和纯净性。harmonyos 3.1的beta2版本已经发布,流畅性和稳定性得到了改善,刷新率为120hz,下载速度也有所提...
日期:04-26
Win12用户界面被吐槽?微软赶工新一代Windows:这三大特性 用户体验暴增
去年10月,Win12原型系统的用户界面曝光,出现了包括浮动式任务栏、正面上方居中式消息栏、桌面小部件位于左上角,时间/日期/电池/Wi-Fi状态位于右上角等元素。随后,这个下一代新...
日期:04-05
小米MIX Fold 3转轴技惊四座!雷军:手感惊艳「小米mix folder」
快科技8月11日消息,小米MIX Fold 3首发龙骨转轴。扎克伯格创立facebook的初衷小米创办人雷军指出,这是一项跨时代的转轴设计,是一项重大突破技术,它以14个活动关节带来全新前所...
日期:08-12
中际旭创2022年度权益分派:每10股2元「中际旭创分红」
2023/5/29 22:51 中际旭创2022年度权益分派:每10股2元极米投影仪双十一  颜翊 ...
日期:06-02
Speaking AI官网体验入口 AI声音克隆工具软件网页版app免费使用地址_ai speaker
Speaking AI是一款利用先进大语言模型技术实现文本到语音转换的工具。它不仅能以自然的情感进行对话,还实现了零样本语音克隆,能够捕捉并复制独特的音调、音高和调节。这一突...
日期:01-15
《羊了个羊》火爆背后:玩法设计是否合规?
  转自:中国经营网  本报记者 许心怡 吴可仲 北京报道  中秋假期以来,小程序游戏《羊了个羊》火爆全网。不足0.1%的通关率、省份之间的比拼、转发群聊的获取道具方式推...
日期:09-26
史上最运动的理想汽车来了:Air车型增加运动模式「理想汽车怎么运行」
快科技6月29日消息,理想L系列车型的OTA 4.5升级后,Air车型的悬架舒适度、转向模式新增了运动”模式,全系车型弹射起步”同步升级为高性能”。英特尔2021财报理想汽车主打家用舒...
日期:06-29
汉王科技增发_汉王赛普异军突起 成为汉王科技业务增长黑马
  从移动互联到人工智能,时代的更迭总是来得猝不及防却又翻天覆地,对于企业,及时应对外部环境的变化,通过自内的调整实现自外适应的能力显得尤为重要。在一场场风起云涌的市...
日期:11-25
Omdia: OTN延伸至网络边缘是趋势,可实现大带宽、低时延和更优TCO
Omdia: OTN延伸至网络边缘是趋势,可实现大带宽、低时延和更优TCO 华为mate 50 pro 最新消息兰博基尼下一代大牛发布iqoo 无线快充的机型...
日期:05-26