您的位置:首页 > 互联网

百川大模型升级:Baichuan 2能力最高提49%,王小川称LLaMA2开源模型时代已过

发布时间:2023-09-07 02:05:06  来源:互联网     背景:

出品 | 科技

作者 | 梁昌均

成立五个月的百川智能继续推进模型开源,并联手腾讯云、阿里云等合作伙伴意图打造生态。

在9月6日的百川智能开源大模型生态大会上,该公司CEO王小川正式发布开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat等版本,并且均为免费可商用。

“从今天开始,在发布Baichuan2之后,再用LLaMA2作为开源模型的时代已经过去了。”王小川表示,现在国内可以获得比LLaMA更友好且能力更强的开源模型,这将能够帮助扶持中国整个生态的发展。

自今年4月成立以来,百川智能在不到四个月的时间里先后发布了BaiChuan-7B、BaiChuan-13B、BaiChuan-56B等三个大模型,其中前两个模型均免费开源。王小川在会上透露,公司开源模型在所有开源社区总计下载量已达500万。

“我们认为国内有需求,也是我们能贡献的地方是在开源模型方面,所以公司成立之后就开始发布开源模型,同时也兼顾了闭源大模型的训练。”王小川表示,百川智能计划在今年四季度发表对标ChatGPT-3.5的模型,明年一季度发布超级应用,希望在开源闭源方面都能做出贡献。

据王小川介绍,目前已有200多家企业申请百川大模型开源商用授权,企业涵盖互联网、金融、法律、教育、制造、企业服务等,比如腾讯云、阿里云、火山引擎、亚马逊云、京东、浪潮、顺丰、卡奥斯、美的、蔚来、中国农业银行等。随着8月底获批正式向公众开放,百川大模型也开始向C端提供服务。

此次发布的Baichuan 2-7B-Base和Baichuan 2-13B-Base在上一代开源模型的生成与创作能力、流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

三星galaxys3安卓11

其中Baichuan 2-13B-Base相比上一代13B模型,文科理科能力全面提升,尤其是理科能力提升明显,比如数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

王小川表示,BaiChuan2处于开源模型最好水平,Baichuan 2-7B-Base和Baichuan 2-13B-Base在MMLU、CMMLU、GSM8K等评估榜单上均分别取得同尺寸开源模型最优异的效果;其中Baichuan 2-7B-Base在中英文主流任务全面超越LlaMA3-13B,起到了“以小博大”的效果。

华为折叠屏手机限定版

现场展示的模型能力对比图显示,BaiChuan2-7B在安全、代码、数学计算、逻辑推理、语义理解等方面都超过LlaMA3-13B,但距GPT3.5-Turbo还有一定差距,尤其是在安全、代码、数学计算、逻辑推理等方面差距较大。

Baichuan 2-7B-Base和Baichuan 2-13B-Base模型的Benchmark成绩

在数据层面,此次发布的BaiChuan2系列模型均基于万亿互联网数据和垂直行业数据,训练语料达2.6TB token,并打造了超大规模内容聚类系统,小时级别完成千亿数据清洗和过滤,可以实现篇章、段落、桔子等多粒度内容质量打分,支持中英法等数十种语言。

在训练过程中,百川智能打造了稳定高效的分布式训练框架,使用了千卡A800集群,达到了180TFLOPS的训练性能。在安全层面,BaiChuan2系列模型采取了多种措施去推动对齐,比如优化全训练周期,推动系统价值观对齐;设计多类型价值观,进行了大量红蓝攻防数据训练;平衡有用性无害性等,多阶段多目标强化学习。

在发布会上,王小川还宣布开源模型训练从220B到2640B全过程的 Check Ponit,开源训练模型过程对国内开源生态尚属首次。“这对于科研机构研究大模型训练过程、模型继续训练和模型的价值观对齐等极具价值,将极大推动国内大模型的科研进展。”

王小川表示,在学术推动以外,这次开源非常有真实诚意。他提到,LLaMA在开源的时候被国际组织批评过,一是用户超过7亿就不提供开源支持,二是LLaMA开源仅适用于以英文为主的环境,如果是中文场景拿不到开源协议,对国内是不友好的。

百川智能还联合中国计算机学会(CCF)联合推出百川大模型研究基金,推动围绕大模型不同阶段、不同维度的技术和不同领域、场景的结合应用等相关研究。“今年我们会投入约300-400万元,设立相关方向跟高校共同去做研究,同时也会提供相应研究经费,支持15-20个项目的启动。”王小川说。

近期,百川智能和亚马逊云共同开启了AI黑客马拉松大赛,提供强大算力支持和大量8*A100实例,聚焦医疗健康和游戏娱乐两大赛道,选手最高可获得20万资金支持。

活动现场,百川智能还和腾讯云、阿里云、亚马逊云、火山引擎、华为、联发科、寒武纪等企业达成开源生态合作。“百川智能将和行业企业共创开源生态,推动形成开源中国大语言莫大型开源免费商用格局。”王小川表示。


返回网站首页

本文评论
iPhone13即将发布,苹果却突然推出新品「苹果毫无诚意,iPhone14再度传来“坏消息”,果粉:不如iPhone13」
作为高端旗舰机手机领域的巨头之一,苹果每次召开发布会都会吸引很多果粉的关注,不管是旗舰手机还是其他产品,都得到了不错的口碑和销量。即使在近两年苹果针对iPhone并没有什么...
日期:09-04
选生活家电就上“真快乐”APP 真选低价还能抽特斯拉
  冬天天气阴冷,晒衣服也成为大问题,这时候有一款洗烘一体的好洗衣机就尤为重要。“真快乐”APP为大家真选了一款大品牌松下多功能洗衣机,它功能强悍,价格实惠,会成为您生活中...
日期:10-03
ChatGPT答案:如何评价OpenAI的对话模型ChatGPT?
苹果电脑火狐浏览器兼容性OpenAI 的超级对话模型 ChatGPT 是一种最先进的语言模型,它在人类对话的大型数据集上进行训练,可以对给定的输入生成类似人类的响应。要评估 ChatGPT...
日期:12-08
「60系列 「淘宝搜"遥遥领先"直达华为Mate」」
来源:中关村在线苹果12pro max显示电量百分比谷歌日本总部近日,华为Mate 60 Pro正式在全国范围内全面上市销售,各地华为门店出现了排队购买的热闹景象,消费者对这款手机的抢购热...
日期:09-04
比特币价格再次跌破2万美元 和去年3月相比下跌58.9%_从暴涨到暴跌,突破4万美元后比特币价格跌超10%
9月19日 消息:比特币价格又跌了!美国时间周日,比特币价格下跌至19804美元,与上一个交易日结束时相比价格下跌310美元。根据报价平台CoinDesk的数据,北京时间9月19日8时20分,比特...
日期:09-20
手机端新闻app_新浪新闻app深度布局5G时代 AI技术成关键引擎
  12月7日,在中国行业报协会主办,《传媒茶话会》承办的2019第四届中国产经媒体融合发展高峰论坛上,新浪移动市场部总经理乔宇围绕“人工智能助力媒体迈入5G时代”发表主题演...
日期:10-22
云帆加速如何成为CDN行业的运维新势力?(云cdn 传统cdn)
  云帆加速在2014年以创新型CDN公司的身份进入,经过5年时间,已经成为市场上最知名的几家CDN老牌服务提供商之一。   得益于社交新媒体和移动互联网生态的逐渐成熟,以短视...
日期:12-24
尚德机构在线教育科技有限公司_在线教育下半场,尚德机构如何用人工智能为教育赋能?
  2019年,在线教育依靠“上半场”的跑用户、拼流量、拉投资等模式已不再奏效。行业洗牌之下,在线教育步入更为艰巨的“下半场”,企业亟需转变增长模式和动力。   尚德机构...
日期:07-14
iPhone 5C将被苹果列为过时产品 神机退出历史舞台_苹果5c啥时候出的
中关村在线消息:近日,有外媒报道称又一款“远古神机”iPhone 5C即将被苹果官方标记为“过时产品”。该机其实早在2020年10月就被官方定义为“古董产品”,只提供部分维修服务。...
日期:10-13
媒体:谁在开发“一键脱衣”App 一定要一查到底
一位女性在网上发布了自己在地铁车厢里的照片,结果被人利用人工智能技术“一键脱衣”。因此,原本正常的女性生活照变成了“裸体照片”。有许多非法网站提供“一键脱衣”的人工...
日期:04-01
分析师:苹果AR眼镜因设计问题可能推迟到2025年或2026年推出
11月9日消息,据国外媒体报道,苹果公司仍在按计划于明年推出AR/VR头显,但海通国际分析师Jeff Pu表示,由于“设计问题”,传闻中的苹果增强现实(AR)眼镜可能被推迟到2025年或2026年推...
日期:11-15
goodnotes做题「Goodnotes 6 加入 AI 笔记、AI 数学辅助并集成 Claude 等功能」
8月11日消息:备受欢迎的笔记应用和 PDF 编辑器 GoodNotes 在四年后推出了首个重大更新,引入了新的 AI 驱动手写识别功能、数字文具市场、新的笔势操作等。图片来自GoodNotes...
日期:08-11
ai智能互动课_2021年微信公开课PRO:微信AI对话理解、智能语音领域覆盖更多场景
  1月19日,在微信公开课PRO版企业智能服务分论坛上,微信AI团队再次亮相。基于在对话理解与智能语音两大领域的多项技术应用落地,微信AI不仅可以有效帮助传统互联网企业及中...
日期:05-05
中国电信党史教育「中国电信召开主题教育调研成果交流会」
中国电信召开主题教育调研成果交流会 通信产业网|2023-07-19 12:36:44作者:通文来源:通信产业网【通信产业网讯】7月17日下午,中国电信召开学习贯彻习近平新时代中国特色社会主...
日期:07-19
摩托罗拉新旗舰渲染图曝光_摩托罗拉新机曝光
  上个月,有消息称摩托罗拉正在开发代号为“Frontier”的“下一代”旗舰手机。该机将提供顶级硬件配置,包括高通旗舰处理器、超快的充电速度和强大的摄像头。   近日,爆料...
日期:05-11
护航大运会!TYT泰永长征助建“孤岛式”微电网_泰永长征官网
7 月 28 日,第 31 届世界大学生夏季运动会将在成都举行,这是中国大陆第三次举办,也是中国西部第 一次举办世界性综合运动会。盛会之下,成都正以全新的姿态迎接来自世界的目光,五...
日期:07-27
李志飞发布大模型“序列猴子”:悲壮的说,这就是我最后一站
【网易科技4月20日报道】出门问问宣布内测探索大模型「序列猴子」,并提出CoPilot将会无处不在,同时在大模型能力的基础上还同步开启了面向创作者的CoPilot产品矩阵,面向C端的升...
日期:04-20
每年乘坐飞机的人次「90后小伙一年乘坐飞机293次 比一般飞行员还多 机票超11万元」
北京一位90后小伙,酷爱坐飞机,近3年飞行了近千次,刚刚过去的2022年飞行293次,去了75个城市。真可谓不是在飞机上,就是在赶飞机的路上”iphone12屏幕供应商还是三星据紫牛新闻报道...
日期:01-09
一年近2000亿,中国互联网巨头的研发资金都投到了哪里?「互联网企业研发中心」
伴随大模型炼丹的热潮,英伟达在不久前成为了第七家市值越过1万亿美元的美国公司。此前的台北国际电脑展,CEO黄仁勋在圆桌论坛上把国内在云计算、数字支付、电动汽车等领域的进...
日期:06-08
Win11游戏性能Bug终于修复:微软恢复受影响设备22H2版本更新
本月早些时候,有大量用户反馈,称在Win11 22H2系统下,使用NVIDIA显卡会出现游戏性能下降、帧率不稳的问题,CPU占用率也异常偏低,有的甚至不到5%。微软方面称这是因为一个软件上的Bu...
日期:11-26