您的位置:首页 > 互联网

元象企业管理(云南)有限公司「元象开源650亿参数高性能大模型,无条件免费商用_网易科技」

发布时间:2023-11-07 01:53:49  来源:互联网     背景:

11月6日消息,元象XVERSE公司宣布,开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。

元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验,三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型,为研究、商业及生态创造三重价值。”


据介绍,XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。

元象坚持“高性能”定位,提升了65B三方面能力: 一、理解、生成、推理和记忆等基础能力,到模型的多样性、创造性和精度表现,从优异到强大;二、扩展了工具调用、代码解释、反思修正等能力,为构建智能体(AI Agent)奠定技术基础,提高模型实用性;三、显著缓解7B、13B中常见且可能很严重的幻觉问题,减少大模型“胡说八道”,提高准确性和专业度。

元象科技有限公司

据悉,元象大模型系列均为全链条自研,涵盖多项关键技术与研发创新:

复杂分布式系统设计:借鉴团队研发腾讯围棋AI“绝艺”、王者荣耀AI“绝悟”等大系统上的丰富经验,自研高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台与框架协同等关键技术,打造高效稳定的训练系统, 千卡集群峰值算力利用率达58.5%。

元象信息科技有限公司

海信touch 音乐阅读器

全面提升性能:65B训练中采用FlashAttention2加速计算, 3D并行基础上采用虚拟流水线(virtual pipeline)技术,降低较长流水线产生过高气泡率,提升计算推理效率; 上下文窗口长度从8K逐步提升到16K,使其不仅能出色完成复杂任务,包括长文理解、长文生成和超长对话,还拓展了工具调用、代码解释及反思修正能力,能更好构建智能体(AI Agent)。

提升训练稳定性:因计算量庞大,通信拥塞、芯片过热或计算节点故障成为65B训练常态,初期出现过一周最高八次故障的情况。通过集群基础设施运营、资源调度、训练框架和调度平台协同等持续优化,元象打造出高稳定、低中断、强容错的训练系统,将每周有效训练率提升至98.6%。

元象医疗器械有限公司

此外,在接近1.6万亿Tokens的模型训练中期,损失函数产生了NaN值,可能导致训练中断。通常情况下,业界一般会在分析后删除与之相关的数据区间。而团队根据经验判定这是模型自然演化,选择不删除数据,直接跳过相关参数更新,最终 NaN值 问题解决。后期对参数值、激活值、梯度值等中间状态的进一步分析表明,该问题可能 与模型最后一层transformer block激活值的最大值变化有关,并会随最大值的逐渐降低而自行解决。

为确保业界能对元象大模型性能有全面、客观、长期认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。

XVERSE-65B在与国外标杆对比测评中,部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆 Llama2-70B和Falcon-180B ;与GPT4仍有差距。

据介绍,元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用,能满足中小企业、科研机构和个人开发者绝大部分的应用与迭代需求。

元象同时提供模型训练、推理、部署、精调等全方位技术服务,赋能文娱、金融、医疗等各行各业,帮助在智能客服、创意写作、精准推荐等多场景打造行业领先的用户体验。2023年10月, 腾讯音乐宣布与元象大模型建立战略合作 ,共同推出lyraXVERSE加速大模型、全面升级其音乐助手“AI小琴”,未来还将持续探索AI与3D前沿技术。(一橙)


返回网站首页

本文评论
年度全球最大上市交易日程曝光 孙正义将融资额调低200多亿
凤凰网科技讯 北京时间9月1日,软银集团旗下英国芯片设计公司ARM即将启动在美国的首次公开招股(IPO),有望创造今年全球最大上市交易。现在,ARM的上市日程曝光,融资额缩水30亿美元...
日期:09-01
港股美股暴跌_港股美团跌超11%,市值跌破1万亿港元
查看最新行情   讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,...
日期:08-18
苹果13发布后11会降价吗「iPhone14 Plus刚开售就破发:降价449元也没人买!」
10月7日,也就是昨天,iPhone14系列手机的最后一款机型iPhone 14 Plus正式全网开售,今天已经有首批预订者拿到了新机。然而如同预料的一样,这个一开始就被全网唱衰的iPhone 14 Plu...
日期:10-15
努比亚z20红色「融合红宝石元素-喜庆感满满 努比亚Z50推出中国红兔年限定版」
12月19日,努比亚正式发布新一代影像性能旗舰手机努比亚Z50。作为努比亚下一个十年的开篇之作,该机搭载了全新升级的35mm定制光学系统,配备性能强悍的第二代骁龙8移动平台,精心打...
日期:09-21
美国芯片技术封锁_经济日报:美国芯片法案拦不住“中国芯”!
近日,美国《芯片和科学法案》正式签署,美国拟投入500多亿美元推动芯片的研发制造和劳动力发展,给“美国芯”又加一把油。根据该法案规定,获得资金补贴的芯片企业,未来10年内将不...
日期:08-16
十大信创领军企业联袂出席 奇安信可信浏览器开辟政企市场新赛道
  4月2日,国内最大的网络安全公司奇安信通过蓝信平台举行了线上发布会,正式发布了奇安信可信浏览器。飞腾公司总经理窦强、麒麟软件副总裁李震宁、东软集团副总裁杨纪文、...
日期:11-14
国服关停5个月 暴雪禁止国内玩家参与暗黑4活动「暴雪暗黑四巨头」
从1月24日凌晨算起,暴雪7款游戏的国服关闭已经整整5个月了,新代理还没消息,但是暴雪的业绩并没有因此下滑,主要是最近《暗黑4》开售了,疯狂吸金,然而暴雪的一些活动也引发争议,国内...
日期:06-24
苹果用的台积电芯片「苹果已占据当前台积电所有3nm产能 预计iPhone15Pro搭载A17芯片」
2月21日消息:据 Digitimes 报道,为了即将推出的 A17 和 M3 芯片,苹果已经 100% 占据了台积电目前所有的 N3 产能,而高通、联发科正在后面排队。除此之外,台积电更省电的 N3E 工...
日期:02-22
驾特斯拉Model X车祸后 林志颖首次露面:已恢复状态_model y撞车
今天中午,林志颖发文几年自己的48岁生日,今年也刚好是他本人出道30周年,同时还晒出了自己今天切蛋糕的照片。这是自从7月22日车祸以来,林志颖首次露面。从照片来看,林志颖目前恢...
日期:10-16
iPhone14Pro双11首次优惠!幅度超过500「iphone12promax双十一有优惠吗」
中关村在线消息:10月28日,据相关爆料,苹果今年的双11优惠政策已经公布,28号0点后可以在天猫双十一的苹果会场领到惊喜券,这次双11活动优惠最大的产品是iPhone13系列,最高优惠700元...
日期:10-29
国际数据空间协会(IDSA)中国能力中心正式成立_国际数据管理协会的英文缩写
【】7月5日消息,2023全球数字经济大会上,“国际数据空间协会(IDSA)中国能力中心”正式成立。据介绍,IDSA中国能力中心是国际数据空间协会(IDSA)在中国的代表机构,由下一代互联网国家...
日期:09-21
市场监管局制止餐饮浪费方案「市场监管总局制止餐饮浪费:网络订餐根据用餐需求合理点餐」
3月8日 消息:据央视新闻报道,近日市场监管总局指导中国烹饪协会、中国饭店协会、中国连锁经营协会、中国个体劳动者协会向全国餐饮服务提供者、从业人员、消费者发出联合倡议...
日期:03-08
中国银行业协会刘峰:进入净值化时代后,银行理财呈现三个特点
封面新闻记者 欧阳宏宇“理财公司诞生于净值化时代,面临着公募基金、私募基金、券商等多方竞争,还面临低利率的市场环境挑战。”7月8日,中国银行业协会秘书长刘峰第九届青岛·...
日期:07-10
苹果研发出5g芯片了吗「苹果自研5g基带信号真的会很好吗","info":{"wordid":"7031351339519874316&qu
来源:中关村在线苹果手机的信号问题一直是消费者所诟病的一个方面,与安卓手机相比,在相同的环境下iPhone的信号往往不佳。有人认为这是由于高通5G基带给的影响,而最近有传闻称苹...
日期:09-15
郭明錤:因郑州富士康全球10%的iPhone生产受影响 立讯精密大涨「iphone郑州富士康质量」
10月31日 消息:天风国际分析师郭明錤通过推特发布了一些苹果 iPhone 供应链上的生产变化,涉及鸿海富士康、和硕、立讯精密等。郭明錤表示,在郑州富士康iPhone工厂进入闭环生产...
日期:11-05
新爆品的诞生:内容能起到多大作用?「新爆品的诞生:内容能起到多大作用呢」
声明:本文来自于微信公众号 见实(ID:jianshishijie),作者:陈姗,授权转载发布。“咖啡你冲不冲,冲冲 冲 冲冲”。T97咖啡这段魔性的说唱rap,相信很多人都听过,T97咖啡也凭此在抖音等...
日期:12-29
淘宝需要李佳琦「淘宝李佳琦直播间在哪里看」
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:吴锐,授权转载发布。回归后的李佳琦依旧可以称之为“顶流”。9月20日,李佳琦开播的消息不胫而走,尽管李佳琦尽可能...
日期:09-29
青岛市科学技术奖揭晓:唯一国际合作奖花落海尔智家_青岛市青年科技奖
有些企业只停留在表面的证书上,有些企业则更进一步,真正重视科技创新成果的转化落地,致力造福用户。近日,青岛市政府公布了《关于 2022 年度青岛市科学技术奖励的决定》(青政发〔...
日期:06-12
QQ 音乐登陆统信 UOS 应用商店(统信UOS系统QQ)
  9 月 15 日消息 据统信软件公众号消息,QQ 音乐正式登陆统信 UOS 应用商店。   目前,统信 UOS 专业版、家庭版、社区版(x86 架构)用户均可使用 QQ 音乐。打开统信 UOS...
日期:06-17
微软那天发布最新系统漏洞补丁_微软推送本月4个安全补丁 修复Win7 SP1高危漏洞
  微软今天推送了11月的安全补丁,本月共有4个安全补丁,正如之前的预告,此次的安全补丁仅影响Windows系统,包括Windows Vista、Windows 7、Windows Server 2008和Windows Serv...
日期:07-24