您的位置:首页 > 互联网

元象开源650亿参数高性能大模型,无条件免费商用_元象集团

发布时间:2023-11-06 12:58:10  来源:互联网     背景:

11月6日消息,元象XVERSE公司宣布,开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。

元象教育怎么样

元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验,三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型,为研究、商业及生态创造三重价值。”


据介绍,XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。

pps和爱奇艺合并了吗

元象坚持“高性能”定位,提升了65B三方面能力: 一、理解、生成、推理和记忆等基础能力,到模型的多样性、创造性和精度表现,从优异到强大;二、扩展了工具调用、代码解释、反思修正等能力,为构建智能体(AI Agent)奠定技术基础,提高模型实用性;三、显著缓解7B、13B中常见且可能很严重的幻觉问题,减少大模型“胡说八道”,提高准确性和专业度。

据悉,元象大模型系列均为全链条自研,涵盖多项关键技术与研发创新:

亚马逊kindle 可以写字么

复杂分布式系统设计:借鉴团队研发腾讯围棋AI“绝艺”、王者荣耀AI“绝悟”等大系统上的丰富经验,自研高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台与框架协同等关键技术,打造高效稳定的训练系统, 千卡集群峰值算力利用率达58.5%。

全面提升性能:65B训练中采用FlashAttention2加速计算, 3D并行基础上采用虚拟流水线(virtual pipeline)技术,降低较长流水线产生过高气泡率,提升计算推理效率; 上下文窗口长度从8K逐步提升到16K,使其不仅能出色完成复杂任务,包括长文理解、长文生成和超长对话,还拓展了工具调用、代码解释及反思修正能力,能更好构建智能体(AI Agent)。

提升训练稳定性:因计算量庞大,通信拥塞、芯片过热或计算节点故障成为65B训练常态,初期出现过一周最高八次故障的情况。通过集群基础设施运营、资源调度、训练框架和调度平台协同等持续优化,元象打造出高稳定、低中断、强容错的训练系统,将每周有效训练率提升至98.6%。

此外,在接近1.6万亿Tokens的模型训练中期,损失函数产生了NaN值,可能导致训练中断。通常情况下,业界一般会在分析后删除与之相关的数据区间。而团队根据经验判定这是模型自然演化,选择不删除数据,直接跳过相关参数更新,最终 NaN值 问题解决。后期对参数值、激活值、梯度值等中间状态的进一步分析表明,该问题可能 与模型最后一层transformer block激活值的最大值变化有关,并会随最大值的逐渐降低而自行解决。

字节跳动vr 一体机pico 4 国行发布

金属3d打印强度

为确保业界能对元象大模型性能有全面、客观、长期认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。

XVERSE-65B在与国外标杆对比测评中,部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆 Llama2-70B和Falcon-180B ;与GPT4仍有差距。

据介绍,元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用,能满足中小企业、科研机构和个人开发者绝大部分的应用与迭代需求。

元象同时提供模型训练、推理、部署、精调等全方位技术服务,赋能文娱、金融、医疗等各行各业,帮助在智能客服、创意写作、精准推荐等多场景打造行业领先的用户体验。2023年10月, 腾讯音乐宣布与元象大模型建立战略合作 ,共同推出lyraXVERSE加速大模型、全面升级其音乐助手“AI小琴”,未来还将持续探索AI与3D前沿技术。(一橙)


返回网站首页

本文评论
疯狂小杨哥成立小绵羊文化传媒公司 由三只羊全资持股「杨家小绵羊作品」
1月9日 消息:1月9日,天眼查App披露消息,合肥小绵羊文化传媒有限公司正式成立,法定代表人为杨鹏,注册资本50万元人民币,主要经营范围包括文化艺术交流活动,广告发布,会议展览服务,礼...
日期:01-10
微软预热 Win11 画图全新设计
  8 月 19 日消息 外媒 Neowin 报道,微软已经慢慢开始向 Windows 11 截图工具、计算器等内置应用推出了一堆 App 更新,作为这些应用更新的一部分。这些并不代表只是视觉 UI...
日期:05-09
中国移动董事长:AIGC 可能又会引发新一轮的科技革命 这只是刚刚开始
6月28日消息:在今天的 MWC(世界移动通信大会)上海 2023 开幕式上,中国移动董事长兼执行董事杨杰表示,全球信息通信业的科技创新历经三个阶段,分别是策源创新阶段、迭代创新阶段、...
日期:06-28
百度地图大数据:五一首日热门自然风景区西湖、五台山、泰山客流较平日大幅增长
  2021五一小长假开启,旅游市场强劲复苏,公众出行意愿强烈。据百度地图节假日出行仪表盘数据显示,5月1日上午10:30全国高速拥堵迎来峰值,拥堵里程达到8276.55公里,远超过去两...
日期:04-01
三星前高管批美国对华芯片限制政策:称其可能适得其反 影响韩国
据英国金融时报消息,韩国国会议员、三星电子前芯片工程师和高管梁香子,强力批评美国干预全球半导体产业的做法。她认为美国限制中国大陆取得生产先进制程芯片的措施,可能损害美...
日期:08-07
“坐飞机去迪拜买还能省2.4万卢比”!印度产iPhone被指定价太高_迪拜机场买手机
【环球时报报道 记者 苑基荣】印度产苹果手机22日即将正式出售,但其过高的定价成为多方讨论的焦点。“iPhone 15引起人们的兴趣,但印度制造的高价手机令人感到失望”,印度money...
日期:09-21
凉山考上清华大学学生名单「凉山小伙考上北大 录取前还在干农活:想暑假干活帮家减轻负担」
凉山男生被北京大学录取,这是一件让人开心的事情,毕竟他的努力得到了回报。木乃约热出生在甘洛县的小山村,今年以681分的成绩,通过国家专项计划”(这一次高考,英语考了140分,语文12...
日期:07-20
港股美团股价「港股美团跌超11%,市值跌破1万亿港元」
  讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,腾讯方面回应称,不予置评。小米11 ul...
日期:09-27
亚马逊ceofgo「亚马逊CEO审查内容支出,斥巨资但收视率不理想」
北京时间7月6日早间消息,亚马逊CEO安迪·贾西 (Andy Jassy)正对公司流媒体服务原创剧开支进行审查,因为有些项目投入巨大但未获太大成功。亚马逊在好莱坞设有工作室,专门制作原创...
日期:09-22
清洁能源充电功能上线 iOS 16.1 Beta5推送_ios充电更新
中关村在线消息:近日,苹果向开发人员们推送了iOS 16.1的第5个Beta测试版,新增了live Activity等全新功能,详细内容如下:live Activity是一种显示在锁屏界面上的交互式通知,让用户...
日期:10-15
微软推浏览器安全平分网站 IE领先对手
  10月12日消息,微软周二推出一个名为yourbrowsermatters.org的网站,对各种版本微软IE浏览器以及谷歌和Mozilla等竞争对手制作的浏览器进行安全平分。这个新网站让浏览器通...
日期:07-23
抖音发布春节数据报告  50款拜年特效累计使用超1亿次_抖音元宵节特效
  2月17日,抖音发布《2021抖音春节数据报告》(以下简称“报告”),从新年俗、就地过年新方式等方面勾勒出这个特殊春节的图景。   报告显示,为了让春节期间年味不减,抖音推...
日期:07-16
战神归来!真我GT5 Pro首爆:骁龙8 Gen3 3X潜望镜
快科技8月1日消息,realme已经官宣旗下旗舰手机系列 GT 的最新产品真我GT5系列,号称安卓性能之王巅峰对决”。据博主数码闲聊站”透露,realme即将推出的骁龙8Gen2新机被正式命名...
日期:08-01
三星与海力士内存性能差异「三星、SK海力士加速CXL技术开发:提高服务器DRAM销量」
快科技10月13日消息,据市场调查机构的报告显示,全球Compute EXpress Link(CXL)市场规模在2028年将达到150亿美元,虽然目前只有不到10%的CPU与CXL标准兼容,但预计到2027年所有CPU都...
日期:10-15
拉勾招聘《2022数字化科技人才招聘白皮书》:超3成求职者愿与公司共患难 82%打工人可接受合规裁员
12月26日消息,拉勾招聘发布了《2022数字化科技人才招聘白皮书》(下称“白皮书”)。白皮书显示,不同年龄段求职者最关心的福利待遇和职场心态差别较大。面对严峻的职场环境,3成...
日期:12-26
金壮龙参加第三届“一带一路”国际合作高峰论坛互联互通高级别论坛
10月18日,工业和信息化部部长金壮龙参加第三届“一带一路”国际合作高峰论坛互联互通高级别论坛,并在主题讨论环节发言。金壮龙指出,在习近平主席关于共建“一带一路”的重要论...
日期:10-20
依旧不肯放弃:Intel仍希望苹果成为其芯片客户_苹果放弃英特尔芯片
  自从去年,苹果开始在Mac中放弃Intel处理器,而采用自家的M1开始,Intel就不止一次提到,希望苹果能够再次成为它的客户。  近日的Intel创新活动中,Intel的客户计算集团执行副...
日期:09-29
华尔街巨头高盛计划再裁员4000人 占全体员工总数的8%_高盛在华尔街的地位
12月19日 消息:近日,美国高盛集团最近宣布了一项全球性的裁员计划,预计将有4000个工作岗位被裁掉,占全体员工总数的8%,其原因是由于预期明年全球经济增长前景不明。移动电源最大...
日期:12-19
OPPO、小米等中国品牌唱主角的东南亚市场,苹果 iPhone 迅速崛起_东南亚本土手机品牌
IT之家 6 月 20 日消息,根据国外科技媒体 Rest of World 报道,在以安卓唱主角的东南亚智能手机市场,苹果迅速崛起,受到了年轻消费者的追捧和喜爱。根据市场调查机构 Counterpoin...
日期:06-20
AVG:木马随“灵珠”来袭,看视频安全第一
  “你有过追一部小说或电视剧,天天坐等更新、欲罢不能的经验吗?如果有人告诉你他有官方没有发布的最新剧集,你会选择相信吗?”AVG中国实验室的专家们最近截获了一批穿着时下...
日期:07-27