您的位置:首页 > 互联网

性能超越Llama,通义千问开源Qwen2.5大模型

发布时间:2024-09-19 23:08:02  来源:互联网     背景:

【】9月19日消息,2024云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。

Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

酷比全面屏手机

据介绍,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5-72B模型在MMLU-rudex基准(考察通用知识)、MBPP 基准(考察代码能力)和MATH基准(考察数学能力)的得分高达86.8、88.2、83.1。

Qwen2.5支持高达128K的上下文长度,可生成最多8K内容。模型拥有强大的多语言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。模型能够丝滑响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据(如表格)、生成结构化输出(尤其是JSON)等方面Qwen2.5都进步明显。

语言模型方面,Qwen2.5开源了7个尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它们在同等参数赛道都创造了业界最佳成绩,型号设定充分考虑下游场景的不同需求,3B是适配手机等端侧设备的黄金尺寸;32B是最受开发者期待的“性价比之王”,可在性能和功耗之间获得最佳平衡,Qwen2.5-32B的整体表现超越了Qwen2-72B。

在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B

72B是Qwen2.5系列的旗舰模型,其指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等权威测评中表现出色,在多个核心任务上,以不到1/5的参数超越了拥有4050亿巨量参数的Llama3.1-405B,继续稳居“全球最强开源大模型”的位置。

专项模型方面,用于编程的 Qwen2.5-Coder 和用于数学的 Qwen2.5-Math都比前代有了实质性进步。Qwen2.5-Coder 在多达5.5T tokens 的编程相关数据上作了训练,当天开源1.5B和7B版本,未来还将开源32B版本;Qwen2.5-Math支持使用思维链和工具集成推理(TIR) 解决中英双语的数学题,是迄今为止最先进的开源数学模型系列,本次开源了1.5B、7B、72B三个尺寸和一款数学奖励模型Qwen2.5-Math-RM。

多模态模型方面,广受期待的视觉语言模型Qwen2-VL-72B正式开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。日前权威测评LMSYS Chatbot Arena Leaderboard发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B成为全球得分最高的开源模型。

Qwen2-VL-72B在权威测评LMSYS Chatbot Arena Leaderboard成为成为全球得分最高的开源视觉理解模型

幼儿园小苹果舞蹈教学

自从2023年8月开源以来,通义在全球开源大模型领域后来居上,成为开发者尤其是中国开发者的首选模型。性能上,通义大模型日拱一卒,逐步赶超美国最强开源模型Llama,多次登顶Hugging Face全球大模型榜单;生态上,通义从零起步、开疆拓土,与海内外的开源社区、生态伙伴、开发者共建生态网络,截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。

HuggingFace数据显示,截至9月中旬Qwen系列原生模型和衍生模型总数超过5万个

 


返回网站首页

本文评论
Bard开启公测-CEO_肯定会出错、欢迎反馈 谷歌版ChatGPT_google barcode
在ChatGPT刚刚推出不久,谷歌就公布了自家的生成式人工智能Bard,但由于演示时的翻车遭到了用户的质疑,甚至引起股价下跌。现在,Bard终于在美国和英国先行开启公测,对应地区的用户...
日期:10-06
徕卡相机s3「升级6000万像素传感器:徕卡Q3相机有望年中发布」
近日,Leica Rumors放出了一系列徕卡新品的发布会时间安排,其中就包含了备受关注的徕卡Q3相机。根据此次曝光的消息,徕卡Q3大概率会在今年年中的5到6月正式发布。英国小米专卖店...
日期:03-06
Sutskever正式宣告离职 OpenAI首席科学家Ilya_首席科学家 英文
【】5月15日消息,OpenAI首席科学家、联合创始人Ilya Sutskever今日正式宣告离职,这一消息在人工智能领域引起了广泛关注。作为OpenAI的联合创始人之一,Ilya Sutskever在该公司...
日期:05-15
100万内最好轿跑 哪吒S降价促销:五千抵两万 试驾送车模「哪吒汽车优惠一万」
2月3日消息,哪吒汽车官微宣布,哪吒S推出限时福利:1、试驾就送价值1280元车模2、下定5000即抵20000元(哪吒S耀世版和激光雷达版不参与)活动截止到2月28日。哪吒S于2022年7月正式上...
日期:02-03
华为问界m5「华为问界M9实测重型卡车前后夹击:乘员舱极限抗压保证生存空间」
快科技12月26日消息,问界M9及华为冬季全场景发布会召开,问界M9正式发布。发布会上,余承东展示了问界M9遭重型卡车前后夹击的实测画面,乘员舱极限抗压,完整保障了乘员生存空间,车辆...
日期:12-27
多家媒体宣布接入百度文心一言「百度文心ernie」
2 月 14 日讯:今日,每日经济新闻、上游新闻、澎湃新闻、海报新闻、电脑报、上游新闻等媒体宣布,成为百度“文心一言”首批生态合作伙伴,将全面体验并接入文心一言的能力。企业...
日期:02-15
卢伟冰:Redmi K60 开启 512GB 普及风暴,直降 300 元
IT之家 2 月 13 日消息,小米集团合伙人、总裁,国际部总裁,Redmi 品牌总经理卢伟冰刚刚在微博宣布,从今天 10 点起,K60 全面开启“512GB 普及风暴”,用 2999 元起的价格,就能享受“5...
日期:02-13
旧金山出现“脑谷”,ChatGPT掀起美国初创企业AI热潮
·在硅谷资金比以往更紧张的时期,围绕生成式人工智能的热议已经启动了对小型初创公司的新一轮投资浪潮。2022年投资者向110笔针对生成式AI初创公司的交易投入了超过26亿美元,...
日期:03-09
公司遵守《数字服务法》等欧洲法律-Telegram回应CEO杜罗夫在法被捕
8 月 26 日消息,Telegram 官方 X(推特)账号北京时间今天凌晨发文回应 CEO 帕维尔・杜罗夫在法国被逮捕一事。六十厘米等于一米Telegram 遵守包括《数字服务法》在内的欧盟法律,...
日期:08-26
天玑2000plus相当于骁龙多少「天玑9400最强旗舰!vivo X200 Pro详细参数曝光」
快科技9月4日消息,今天,博主数码闲聊站曝光了vivo X200 Pro的详细配置。据悉,vivo X200 Pro采用1.5K等深微曲屏,搭载联发科天玑9400平台,后置5000万超大底主摄、5000万超广角以及...
日期:09-04
生成摘录、寻找图片无所不能:Copilot版Word截图现身
本月早些时候,微软公布了基于生成式人工智能的Microsoft 365 Copilot服务,能够帮助用户进一步提升生产力。近日,有部分获得测试资格的Office Word for Insiders(Beta Channel)用...
日期:04-01
苹果确认10月4日发布下一代iPhone(苹果十月发布会)
  苹果正式发出秋季新品发布会邀请函,发布会日期定在美国太平洋时间10月4日上午10:00,北京时间10月5日1:00。在邀请函的封面写着“Lets talk iPhone”。   之前确认的消息...
日期:07-23
曝华为Mate60系列供应商涨价20%?官方回应了_华为mate60官方首曝
【手机中国新闻】】此前,手机中国注意到,有媒体报道称,目前供货华为Mate 60系列产品的屏下光学指纹模组供应商相关产品已提价15%-20%,部分型号提价30%。目前,已经有记者向多家供...
日期:10-12
《快手电商服务商违规管理规则》调整:禁止榜单评优「商家违反快手电商平台规则处罚有哪些」
11月18日 消息:昨日晚间,快手电商发布了《快手电商服务商违规管理规则》修订公告,并将于2022年11月24日生效。据悉,本次核心调整具体如下:1、罚则调整;降低限制招商及清退等处...
日期:11-23
预计4.5小时内送抵目标轨道,SpaceX猎鹰重型运载火箭将Viasat-3超高通量通信卫星发射升空
 5 月 1 日消息, 8 点 26 分,由于天气原因多次推迟的 Viasat-3 超高通量通信卫星搭载 SpaceX 猎鹰重型运载火箭在卡角发射场发射升空!此次发射采用全消耗模式,不回收。除 Viasa...
日期:09-30
三星携手Thom Browne正式发布Galaxy Z Fold5 Thom Browne限量版
新一代三星Galaxy Z Fold5 Thom Browne限量版与Galaxy Watch6 蓝牙版 40mm将现代工艺与高端时尚和谐交融尽显精致美学。2023 年 9 月 7 日,三星电子与长久以来的合作伙伴Thom...
日期:09-08
中国新一轮探月开启 嫦娥六号2025年前后发射:七号还将搭载国外飞船
中国的探月工程已经完全了三期,实现了绕、落、回”三步走的目标,9月份探月四期工程立项,下一个要发射的就是嫦娥六号。11月24日联合国/中国空间探索与创新全球伙伴关系研讨会上...
日期:11-25
全面晋升高像素!三星Galaxy S25 Ultra影像规格曝光:2亿主摄 3枚5000万相机
快科技8月20日消息,三星Galaxy S25系列将与明年年初登场,其中被称为安卓机皇”的S25 Ultra其影像系统成为了众多消费者和业界关注的焦点。iqoo 11 pro是微曲面屏吗最新数据显...
日期:08-21
腾讯向股东派发9.58亿股美团股票,腾讯总裁刘炽平卸任美团董事_腾讯参股美团了吗
2022年11月16日消息,腾讯控股公告显示,将按合资格股东持有每10股股份获发1股美团B类普通股的基准,向于记录日期名列本公司股东名册上股东按彼等当时各自于本公司之持股比例,以实...
日期:11-24
天玑820相当于骁龙870「天玑8200杀疯!冲击高频率 碾压二代骁龙7」
旗舰级的天玑9200发布了,次旗舰或者说高端的天玑8200也要来了。早在今年7月底,就有消息称,联发科将推出新一代天玑8200,作为目前天玑8000系列的升级版,升级台积电4nm制造工艺,并且...
日期:11-17