您的位置:首页 > 互联网

阿里云通义千问720亿参数模型开源,适配企业级、科研级高性能应用

发布时间:2023-12-04 21:42:08  来源:互联网     背景:

通信世界网消息(CWW)12月1日,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。力度之大,业界无出其右。

业界最强开源模型,填补中国LLM开源领域空白

Qwen-72B基于3T tokens高质量数据训练,延续通义千问预训练模型一贯以来的强势表现,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。

英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。

3lcd激光投影机

在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩

通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4

Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

用户仅用一句提示词就可创建自己的AI助手

此前,中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白,以高性能、高可控、高性价比的优势,提供不亚于商业闭源大模型的选择。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI for Science等科研工作。

从1.8B到72B,通义千问率先实现全尺寸开源

如果说Qwen-72B“向上摸高”,抬升了开源大模型的尺寸和性能天花板;发布会上的另一开源模型Qwen-1.8B则“向下探底”,成为尺寸最小的中国开源大模型,推理2K长度文本内容仅需3G显存,可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模,通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配,推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

日本无限流量套餐

阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。发布会现场,多位开发者伙伴现身说法,分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化,多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步,当天,阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL,迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新,大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化,一个月前发布的通义千问2.0版闭源模型,最近已进阶至2.1版,上下文窗口长度扩展到32k,代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。


返回网站首页

本文评论
华为拿下印度_荣耀CEO赵明:荣耀团队已撤出印度 将稳妥对待印度市场
证券时报e公司讯,日前,荣耀CEO赵明接受证券时报·e公司记者等媒体采访时表示,荣耀几年前就在印度有团队和经营了很长时间,后来由于众所周知的原因荣耀印度团队撤出了,目前荣耀在...
日期:08-02
美团年度收入「美团第二季度核心本地商业收入368亿元 同比增长9.2%」
查看最新行情   讯 8月26日下午消息,美团今日发布2022年第二季度财报,财报显示,该公司第二季度营收509.4亿元,同比增长16.4%。净亏损11.2亿元...
日期:09-09
imac24寸什么时候出「史上最短发布会!苹果推出全新24英寸iMac:搭载3nm M3芯片 10999元起」
快科技2023年10月31日消息,今早苹果的发布会非常迅速,仅半小时就结束了,创造了苹果最短发布会记录。不过虽然事件较短,但产品却非常重磅,推出了三款M3芯片,包含M3、M3 Pro和M3 Max...
日期:10-31
首发12999元起!RTX 4090公版显卡国行10月15日正式开售_rtx4080显卡发售日期
今天,NVIDIA正式官宣,RTX 4090显卡将于10月15日在国内线下现货首发。据悉,此次NVIDIA将联合沈阳京东MALL、与华硕、七彩虹和微星赛达厂商一同,开售RTX 4090显卡。届时,用户可以购...
日期:10-13
IFS再度荣膺Gartner 2019 现场服务管理魔力象限领导者(Gartner2019服务器魔力象限)
  自2014年以来,IFS已连续多年被Gartner FSM魔力象限认定为领导者   全球企业应用系统提供商 IFS (艾菲诗软件))宣布,IFS现场服务管理™(FSM)套件通过其在Gartner现场服...
日期:03-21
三星s4论坛_三星 galaxy s4
随着科技的不断进步和发展,手机已经成为人们日常生活必不可少的一部分。而在手机品牌方面,三星作为全球著名的智能手机和电子产品制造商之一,受到众多用户的青睐。针对三星s4这...
日期:05-30
学生逆袭被北体录取 老师狂奔报喜:一手带出来的_北体的体育老师
高考陆续放榜,一些学子们已经开始收到录取通知书。据大象新闻分享,近日在山东枣庄,训练场内大家正在休息,突然一名女老师尖叫着冲了进来,她兴奋地狂奔,手舞足蹈向一位黑色衣服的男...
日期:07-12
这个春节,比红包更忙的是AI「春节期间当越来越多的人忙于抢红包并乐此不疲时」
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 黎明 编辑 | 魏佳,授权转载发布。互联网大厂的春节营销,是一场关于用户注意力的争夺战。撒钱曾是常规操作。从铺天盖...
日期:01-18
万家筑巢启动会,越来越多人认识三翼鸟
在酒店。但是 8 月 8 日,三翼鸟却将发布会开在了内蒙古的一个蒙古包中,在这里,这个智慧家庭场景品牌拉开了“万家筑巢”活动在内蒙古落地的序幕。记得 6 月初,三翼鸟将发布会开...
日期:08-10
微信朋友圈大规模上线置顶功能!操作教程来了「微信朋友圈置顶语在哪设置」
快科技8月8日消息,在经过一段时间的内测之后,微信现在大规模上线了朋友圈置顶功能。在更新到最新版本微信之后,可以在自己朋友圈中点击右上角的三个点,此时会弹出一个菜单,出现置...
日期:08-08
生活最后一公里_“最后一公里”,花钱越来越多?
记者 刘小燕   来源:工人日报   近日,共享单车企业陆续上调用户骑行费。有专家指出,作为用户“最后一公里”的重要交通工具,一味地涨价恐怕会造成用户的流失,用户的体验始终...
日期:08-17
索尼公布ps5最新情报「微软抛出重磅消息:索尼PS5 Slim主机或将在今年推出」
快科技7月3日消息,近日,微软在FTC诉微软收购案的听证会上,又抛出了一个重磅消息”。易磐预算软件怎么样在微软提交的文件中指出:iphone 8啥时候上市的Xbox Series S的售价比Swit...
日期:07-03
“算力+运力”扇动双翼,制造算力时代的蝴蝶效应
8月18日-20日,第二届中国算力大会在宁夏银川成功举办。今年以来,随着大模型、AIGC等新技术的火爆,站在舞台中央的算力承载了无尽的期待,发展数字经济需要以算力基础设施为前提,社...
日期:08-29
ChinaJoy2019落幕 来电科技与完美世界合作推出联名款共享充电宝
  8月5日,2019第十七届中国国际数码互动娱乐展览会(以下简称ChinaJoy)在上海新国际博览中心圆满落幕。会上,来电科技与完美世界携手亮相,并推出了联名款共享充电宝为大会...
日期:05-07
极氪mpv最新消息「坐MPV抢了领导位置被公司辞退 极氪009营销疑似翻车」
与理想CEO李想隔空互怼”一番占据上风后,极氪009却遭遇了一次宣发翻车”。近日,@漫鲸视频发布了一条消息,称:近日,福州某位试用期还差3天就转正的员工,因公务外出乘坐7座MPV时,没注...
日期:11-06
windows10提高游戏帧数方法「游戏玩家注意 Win11要关闭这两个功能:帧数提升5帧」
尽管玩家吐槽不少,但是Steam平台上Win11系统份额差不多已有1/4,越来越多的游戏玩家开始升级到Win11平台了。根据微软所说,Win11是针对游戏玩家优化的平台,带来了不少新功能,包括D...
日期:10-11
可减少折痕,三星 Galaxy Z Fold 5 将采用“水滴状”铰链设计_三星Fold折痕越用越明显
IT之家 1 月 16 日消息,根据韩媒 Naver 报道,三星计划为 Galaxy Z Fold 5 采用“水滴”状的铰链设计,在折叠状态下提供更柔和的曲线,从而减少屏幕折痕,降低屏幕开裂的风险。三星...
日期:01-16
潮汽车膜厂商入驻潮玩圈,数字藏品玩家直呼内行!「tmd潮牌车膜」
汽车膜厂商进军潮玩市场,这次跨界有点大!量子膜发布了元仔IP,收获好评如潮。究其原因,一方面量子膜的产品质量过硬,已经积累下了良好的口碑;另一方面元仔本身可爱的形象也萌化了一...
日期:05-22
天猫平台获超1000万名会员数品牌已超40家「天猫旗舰店粉丝数」
10月8日 消息:数据显示,在天猫获得超过1000万名会员的品牌已超过40家。2021年4月,天猫计划未来一年孵化40家会员数达1000万的品牌,当前目标已超额完成。amd多久没发布高端显卡...
日期:10-10
3840Hz超高频调光创行业之最 「荣耀90」-Pro今日发布_荣耀9x调光频率
在不久前,全新的荣耀90系列得到官宣,将于5月29日也就是今天14:30正式与大家见面,将在屏幕和影像等方面带来巨大升级。而随着发布会进入最后的倒计时,截止目前已经有非常详尽的外...
日期:09-16