您的位置:首页 > 互联网

全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符

发布时间:2024-06-07 12:06:06  来源:互联网     背景:

声明:本文来自于微信公众号硅星人Pro(ID:Si-Planet),作者:周一笑,授权转载发布。

大模型领域,开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型,为这场争论提供了最新的答案。

6月7日,通义千问推出开源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整体性能相比Qwen1.5-110B大幅提升!一举超越了美国最强的开源模型Llama3-70B,更是将文心4.0等中国众多闭源模型甩在身后,登上最强开源大模型的宝座。

OpenCompass大模型测评榜单上,Qwen1.5-110B已领先于文心4.0等一众中国闭源模型

对比当前最优的开源模型,Qwen2-72B在多项能力上均处于领先

Qwen2系列模型除了技术性能上的提升,还展现了更多的应用潜力。其多语言处理、长文本处理、代码生成、数学和逻辑推理等能力,已经在MMLU、GPQA、HumanEval等国际测评中得到了验证。

代码及数学能力也得到了显著提升

此前存在一种观点认为在大模型的开发上,闭源模型因为其庞大的投资和资源积累,相较开源模型具有不可比拟的优势,导致了一种看似共识的观念:开源模型难以追赶闭源模型的步伐。

单一的公司的闭源模型,如果有大量资金和资源投入,的确可以在短期内推动技术的发展,这一点在OpenAI上已经得到了验证。而且不可否认,选择闭源的OpenAI在性能上仍然是业界最强。

而这次阿里云Qwen2的发布,表明开源模型同样能够达到甚至超越闭源模型的高性能。这不仅让开源模型落后闭源模型的论调不攻自破,也再次证明了开源大模型不仅不会越来越落后,在技术上更是有着无限的可能。开源大模型能够做到足够强,并且会越来越强。

同时这也是对开源价值的再一次阐释,Qwen系列的开源模型除了为技术社区贡献了一项重要的资源,也鼓励了全球性的创新合作,进一步强化了开源大模型生态系统的活力和包容性。

值得一提的是,阿里云在1个月前刚刚发布中文场景性能超过GPT-4的闭源模型——通义千问2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。

所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。

1

Qwen2问世,卷起千层浪

Qwen2不仅仅意味着开源大模型阵营诞生了新标杆,它已在整个行业里卷起千层浪。Qwen2系列模型的API已经登陆自家的阿里云百炼平台,众多全球开源平台和工具也第一时间宣布对Qwen2的支持,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等等,这样的生态影响力在国产大模型行列里绝无仅有。

i57400加1050ti

Qwen2这次的开源在X上也引发了大量的讨论:海外网友和开发者纷纷欢迎这款最强开源模型的到来。

“自Llama3以来,Qwen2是最具影响力的开源LLM,性能超过了Llama3,在学术和聊天方面达到了最先进的性能”

Hugging Face创始人第一时间发来贺电

事实上,过去10个月里,这样的场景并不是阿里云开源大模型仅有的高光时刻。据了解,Qwen系列模型总下载量已突破1600万次。在全球开源社区出现了超过1500款基于Qwen二次开发的模型,Qwen系列的72B、110B模型多次登顶HuggingFace 的Open LLM Leaderboard开源模型榜单,其国际社会认可度及开发者好感度可见一斑。

大洋彼岸的Meta试图用Llama系列一统开源天下,而阿里的通义千问的出现为全球开发者提供了另一项选择,也让我们看到了“国外一开源,国内就自主”说法的偏颇。市场会用脚投票,以Qwen为代表的国内开源模型所作出的贡献被长期忽视的现状,一定会随着更多全球企业和开发者的认可,逐渐扭转过来。

1

开源的Qwen,开放的阿里云

nova8文案

开源与互联网的发展紧密相连,自1970年代Unix和互联网问世之初,开源就随之出现。如果不是开源运动的推进,许多技术仍可能被少数巨头企业所垄断,阻碍科技普惠程度,我们所见证的科技创新浪潮也将不复存在。

对于大模型行业来说,有了更好的开源模型,才能够吸引更多人才参与到相关技术创新研究中。有了更好的开源模型,更多中小企业才能真正用上大模型,才会有更多对大模型产品应用的探索。

阿里云对开源的坚持,本质上是相信开放的力量,也就是阿里云CTO周靖人所说,“坚持开源开放是阿里云的重要策略,我们希望打造一朵AI时代最开放的云,让算力更普惠、让AI更普及。”这种坚定的开源策略,不仅为技术创新提供了土壤,也为全球开发者提供了平台。

开放是为了服务好客户,阿里云百炼集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具。

开放也是为了生态的繁荣,把饼做大,才能更好的分饼。在阿里云魔搭社区上,汇聚了大量开源模型,成为国内开发者最活跃的AI社区。

选择开源还是闭源,不仅是企业的战略决策,更会影响商业模式。不可否认的是大模型的开源存在商业模式不明朗的问题,比如扎克伯格也一直在评估自身能否从云服务厂商使用Llama相关收入中进行分成,毕竟Meta不太可能为了Llama去开辟云计算业务。

而对阿里云这样一家提供基础设施的云厂商来说,商业逻辑就十分清晰了。在大模型技术带动云计算增量需求,几乎是一个确定性趋势的背景下,Qwen的开源不需要带来直接的商业化收益,而是吸引更多的厂商和开发者,来使用阿里云打造的基础设施,以及包括闭源模型在内的相关服务,从底层的算力基座,到大模型应用的构建,再到开放的AI生态,从而形成完整的商业模式。

通过亲自下场打造并开源Qwen系列模型,同时为大模型的落地提供完善的工具和平台,阿里云走出一条与Meta、微软、AWS等顶级玩家不同的道路,这种云+AI的示范效应,已成为一种行业标准,对客户选择阿里云来探索大模型提供了一种天然的说服力。

这在全球大模型厂商中也是独一份。

1

Qwen是阿里AGI愿景的重要拼图

在AGI成为科技巨头们新战场的当下,阿里巴巴清晰地表明了其在这一领域的坚定信心和战略布局。在阿里发布的2024财年致股东信中,明确提出电商和云计算是阿里的两大核心业务,并将通过持续投资保持基础技术的领先地位,包括人工智能在内的创新。

从技术发展的角度来看,AI的进步经历了数次重要的飞跃,已经深刻改变了各个行业的面貌。云计算的普及进一步加速了AI的发展,使得大规模数据处理和复杂模型训练成为可能。在这一历史背景下,阿里云通过其云计算基础设施和持续的技术创新,推动了AI技术的前沿探索,Qwen的领先以及在全球范围获得了认可,正是阿里云计算与AI结合战略的产物。

从商业发展的角度,技术创新一直是企业竞争力的核心驱动力。阿里云通过将AI与云计算的深度融合,不仅开辟了在AI时代的商业模式,也获得了持续增长的路径。

在近期与摩根大通的对话中,阿里巴巴副主席蔡崇信再次表示AI和云计算的结合至关重要,并强调了阿里对AGI愿景的坚定信念。现在来看,阿里云已然为这一愿景打造了一块关键拼图。


返回网站首页

本文评论
百度17篇论文入选全球顶尖视觉盛会CVPR 百度大脑实力超群成幕后赢家
  随着深度学习的迅猛发展,计算机视觉已成为人工智能领域影响最深远的技术之一。在计算机视觉领域深入研究、有着强大技术积累的百度,以17篇论文入选计算机视觉和模式识别...
日期:03-28
马斯克在推特上推的币「媒体称马斯克已完成收购推特,CEO和CFO遭开除」
  每经记者 李孟林;三星s5有没有红外线功能  当地时间10月28日,据《华尔街日报》报道,马斯克已经完成对推特(TWTR,股价53.70美元,市值410.94亿美元)的收购,推特首席执行官Parag...
日期:11-01
谷歌更新的隐私政策引发争议 加大力度使用你的数据来训练 Bard 等人工智能
7月4日消息:谷歌上周末更新了其隐私政策,明确表示公司保留了利用用户在网上发布的几乎所有内容来构建其人工智能工具的权利。如果谷歌可以读取你的内容,就假设它们现在属于公...
日期:07-04
2020年前三季度国民经济运行情况新闻发布会「2023年前三季度国民经济运行:同比增长5.2%!」
通信世界网消息(CWW)10月18日,国家统计局发布2023年前三季度国民经济运行情况。初步核算,前三季度国内生产总值913027亿元,按不变价格计算,同比增长5.2%。分季度看,一季度国内生产...
日期:10-19
京东热卖-只为品质生活!_京东“她的节”用心诠释品牌温度,用心来爱用心的她
  年味尚未散尽,3月悄然而至,3月8日即将来临,不论是职场中独当一面的白领,还是在家里操劳大小事情的母亲,都是这一天当仁不让的主角。今年京东以“她的节”为全新主题,聚焦每一...
日期:07-16
中国电子学会张峰:5G赋能,助力首都打造全球新型智慧城市标杆城市
通信世界网消息(CWW)2023年6月4日,以“5G京彩 智算领航”为主题的“北京5G领航城市创新论坛暨5G扬帆系列活动”在北京举办。工业和信息化部原党组成员、总工程师,中国电子学会理...
日期:06-04
人大金仓kingbase「人大金仓亮相首届档博会,引领智慧档案建设」
10 月 27 日, 2023 首届中国智慧档案科技博览会在北京国际会议中心圆满落幕。人大金仓作为中国档案学会会员单位,展出一系列新技术、新产品、新方案,获得用户、伙伴的广泛关注...
日期:10-30
配5000mAh大电池!vivo Y78通过NCC认证:支持44W快充_vivoy7s支持多少w快充
据GIZMOCHINA报道,vivo Y78手机已通过NCC认证,产品型号为“V2244”,预计将与vivo Y78 一同发布。根据NCC认证页面的显示,vivo Y78内置5000mAh电池,支持44W快充。alphabet第一季度...
日期:04-16
零一万物Yi-34B-Chat微调模型及量化版开源
11月27日 消息:11月24日,零一万物基正式发布并开源微调模型 Yi-34B-Chat,可申请免费商用。关于抖音医疗内容管理规则的说明同时,零一万物还为开发者提供了4bit/8bit 量化版模型...
日期:11-27
施密特称换帅不会引发巨变 谷歌将照常运作(谷歌ceo施密特)
  据国外媒体报道,谷歌首席执行官施密特周五表示,虽然公司将在今年4月更换首席执行官,但整个公司高层并不会发生重大变化。   施密特在参加达沃斯世界经济论坛时表示:“我...
日期:07-26
uc老总俞永福_UC靠“将”起诉腾讯博上位俞永福微访谈避重就轻
  UC优视CEO俞永福出身联想,却成了360周鸿祎的“学徒”。今天大张旗鼓地又开发布会,又上新浪微博的微访谈,马不停蹄地向天下昭告“UQ大战”开始了。   选择在这个时间点向...
日期:07-24
周鸿祎自曝不会开车:又谈小米汽车为何成功 雷军营销封神_周鸿祎谈智能汽车
快科技4月8日消息,在今日的免费课上,周鸿祎公开坦言,他至今连驾照都没有,更不用说开车了。周鸿祎对听课人群表示:在汽车领域,我完全是个小白,与在座的许多老司机相比,我连驾照都没有...
日期:04-08
大圣归来海外票房「《大圣归来》导演新作!《深海》票房破亿:打磨7年」
今日消息,田晓鹏导演动画《深海》豆瓣7.6。目前上映至第二天,累计票房破亿。该片构建了一个不同于以往的全新海底世界,讲述了一位少女在神秘海底世界中追寻探索,邂逅一段独特生...
日期:01-24
元宇宙奶茶,是风口还是镰刀?
声明:本文来自于微信公众号 微果酱(ID:wjam123456),作者:陈出木,授权转载发布。如果说,往回倒十多年,奶茶还没有“统治”人类,那么在这短短的十年中,奶茶已经成为当代年轻人生活中不...
日期:12-23
专家谈:6G专利机遇大于挑战_6g技术中国专利
专家谈:6G专利机遇大于挑战 通信产业网|2024-05-06 09:56:33作者:胡媛来源:通信产业网【通信产业网讯】(记者 胡媛)在专利数量的基础上,扎实做好专利布局,提高专利质量,并且发挥出积...
日期:05-06
英国公布AI监管原则 开发者须对输出内容负责_英国ai技术
9月19日 消息:近日,英国反垄断监管机构“竞争与市场管理局”(CMA)提出了管理AI模式的新标准,旨在规范AI技术的健康发展。这些标准涵盖了问责、访问、透明度等7个方面。CMA首席执...
日期:09-19
网红博主烹食的150斤大白鲨系福建渔民捕获后贩卖,涉事两人已被批捕
↑视频截图联想zuk处理器特斯拉在美遭投诉,50万辆车涉及“意外加速”风险  因拍摄水煮和烧烤鲨鱼的视频,百万粉丝网红博主“提子”被推上风口浪尖,网友举报疑烹食的鲨鱼是濒...
日期:09-19
王传福亲自交车还赠欧洲杯签名球 腾势N7车主:出一辆我买一辆
快科技5月29日消息,今天,比亚迪董事长王传福亲自来到腾势西安门店,为全新腾势N7车主交付新车。荣耀天猫授权哪些店冰箱里放钱有什么妙用其中,汽车博主@向北不断电 是老款腾势N7...
日期:05-29
玖富集团以AI技术为金融业转型提供助力(玖富金融公司简介)
  ​原标题:   在金融需求愈发多元化的当下,AI与金融的结合提供了个性化、智能化、专业化的金融服务,完善了金融领域信用和风险评级体系,不断促使金融资源配置效率得以提高...
日期:08-15
中国人自己的技术!百度重磅突破免费开放
  (原标题:中国人自己的技术!百度开源自研底层区块链XuperChain)     近年来,我国各行各业迅猛发展,但不少尖端行业和产品仍然依赖进口,关键领域受制于人,火热的区块链领域也...
日期:11-02