您的位置:首页 > 互联网

开模和闭模「大模型开闭源之争 本质是商业化的争夺」

发布时间:2024-07-30 02:06:19  来源:互联网     背景:

通信世界网消息(CWW)大模型从发展之初,即存在开源与闭源两条路线,孰优孰劣,也处于持续争论之中。2024年7月,在“2024世界人工智能大会”上,众多业内领军人物对大模型开闭源表达了针锋相对的观点。

例如,百度创始人李彦宏站在闭源“阵营”,而百川的王小川、360的周鸿祎、猎豹的傅盛则持相反观点,双方均认为对方的路线是一种“智商税”。

历史规律:路线差异,结果一致

对于大模型开源闭源的孰优孰劣,以及未来发展前景如何,可以从软件产业开源与闭源的发展历史中,寻找到相应的发展规律。

首先,开源与闭源是对软件产品开发模式和商业模式不同的路径探索。具体对比如表1所示。

其次,开源与闭源的结果殊途同归。闭源一直有之;而开源,则起步于20世纪70年代的“自由软件运动”,后于1985年成立自由软件基金会,至20世纪90年代,完全的“自由”逐步被规范化、商业化的“开源”所取代,并在1998年成立了开放源代码促进会。从长期效果来看,两者并存并且各自推出了可相互媲美的产品,例如操作系统领域的Windows和Linux,数据库领域的Oracle与MySQL等。对于复杂的大型软件产品而言,即便前期是由软件爱好者共同开发出原始版本(如Linux),但最终也是由大企业负责后期商业版本的推进。

最后,开源与闭源的过程,体现了适用性的差异。一是产品类型的适用性问题。总体而言,开源适合通用型的工具产品,闭源则更适用于ERP等涉及深层次行业经验的产品(相关经验一般积累在企业的知识库中)。二是产品规模的适用性问题。总体而言,开源适合小规模的软件产品,闭源则更适合体量较大的软件产品,一些操作系统、数据库等在后期商业化进程中,亦偏向闭源经营模式。三是经营企业适用性。行业中绝对领先的企业基本采用闭源模式,以保证市场控制;而行业挑战者则偏好开源,可以快速打造产品和生态。

大模型现状:大企业主导开闭源之争,商业路线是核心

模型开模是什么意思

2022年11月,GPT-3.5的发布推动了大模型产业进入爆发性增长期,“百模大战”快速向“千模大战”迈进。在此过程中,开源与闭源路线一直是争议的焦点。

值得注意的是,大模型的开源与早期软件产业的开源有着显著不同。软件开源遵循“爱好者发布原型——群体性打磨——大企业打造发布版——代码开源而商业闭源——爱好者成为生态助力”;而大模型开源,则直接跳过了前两个阶段,直接由大企业发布代码开源产品,这导致了两个结果。

第一,产品质量取决于企业能力,与开闭源无关。若以闭源的ChatGPT为标杆,则闭源的产品质量一直保持领先。2023年下半年,以Meta的Llama3为代表的多个开源模型发布,在评测中有不少已超过GPT-3.5的能力,甚至接近GPT-4的能力;但2024年闭源Sora发布后,上述差距又被进一步拉大。

amdradeonrx6600xt全新显卡曝光

业内人士认为,产品质量的差距与是否开源基本无关,而取决于研发团队的能力,即团队可以调配的资金、算力和数据。在大企业对大模型代码开源后,开源社区对产品质量提升的幅度不足5%,基本可以忽略不计。一方面,大企业发布的产品完备性较高;另一方面,训练大模型成本高昂,已经不是开源社区内中小主体能够承担得起的,尤其是大规模参数模型训练。

第二,开闭源之争,实际是商业化的争夺。从历史经验可知,开源或者闭源,是不同企业对最适合自身的商业化路径选择。选择将大模型闭源的有OpenAI的ChatGPT、百度的文心一言、华为的盘古、商汤的日日新等,其共同特征是企业在各自的领域中均处于领先地位,闭源后拥有更好的自我保护能力,并可形成许可证销售等商业形态。而选择开源的Meta、谷歌、百川、360、阿里等企业,均是行业的追赶者,它们希望借助“Linux模式”,聚合生态力量,在商业上实现对领先者的赶超。至于处在“长尾”中的大模型厂商,它们的产品大多基于开源大模型而开发,因此亦为开源的拥护者。

大模型未来:“两条腿走路”,加速商业落地

大模型产业发展至今,进一步提升大模型质量固然重要,但更重要的是尽快实现商业落地。为此,2024年5月百度、火山等国内大模型厂商开启了“价格战”;同时,大模型厂商也形成共识,即实现大模型在行业场景中落地。商业化成为大模型行业的重心,各个企业开源或闭源的路线选择亦是立足于企业的资源禀赋,服务于商业化路线,尤其是推动行业应用落地。着眼于未来发展,大模型行业将采用开源与闭源并存的“两条腿走路”发展策略,具体包括三种模式。

一是侧重闭源模式,但会叠加开源生态。上文提及在产业中具有显著领先优势的企业,如OpenAI、百度、华为等,仍然对各自的核心大模型产品采用闭源发展的模式,以实现绝对掌控权。但为了促进应用场景的落地,它们将叠加开源生态,其中包括插件市场的生态,如PPT制作、行业数据库接入等;以及衍生训练的大模型生态,如基于盘古大模型的行业大模型、场景大模型等。

二是侧重开源模式,但要打造基座产品。上文所提及的行业跟随者,如Meta、阿里、百川、360、猎豹等,是开源模式的拥护者。它们需要借助开源社区,提升基础大模型产品质量,使开发者直接使用谷歌、Meta等厂商的大模型进行训练,以及优化算法;同时需要实现产业生态的构建,在此过程中,将优先打造可供使用的“基座型”产品。

三是闭源与开源并存模式,选择适合的模型进行开源。其共同的特征是在较大模型上选择闭源,在较小模型上选择开源。如谷歌的“Gemma(开)+Gemini(闭)”组合、科大讯飞的“星火开源(开)+讯飞星火(闭)”组合、商汤科技的“书生(开)+日日新(闭)”组合等。开闭源的产品组合在强化对核心产品控制力的同时,也促进了生态发展。实际上,大参数模型由于训练成本较高,开源生态贡献较为有限。

从大模型整体发展来看,业界当前所聚焦的大模型算法开源或闭源,仅仅是一个方面,而训练数据的开源或闭源,也同样需要关注。笔者认为,未来的数据集仍将是以开源与闭源的方式并存,预计其中开源数据集将占据市场80%的数据量,主要解决大模型“可训练”的问题,并基于此形成通用大模型底座;而闭源数据集将占据市场20%的数据量,主要解决大模型“训练好”的问题,并基于此形成差异化大模型产品,尤其是面向行业或场景的大模型,这才是大模型厂商竞争的焦点。

*本文刊载于《通信世界》

总第948期 2024年7月25日 第14期

电视整机报告


返回网站首页

本文评论
向苹果A17看齐!曝高通骁龙8 Gen4采用3nm工艺:台积电代工「骁龙88和a14」
快科技8月2日消息,根据曝光的信息,苹果A17仿生芯片将会率先商用台积电3nm工艺。消息称苹果A17芯片初期使用N3B工艺,后期切换到N3E工艺。在苹果A17芯片之后,高通也将会拥抱台积电...
日期:08-02
BOSS直聘现多个无厘头职位名称:找不干人事的人事「boss直聘搜不到我发的职位」
网络招聘平台本来是拉近求职者与企业距离的平台,但近期被曝出不少负面消息,彰显了平台管理审核的漏洞。近日,更是有网友在BOSS直聘上发现了多个无厘头的职位名称,什么钱多活少离...
日期:10-01
红米百元机重出江湖?放言为普及5G手机而来「红米5g智能机」
9月29日消息,Redmi红米手机宣布,Redmi千元小金刚再添猛将,Note 11R为普及5G手机疾速而来。简单说,小米推出了Note 11R,虽然说定价千元,但随着双11到来,未来价格落到百元几乎是可以...
日期:09-29
蔚来产品经理:我们很小 没法和苹果华为两位老大哥比_蔚来苹果合作
  【手机中国新闻】蔚来首款手机产品NIO Phone已经发布多时,但不管车圈还是手机圈的人,还是对这款手机以及蔚来做手机的初衷感到好奇。近日,有蔚来手机团队成员谈到了蔚来亲...
日期:01-19
现在担心为时尚早-周鸿祎谈马斯克呼吁暂停GPT-5研发_周鸿祎股价
就在刚刚,针对“马斯克呼吁暂停GPT-5的研发”一事,360创始人周鸿祎发表了自己的观点称,这不影响中国发展自己的大语言模型,包括360在内的一些中国公司已经展示了自己的作品,实事...
日期:10-04
汉服成为新晋顶流:西安三步一个公主五步一个贵妃
5月2日消息,据国内多家媒体报道,五一假期期间,汉服成为了西安街头一道靓丽的风景线。西安大街小巷随处可见身着汉服的游客,汉服妆造师称:一天大概20个顾客进店,越来越多的游客青睐...
日期:05-03
宝马集团营业收入「同比增长9%,宝马集团2023财年营收1554.98亿欧元」
 3 月 15 日消息,宝马集团日前公布 2023 财年业绩报告,全年营收 1554.98 亿欧元(当前约 1.22 万亿元人民币),同比增长 9%,2022 年营收为 1426.10 亿欧元(当前约 1.12 万亿元人民币...
日期:03-15
通过大模型备案!腾讯云助力心言集团用AIGC重构泛心理行业
近期,北京市生成式人工智能服务新增已备案信息正式公布。其中,北京力拓飞远科技有限公司(心言集团,旗下主要产品为测测App)的情感疏导与陪伴领域大模型“心元”在此次获批名单之...
日期:06-26
小米13最快下月底发布:或首发骁龙8 Gen2「小米13上市时间」
小米13手机更多参数曝光,新机大几率和小米12一样,将会首发高通的年度旗舰芯片,而因为此次的骁龙8Gen2芯片将提前到11月到来,知情人士透露小米13手机将会在11月底正式发布,比以往...
日期:10-26
成都富士康限电停产一周(富士康会被限电吗)
财联社8月15日电,财联社记者从负责富士康招聘的中介处了解到,成都富士康从15日至20日限电,仅保留20%保安负载,全厂生产停止。生产线员工对财联社记者表示,已接到休息通知。(财联社...
日期:08-19
首款车2024年登场!小米汽车工厂一期完工明确量产_小米汽车工厂选址
快科技9月2日消息,据小米高管最新确认,小米造车进展一切顺利,进度超预期,多次强调将于2024年实现量产。据悉,小米造车与此前手机的路线非常不同,一开始就坚持自建工厂,自研自产。iq...
日期:09-02
江波龙emcp「longsys江波龙的进击之路,以产品和技术硬实力开辟全球市场」
存储行业作为一个周期性较强的行业,近几年来一直比较低糜,想要在周期中存活,甚至寻求机会实现弯道超车成为中国存储企业重点关注的问题。而江波龙作为营收规模较大的中国高端半...
日期:06-26
比亚迪申请元宇宙商标_比亚迪申请元宇宙商标为什么被驳回
  企查查App显示,近期,比亚迪(002594)申请注册“比亚迪元宇宙”商标,国际分类为运输工具,目前商标状态为申请中。 黑鲨四代pro京东员工贷5000贷款额度 讯飞智能耳机iflybud...
日期:09-25
499元!乐视Y1 Pro+发布:复刻iPhone 13设计
今日,乐视Y1 Pro+新机上架,提供6GB+64GB、4GB+128GB、4GB+256GB三种配置,售价分别为499元、599元、799元,新机目前已开启预售,将于11月24日起发货。乐视Y1 Pro+正面采用iPhone同...
日期:11-16
苹果收购beats_苹果收购beats花了多少钱
苹果公司在2014年以30亿美元的价格收购了Beats Electronics,这是苹果公司历史上最大的一笔收购交易之一。这个收购引起了全球范围内的广泛关注和讨论,也使得苹果公司将音乐作...
日期:05-31
就去干AI,拉勾招聘AIGC人才年薪百万供不应求 干不过AI
【】3月16日消息,继OpenAI在昨日凌晨正式发布升级后的GPT-4后,今天百度大语言模型产品“文心一言”正式发布。这些类 ChatGPT人工智能产品可编代码、可写论文,还能够处理图像...
日期:10-06
终于!PS4/PS5模拟器做出来了:已能运行部分游戏(ps5可以运行ps4游戏吗)
  PS3模拟器已经渐入佳境,以知名度较高的RPCS3为例,最近的一次更新对性能进行了大幅改进,《合金装备4》提升了25~50%,《荒野大镖客》《女神异闻录5》等也有5~20%不等的提升。...
日期:07-18
China travel风靡海内外,中国特种兵式旅行捧红海外达人_中国特种兵国外训练电影
声明:本文来自于微信公众号 新榜(ID:newrankcn),作者:Bamboo,授权转载发布。“来中国旅游,city不city啊?”一群来中国旅行的外国人,不仅花式整活创造出网络热梗,还让“China travel...
日期:07-08
今天情人节 微信可以发520元红包 律师提醒:分手可能要不回「情人节微信红包能发500元吗」
今天是2月14日情人节,微信节日限定红包再次上线,与往年一样,微信红包的金额上限由200元调整为520元,由于520”谐音我爱你”,经常成为有情之人间表达爱意的手段。华为mate5010月21...
日期:02-15
希沃助力清涧县中小学教师新媒体新技术教学应用大赛
  为提升教师能力,充分调动教师应用信息技术的积极性和创造性,促进新媒体新技术在课堂教学中的有效应用,推进信息技术与教育教学的融合创新,2019年10月10日—12日,希沃应清涧...
日期:09-06