您的位置:首页 > 互联网

模型大师的模型视频「大模型行业,根本没有什么“真”开源?」

发布时间:2024-08-01 15:34:18  来源:互联网     背景:

声明:本文来自于微信公众号硅星人Pro,作者:周一笑,授权转载发布。

最近一段时间开源大模型市场非常热闹,先是苹果开源了 70 亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源,在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。

模型大师介绍

不过开源派和闭源派之间的争论并没有停下来的迹象。

一边是Meta在Llama 3. 1 发布后表示:“现在,我们正在迎来一个开源引领的新时代。”另一边是Sam Altman在《华盛顿邮报》撰文,直接把开源闭源的矛盾上升到国家和意识形态层面。

在前段时间的世界人工智能大会上,李彦宏直言“开源其实是一种智商税”,因为闭源模型明明性能强,推理成本更低,再次引发讨论。

随后,傅盛也发表了他的看法,他认为开源和闭源这两个阵营是彼此共同竞争,共同发展。并对“开源其实是一种智商税”这一观点进行了反驳:“开源大语言模型是免费的,他怎么来的智商税呢,谁在收税?”,“如果今天企业用付费闭源大语言模型,那才叫'智商税',尤其是收很高的模型授权费、API费用,一年花了数百上千万,最后买回去当个摆设,甚至员工根本用不起来(模型)。”

这场争论的核心涉及到技术发展的方向和模式,反映了不同利益相关者的观点和立场,在我们谈论大语言模型的开源和闭源之前,需要厘清先“开源”和“闭源”这两个基本概念。

“开源”一词源自软件领域,指在软件开发过程中公开其源代码,允许任何人查看、修改和分发。开源软件的开发通常遵循互惠合作和同侪生产的原则,促进了生产模块、通信管道和交互社区的改进,典型代表包括Linux,Mozilla Firefox。

闭源软件(专有软件)由于商业或其他原因,不公开源代码,只提供计算机可读的程序(如二进制格式)。源代码仅由开发者掌握和控制。典型代表包括Windows,安卓。

开源是一种软件开发模式,基于开放、共享和协作,鼓励大家共同参与软件的开发和改进,推动技术的不断进步和广泛应用。

选择闭源开发的软件更有可能成为一个稳定、专注的产品,但是闭源软件通常需要花钱,且如果它有任何错误或缺少功能,只能等待开放商来解决问题。

至于什么是开源大模型,业界并没有像开源软件一样达成一个明确的共识。

大语言模型的开源和软件开源在理念上是相似的,都是基于开放、共享和协作,鼓励社区共同参与开发和改进,推动技术进步并提高透明性。

然而,在实现和需求上有显著区别。

软件开源主要针对应用程序和工具,开源的资源需求较低,而大语言模型的开源则涉及大量计算资源和高质量的数据,并且可能有更多使用限制。因此,虽然两者的开源都旨在促进创新和技术传播,但大语言模型开源面临更多的复杂性,社区贡献形式也有所不同。

李彦宏也强调了两者的区别,模型开源不等于代码开源:“模型开源只能拿到一堆参数,还要再做SFT(监督微调)、安全对齐,即使是拿到对应源代码,也不知道是用了多少比例、什么比例的数据去训练这些参数,无法做到众人拾柴火焰高,拿到这些东西,并不能让你站在巨人的肩膀上迭代开发。”

大语言模型的全流程开源包括将模型开发的整个过程,从数据收集、模型设计、训练到部署,所有环节都公开透明。这种做法不仅包括数据集的公开和模型架构的开放,还涵盖了训练过程的代码共享和预训练模型权重的发布。

过去一年,大语言模型的数量大幅增加,许多都声称是开源的,但它们真的有多开放呢?

荷兰拉德堡德大学的人工智能研究学者Andreas Liesenfeld和计算语言学家Mark Dingemanse也发现,虽然“开源”一词被广泛使用,但许多模型最多只是“开放权重”,关于系统构建的其他大多数方面都隐藏了起来。

比如Meta和微软等科技虽将其大语言模型标榜为“开源”,却并未公开底层技术相关的重要信息。而让他们意外的是,资源更少的AI企业和机构的表现更令人称赞。

该研究团队分析了一系列热门“开源”大语言模型项目,从代码、数据、权重、API到文档等多个方面评估其实际开放程度。研究还将OpenAI的ChatGPT作为闭源的参考点,凸显了“开源”项目的真实状况。

✔为开放,~为部分开放,X为封闭

结果显示,项目间差异显著,根据这个排行榜,Allen Institute for AI的OLMo是最开放的开源模型,其次是BigScience的BloomZ,两者都是由非营利组织开发。

论文称,Meta的Llama以及Google DeepMind的Gemma 虽然自称开源或开放,但实际上只是开放权重,外部研究人员可以访问和使用预训练模型,但无法检查或定制模型,也不知道模型如何针对特定任务进行微调。

最近LLaMA3 和Mistral Large2 的发布引起了广泛关注。在模型在开放性方面,LLaMA3 公开了模型权重,用户可以访问和使用这些预训练和指令微调后的模型权重,此外Meta还提供了一些基础代码,用于模型的预训练和指令微调,但并未提供完整的训练代码,LLaMA 3 的训练数据也并未公开。不过这次LMeta带来了关于LLaMA 3.1 405B 的一份 93 页的技术报告。

Mistral Large2 的情况类似,在模型权重和 API 方面保持了较高的开放度,但在完整代码和训练数据方面的开放程度较低,采用了一种平衡商业利益和开放性的策略,允许研究使用但对商业使用有所限制。

谷歌表示,该公司在描述模型时“在语言上非常精确”,他们将Gemma称为开放而非开源。“现有的开源概念并不总能直接应用于 AI 系统,”

这项研究的一个重要背景是欧盟的人工智能法案,该法案生效时,对归类为开放的模型实施较宽松的监管,因此关于开源的定义可能会变得更加重要。

研究人员表示,创新的唯一途径是通过调整模型,为此需要足够的信息来构建自己的版本。不仅如此,模型还必须接受审查,例如,一个模型在大量测试样本上进行了训练,那么它通过特定测试可能并不算一项成就。

他们也对如此多的开源替代方案的出现感到令人欣喜,ChatGPT非常受欢迎,以至于很容易让人们忘记对其训练数据或其他幕后手段一无所知。对于那些希望更好地了解模型或基于构建应用的人来说,这是一个隐患,而开源替代方案使得关键的基础研究成为可能。

硅星人也对国内部分开源大语言模型的开源情况进行了统计:

从表中我们可以看到,和海外的情况类似,开源较为彻底的模型基本是由研究机构主导,这主要是因为研究机构的目标是推动科研进步和行业发展,更倾向于开放其研究成果。

而商业公司则利用其资源优势,开发出更为强大的模型,并通过适当的开源策略在竞争中获得优势。

从GPT- 3 到BERT以来,开源为大模型生态系统带来了重要的推动力。

快手春节抢红包

通过公开其架构和训练方法,研究人员和开发者可以在这些基础上进行进一步的探索和改进,催生出更多前沿的技术和应用。

开源大模型的出现显著降低了开发的门槛,开发者和中小企业能够利用这些先进的AI技术,而不必从零开始构建模型,从而节省了大量的时间和资源。这使得更多创新项目和产品得以快速落地,推动了整个行业的发展。开发者们在开源平台上积极分享优化方法和应用案例,也促进了技术成熟和应用。

对教育和科研而言,开源大语言模型提供了宝贵资源。学生和新手开发者通过研究和使用这些模型,能快速掌握先进AI技术,缩短学习曲线,为行业输送新鲜血液。

oppo a3充电速度

然而,大语言模型的开放性并非简单的二元特性。基于Transformer的系统架构及其训练过程极为复杂,难以简单归类为开放或封闭。开源大模型并非一个简单的标签,更像一个光谱,从完全开源到部分开源,程度各异。

大语言模型的开源是一项复杂而细致的工作,并非所有模型都必须开源。

更不应以“道德绑架”的方式要求全面开源,因为这涉及大量技术、资源和安全考量,需要平衡开放与安全、创新与责任。正如科技领域的其他方面一样,多元化的贡献方式才能构建一个更丰富的技术生态系统。

开源和闭源模型的关系或许可以类比于软件行业中开源和闭源软件的共存。

开源模型促进了技术的广泛传播和创新,为研究者和企业提供了更多可能性,而闭源模型则推动着整个行业的标准的提升。两者的良性竞争激发了持续改进的动力,也为用户提供了多样化的选择。

模型大师的模型视频

正如开源和专有软件共同塑造了今天的软件生态,开源和闭源大模型之间也并非二元对立,两者的并存发展是推动AI技术不断进步、满足不同应用场景需求的重要动力。最终,用户和市场会作出适合自己的选择。


返回网站首页

本文评论
中国移动云能力中心:十年磨一剑,乘“云”而上向未来_中国移动云能力基座的关键技术
中国移动云能力中心:十年磨一剑,乘“云”而上向未来 通信产业网|2024-07-04 16:22:54作者:通文来源:移动云【通信产业网讯】“加强与本地产业、资源链接,积极参与苏州数字经济发...
日期:07-09
OPPO Reno11 系列发布,全系单反级人像,所见如所愿_oppor11人像模式怎么打开
通信世界网消息(CWW)OPPO 今日发布Reno11系列新品,业内首创的幸运宝石设计巧妙运用超珠宝级处理技艺和宝石元素,重现珍贵宝石背后的幸运寓意。Reno11 系列全系标配单反级人像摄...
日期:11-24
65英寸电视成第一大尺寸!中国平均尺寸已突破60英寸 你家有多大?
快科技7月31日消息,根据洛图科技(RUNTO)发布的《全球液晶TV面板市场月度追踪》报告,2023年上半年,全球大尺寸液晶电视面板出货116.4M片,同比下降8.6%;出货面积达80.3M平方米,同比微...
日期:07-31
谷歌pixel系列手机「谷歌Pixel9系列真机曝光 8月13日发布」
据传,谷歌将在8月13日推出全新的Pixel9系列手机。这次发布会将包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold等新品。近日,有关Pixel9和Pixel9Pro XL的谍照在网络上曝...
日期:07-14
特斯拉20年来重大转变!马斯克称特斯拉将尝试花钱打广告_特斯拉马斯克shib
5月17日消息,当地时间周二,美国电动汽车制造商特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,鉴于广告能触达更多潜在买家,特斯拉将尝试打广告,但新计划还没有“完全成行”。周二,马...
日期:05-17
俄罗斯版本苹果手机「替代iOS、安卓 俄罗斯自研手机OS系统Aurora:只花了22亿」
全球的手机操作系统中,iOS及安卓两家加起来几乎是垄断性的,第三大手机OS就没啥发展空间,然而俄罗斯Rostelecom公司去年提出要搞自己的手机OS系统Aurora(极光),预计在5年内投入300...
日期:08-15
近十年春节档盘点:沈腾、张小斐成票房最高男女主演_去年沈腾还有什么电影上映
快科技1月26日消息,龙年春节档开启倒计时,现在灯塔专业版盘点了近十年春节档值得关注的数据表现。近年春节档之最”:-上映影片数最多的春节档:2021年苹果最快推出macbook 可能再...
日期:01-26
云南夏黑葡萄甜蜜上市,借力拼多多直销全国_云南夏黑葡萄是转基因吗
春夏交接之际,在云南省红河州建水县一眼望不到头的大棚内,翠绿的葡萄树上已经缀满了一串串个大饱满、颗粒均匀的夏黑葡萄。网页被广告霸屏怎么办夏黑葡萄是由巨峰葡萄和无核白...
日期:04-22
特斯拉的专卖店「京东:特斯拉官方旗舰店上线 全线200款车品入驻京东」
2月14日 消息:京东宣布,特斯拉官方旗舰店正式上线,全线车品同步发售,包括充电产品、优选配件、精选服饰和周边精品等200余种产品。谷歌和苹果谁有钱海信电视选购微软xbox游戏展...
日期:02-15
是一款非常成功的游戏 苹果-CEO 库克,王者荣耀风靡全球
来源:中关村在线近日,苹果公司CEO库克现身成都太古里苹果直营店,期间有众多玩家使用iPhone玩《王者荣耀》,这一场景引起了库克的注意。晚上,他通过微博表达对这款游戏的高度赞扬,...
日期:10-18
共享单车涨价“追”上公交车 还没追上盈利_共享单车涨价
共享单车企业开始了新一轮用户骑行费上调,继年初哈啰骑行卡涨价后,美团骑行卡近日涨幅也达50%。   8月10日23时起,美团单车“骑行畅骑卡”无折扣价向上调整:7天畅骑卡由10元调...
日期:08-18
小米雷军专访视频「雷军:在年度演讲上将公布小米AI新进展」
8月14日 消息:今日,小米创办人雷军在接受《人物》采访时,针对“你怕不怕被AI取代?说不定AI比你干得更好。”的提问,雷军表示,有可能,我也挺期待的,不过呢,这一天可能还需要很漫长的...
日期:08-14
戴尔灵越7000是商务本吗_轻装亦多能,戴尔Lati 7000系列商用笔记本震撼上市
  作为戴尔笔记本家族中的商务代表,戴尔latitude系列一直深受白领和商务人士的喜爱。其中,戴尔Lati 7000系列更凭借旗舰性能和人性化的操作体验,受到商务精英阶层的普遍欢迎...
日期:05-26
回馈“家”人 居然之家21周年“家居周”活动温情上线_居然之家22周年庆
  年中的热播剧《二十不惑》火遍了大江南北,诚然,20岁是个经久不衰的热门话题。如今的居然之家已然跨过20岁这个门槛,踏向“三十而立”。8月15日至23日,居然之家在北京十里河...
日期:07-15
国产游戏《逻辑逃脱》试玩版上线Steam_逻辑推理游戏推荐
独立游戏开发商Nguyen Z近日发布了新作《逻辑逃脱》(Logic Escape)的试玩版本。本作已确认将于11月3日在Steam平台上正式发布。《逻辑逃脱》是一款第一人称解谜游戏,融合了密室...
日期:10-03
2022中国前三季度搜索引擎整体满意度评分出炉 360搜索排名第一_2020年各大搜索引擎占比
  近日,中国互联网络信息中心CNNIC发布第46次中国互联网络发展状况统计报告。报告指出,中国网民的人均周上网时长保持提升势头。截至2020年6月,全网网民人均每周上网时长已...
日期:07-10
对标苹果华为!曝三星Galaxy S23系列可能会获得卫星通信支持
随着苹果正式推出其通过卫星功能进行紧急求救对于iPhone 14,下一个提供卫星通信支持的公司是三星的Galaxy S23系列。这里唯一的区别是,明年我们可能会看到更多功能。苹果没有...
日期:11-26
华为P40可以升级鸿蒙吗「华为P40等15款产品可升级鸿蒙3.0」
中关村在线消息:近日,华为官方公布华为 P40、Mate30等15款产品开放HarmonyOS 3正式版升级,据了解此前发布的HarmonyOS 3系统,对超级终端、鸿蒙智联、万能卡片、流畅服务、隐私安...
日期:11-14
X新车主不再支持Steam游戏 特斯拉通知Model
IT之家 5 月 18 日消息,特斯拉在交付 Model X 汽车时通知车主,新车不再支持 Steam Gaming,意味着玩家不再支持访问 Steam 平台扩展游戏体验。IT之家翻译特斯拉公告内容如下:“特...
日期:05-18
2020 财年 Microsoft 365 收入超 200 亿美元,同比大增 50%_微软财报2020全年
  7月29日消息 外媒Neowin报道,微软上周公布了 2020 财年第四季度财报,以上一季度 380 亿美元收入完成了本财年的任务。强劲的收益部分得益于 Windows、游戏和 Surface 硬...
日期:07-14