您的位置:首页 > 互联网

Llama-3不算真开源:今年10月,权威定义就要来了

发布时间:2024-08-29 12:28:35  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心,作者:机器之心,授权转载发布。

你给翻译翻译,什么是开源?

开源大模型的标杆 Llama3,居然都被闭源了。今天,开源再次成为了人们讨论的话题。

如今,开源的人工智能算法无处不在,从个人开发者到大型科技公司,大家都在享受最新技术带来的成果。

徕卡sl 2470mm f2镜头

就连目前最热门的大模型领域,也区分了开源和闭源两个互相竞争的大方向。人们认为,随着开源技术的扩散与交流,开源的大模型最终将赶上 OpenAI 这样的业界顶尖水平。这或许就是扎克伯格等人理想中的繁盛景象。

不过,在层出不穷的新 AI 模型评论区里,我们也经常看到有人吐槽连权重、数据都没有,这算什么开源?

这个时候,一家有影响力的机构终于决定站出来,对开源这件事下一个定义了。

今年10月,真开源定义就要来了

开放源代码促进会(OSI)最近公布了其对开源 AI的最新定义草案。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中,经常出现的模糊用法。

这个定义似乎来的正是时候。一个月前,大模型领域刚刚经历过一轮开源技术更新。Meta 发布了迄今为止最强的开源大模型 Llama3.1405B,宣布所有 Llama 版本的总下载量已超过3亿次,创业公司 Mistral 也紧接着宣布开源了 Large2大模型。

这些公司发布的预训练 AI 语言模型带有权重使用限制,同时继续使用了开源标签。这引发了开发者们对 AI 技术背景下什么才是真开源的激烈争论。

保时捷原车导航

因为最近一段时间,开源变得越来越像是一个营销术语,将大模型描述为开源可以让人们对其变得更加信赖,即使研究人员和开发者时常会被这些许可证所限制。

Llama-3.1发布的时候,Yann LeCun 曾宣传了开源的优势。

OSI 给出的定义下,很多事情需要我们来重新审视。例如,Meta 的 Llama3模型虽然可以自由获取,但 Meta 针对使用 Llama 系列模型的公司规模及通过该模型生成的内容类型,设定了特定的许可限制。因此,Llama 不符合 OSI 为软件定义的传统开源标准。

文生图模型 Flux 实际上也不是真正的开源。由于这种模糊性,OSI 通常用开放权重或代码可用等术语来指代那些含有代码或权重限制或缺乏配套训练数据的 AI 模型。

为了正式解决真假开源的问题,一向倡导开源的 OSI 召集了一个专家团队来为开源下定义。这个约70人的团队由研究人员、律师、政策制定者组成,其中还有来自 Meta、Google 和亚马逊等大型科技公司的代表。他们起草的最新草案为判断 AI 模型是否符合开源标准提出了四项基本自由:不限制使用目的,允许深入研究其工作原理,支持随意修改,无论是否进行过修改都允许用户自由分享模型。

这四项基本自由也沿用了人们对开源软件的定义。OSI 希望通过对开源 AI树立明确的标准,方便开发者、研究人员和用户在创建、研究或使用 AI 工具做出更明智的决策。

OSI 执行董事 Stefano Maffulli 在 Linux 基金会 AI_dev 大会上发布了对开源定义的最新版草案

换句话说,开源对于 AI 更加稳定安全:如果 AI 模型做到了真正的开源,研究人员将能分析 AI 模型背后的工作方式,AI 系统的潜在软件漏洞也将更加明显。相较于 OpenAI 的闭源系统 ChatGPT,其确切的架构是一个严格保密的秘密。

据 OSI 的项目时间表显示,他们预计在2024年10月在 All Things Open 会议上正式宣布开源 AI定义的最终版。

那么在这个定义下,有哪些大模型是开源的呢?据说在第一批名单里包括 EleutherAI 的 Pythia、Ai2的 OLMo 和开源集体 LLM360等。

创新不应该需要许可

在五月份的新闻发布会上,OSI 强调了为真正的开源AI 厘清定义的重要性。AI 与常规软件不同,需要迫使所有利益相关者重新审视开源原则对该领域的适用性,OSI 的执行董事 Stefano Maffulli 说,OSI 相信每个人都应保有对技术的主导权和控制权。我们还认识到,当定义明确后,它将推动 AI 系统更加透明、更紧密的协作和无需许可的创新,市场就会繁荣发展。

OSI 的最新草案不止要求开源模型本身及其权重,还要求对整个系统更加广义的开放。 一个 AI 系统要想被认定为开源,必须提供 OSI 定义的适合修改的形式,其中包括训练数据的详细信息、用于训练和运行系统的全部源代码,以及模型权重和参数。这些都必须在 OSI 认可的许可证或条款下提供。

值得注意的是,这份草案并没有强制要求公开原始训练数据。相反,它要求提供关于训练数据和方法的详细元数据。比如数据的来源、选择标准、预处理技术以及其他相关细节,方便研究者重建类似的系统。

这种方法旨在不公开实际数据集的情况下提供透明度和可复制性,在坚持开源原则的同时,从表面上解决了潜在的隐私和版权问题。不过是否能达成预计的效果,可能还有待进一步讨论。

训练数据的来源缺乏透明度,已经导致了一系列针对大型 AI 公司的诉讼。从 OpenAI 这样的业内带头人到 Suno 这样的小应用,这些公司的生成式 AI 产品除了声称包含可公开访问的信息外,并未披露太多有关其训练集的信息。很多人呼吁开源模型应该披露所有训练集,不过由于版权和数据所有权等问题,这一标准很难执行。

mao机器人

这个定义最有趣的是,他们允许不公开训练数据,独立 AI 研究员 Simon Willison 在接受外媒 Ars Technica 采访时说道:这是一个非常务实的方法 —— 如果不允许这样,那就几乎就没有模型算『开源』了。

OSI 想明确开源的定义,这个想法可以追溯到2022年,当时它首次开始联系有关组织,邀请他们一起来定义这个术语。

经过近两年,我们从世界各地征求意见,来确定适合 AI 系统的开源原则,OSI 现在正在全球巡讲,希望能够完善并验证草案中的定义,Maffulli 表示,定义『开源』的研讨会仍在进行,现在参与还不晚,可以通过 OSI 网站找到论坛,发表评论建言献策。

当最终定义在10月揭晓时,新的开源AI 定义可能对行业产生深远影响。它将影响公司以何种形式发布 AI 模型,并塑造未来的法规,例如加州备受争议的 SB-1047法案。

希望新的定义,能够进一步推动大模型领域的技术创新。


返回网站首页

本文评论
出海热潮下,聚焦陌生人社交行业众生相
  社交始终是互联网时代绕不开的话题,在中国,看似大好前程的陌生人社交市场,也因政策收紧和产品快速的推陈出新导致行业竞争激烈,国内社交软件的触角开始纷纷拓展至海外...
日期:07-14
HPE与Pensando携手合作,开创边缘服务模式新突破
  近日,HPE宣布向Pensando Systems公司投资,合作开发解决方案。通过此次合作,HPE与Pensando为整个业界开创了服务新模式:网络、存储和安全服务不再需要在数据中心与边缘之间...
日期:08-16
ChatGPT再升级:终于可浏览互联网 不再局限于两年前旧数据_chatch it
9月28日消息,据外媒报道,当地时间周三,美国人工智能研究公司OpenAI宣布了其AI聊天机器人工具ChatGPT的另一项更新,那就是它可以浏览互联网,并使用最新数据生成结果,而不再局限于20...
日期:09-28
土豆上市4天股价削二成  或影响同行上市路(土豆上市了吗)
8月22日,刚刚在纳斯达克上市的土豆网终于结束了连续3个交易日的暴跌,以10.76%的涨幅收在21.31美元,与29美元的发行价相比,还有26.5%的折让。 不过,这种反弹与日前的传闻是否有关...
日期:07-22
揭秘国货品牌Funny Elves品牌崛起之路「funnyelves是哪个国家的品牌」
近几年,各大美妆品牌开始针对亚洲人的肤色来生产多样化的化妆品,比如底妆产品。美妆行业逐步推出针对更多女性底妆的商品,品牌在竞争中也比过去任何时候都更加需要研发、技术创...
日期:06-16
京东公布春晚大奖清单:扬州豪宅一年使用权、100辆岚图汽车等_2021京东618晚会在哪里举办?
快科技2月6日消息,作为2024年总台春晚独家互动合作伙伴,京东让网友在看表演的同时,还能参与多重抽奖活动;iphone如何打开计步器京东今年准备的奖品也是相当豪横,包括扬州独栋豪宅...
日期:02-06
元宇宙大会探路产业前景数字人应用场景或先落地_世界互联网大会 元宇宙
来源:上海证券报   ◎王墨璞嘉 记者 罗茂林   8月18日,2022全球元宇宙大会在上海召开。大会探索元宇宙产业落地的高效路径,致力协助构建城市级、国家级、世界级元宇宙产业...
日期:08-20
苹果MR头显广受追捧 京东618携钜惠福利打造虚拟设备好物“专场”_iphone mr开头
备受瞩目的苹果 2023 年全球开发者大会(WWDC23)在北京时间 6 月 6 日凌晨一点成功举办,并在会上发布了首 款全新硬件MR(混合现实)头显Apple Vision Pro。搭载了苹果公司首 款3D摄...
日期:06-06
空气源热泵采暖专家告诉您,新兴清洁能源如何助力花卉大棚养殖发展
  社会经济快速发展,人们生活水平也便日益提高,花卉大棚养殖规模逐年呈递增趋势。但在国家绿色发展规划的推行中,粗放型养殖逐渐被限制与淘汰,绿色化、集成化发展大势所趋。...
日期:10-17
字节跳动开发者平台「传字节跳动秘密利用OpenAI技术打造自家大模型」
12月16日消息,据外媒theverge报道,字节跳动正在秘密使用OpenAI的技术开发自己的大语言模型(LLM)。比亚迪十月销量出炉文章称TikTok的推荐机制让字节跳动成为全球人工智能领域的...
日期:12-16
钉钉(中国)信息技术有限公司「原钉钉副总裁成立Al应用开发平台BetterYeah AI 已获亿元融资」
1月3日 消息:据36氪消息,斑头雁智能科技是一家人工智能公司,由原钉钉副总裁张毅(花名陶钧)创立。天玑1000plus765G该公司最近完成了近千万美元的 A 轮融资,用于开发企业级 AI Age...
日期:01-03
极光携手腾讯云,共建开放多元的移动开发者生态(极光云互动)
  8月15日,国内领先的移动开发者服务提供商极光 (Aurora Mobile, NASDAQ:JG)与腾讯云展开业务合作,双方将发挥各自在移动端和云计算领域的领先优势,为开发者提供更高效,...
日期:12-02
AMD 32核线程撕裂者3970X液氮超频至5.75 GHz(amd线程撕裂者3995wx)
  11月28日消息 根据TPU的报道,超频高手TSAIK成功将。   据介绍,TSAIK在1.1 V的核心电压设定下,将线程撕裂者3970X液氮超频至5.75 GHz,比3970X的3.70 GHz的主频多出了55%...
日期:07-04
“暴利”床垫,收割“汪小菲们”的钱包
声明:本文来自于微信公众号开菠萝财经(kaiboluocaijing),作者 | 苏琦 编辑 | 金玙璠,授权转载发布。一夜之间,全网都在好奇,什么床垫能值200万,还能抢世界杯的热度?随着汪小菲和大S...
日期:11-29
iPhone 16最新高清渲染图曝光:新外观华为、荣耀既视感_水样便是拉肚子吗
快科技4月8日消息,今天iPhone 16的最新高清渲染图被曝光出来,展示了新款的外观设计。新机虽然依旧是双摄,但排列方式却更换为竖排,重回iPhone X时代。据爆料,这么做是为了实现空...
日期:04-08
新突破!亚信科技将与通号、中铁一局联合打造西南最大高铁智慧枢纽
新突破!亚信科技将与通号、中铁一局联合打造西南最大高铁智慧枢纽 通信产业网|2023-06-09 15:43:21作者:通文来源:通信产业网【通信产业网讯】日前,重庆东站配套综合交通枢纽工...
日期:06-09
虎牙第二季度营收22.8亿元 Non-GAAP净利润590万元_虎牙2019年营收和利润是多少
鹿客智能门锁反锁共享汽车盈利吗 查看最新行情      讯 北京时间8月16日下午消息,虎牙直播(NYSE:HUYA)今日公布了截至6月30日的2022年第二季度财报。财...
日期:08-17
李飞飞团队推手部动捕系统DexCap 泡茶剪纸轻松完成
要点:李飞飞团队开发了成本仅3600美元的便携式手部动捕系统DexCap,能让机器人完成各种花样任务。DexCap系统利用SLAM、电磁场和3D观察实时追踪手部运动,配合新算法DEXIL,实现了...
日期:03-15
传搜狐爱家团解散 官方称仅限于业务调整
  今日有传闻称,搜狐旗下团购频道搜狐爱家团即将解散。搜狐焦点网副总经理曾伏虎在接受TechWeb连线时表示,近期搜狐团购业务确实会在内部运营及架构上有所调整,但“爱家团不...
日期:07-27
iPhone 14 Plus免税版开卖:能便宜289元_iphone13免税后多少钱
今年苹果发布了4款iPhone 14系列手机,取消了mini型号,新增了iPhone 14 Plus这一型号,也是最晚开卖的系列,昨天才上市首销,售价6999元起,现在海南免税店版的iPhone 14 Plus也开卖了...
日期:10-21