您的位置:首页 > 互联网

Meta推出Llama 2,大模型赛道要因开源乱起来了「meta模组」

发布时间:2023-07-22 11:20:22  来源:互联网     背景:

声明:本文来自于微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。

最近这段时间,Meta可谓是成为了海外互联网行业的焦点,其创始人扎克伯格一边与马斯克约架,一边仅用5天收获上亿用户的Threads成功奇袭了推特。近日,此前本来在AI大模型战局中扮演小透明角色的Meta,突然又搞出了一件大事。

就在北京时间7月19日,Meta方面在微软的Inspire合作伙伴大会上宣布,将与包括微软在内的主要云计算服务提供商合作,推出新一代开源大模型Llama2,并将该模型免费开放给商业和研究机构使用。

meta模板

根据Meta方面的说法,在这一项目中,他们承担了大模型训练的成本,而包括微软、亚马逊在内的云计算服务提供商将托管这款大模型,并提供运行其所需的算力。对此,Meta生成式AI事业群副总裁Ahmad Al Dahle表示,Meta方面之所以迅速推出Llama2,是因为前代产品Llama的受欢迎程度出乎预料,他们收到了超过10万个关于Llama的申请。

彼时Meta给Llama的身份是开源研究工具,只提供非商业化机构使用,如果不是这款大模型意外在4chan上泄露,很有可能就默默无闻了。如今回过头来看,Llama的泄露很有可能是Meta有意而为之,并借此来试探社区对于开源大模型的态度,而在得到了社区身体力行的支持后,Llama2也就很快诞生了。

model based meta analysis

值得一提的是,Llama2并不是Meta的赶工之作,如果他们没有弄虚作假的话,其本身的性能就相当出世。根据Meta方面公布的数据显示,Llama2相较于上一代训练数据提升了40%,上下文长度也翻倍,并采用了分组查询注意力机制。在官方给出的测试结果中表明,Llama2在mmlu、agieval等多个权威大模型评测基准中,关于推理、编码、知识测试等方面的表现都优于其他开源模型,甚至在某些场景下有着接近GPT-3.5的水准。

不过性能或许并非外界对于Llama2的到来感到欢欣鼓舞的关键,Meta决定其可免费用于商业用途,无疑才是大家喜出望外的原因。为了实现可控的商业化,Meta方面已经组织自己的员工和第三方围绕Llama2进行了Red Team测试,避免该模型产出有害内容,并为开发者制定了使用指南和守则。

m2模型官网

事实上,Meta的Llama系列大受业界欢迎的原因很简单,因为这是一个少有的开源AI大模型。但受到开源协议的限制,基于该模型衍生的产品都无法商业化,直到Llama2的出现给了整个业界一个“站在巨人肩膀上”的机会。

至于说为何Meta会选择开源Llama2,而不是像OpenAI的ChatGPT、谷歌的Bard一般敝帚自珍,扎克伯格是这样说的,“Meta有着悠久的开源历史,开源推动创新,它让更多开发者能够使用新技术进行开发,同时提高了技术的安全性。我们相信如果生态系统更开放将带来更多进步,这就是我们开源Llama2的原因。”

virt a mate模型

以太坊最新深度大胆预测

要知道截至目前为止,无论海外市场的OpenAI、微软、谷歌,还是国内的百度、阿里、360,在AI大模型领域都采用的是“闭门造车”的策略。这也是为什么大模型到底是不是创业的机会,会在创业者和投资人之间产生分歧的关键。

事实上,大语言模型是“力大砖飞”的结果,在OpenAI的ChatGPT一鸣惊人之前,业界更青睐的是谷歌的Transformer模型,追求的是如何设计出更小、更快,但更准确的神经网络。而ChatGPT的成功,就成功在它提出了一个新的思路,那就是加大参数、加高算力的大模型也是一条路,并且真的让其产生了智能。

m2模型官网

但问题在于,如果单纯从技术层面出发,大模型的技术壁垒并非深不可测,否则即便OpenAI对自己基于人类反馈的强化学习(RLHF)技术秘而不宣,也没能阻挡不了百度的文心一言、阿里的通义千问、谷歌的Bard等一众大模型的出现。甚至在很短的时间里,国内市场的“百模大战”就正式开打,这也代表着这个领域的先发优势可能几乎不值一提。

只可惜,大模型的技术壁垒不高或许仅仅是针对大型互联网厂商适配,但对于创业者而言,需要高算力、大数据和强算法,并且消耗海量资源的搭建通用大模型几乎只能是巨头们的游戏,大多数创业者有心无力。如果没有Meta开源的Llama,创业者就只能加入OpenAI的生态,并使用后者的付费API来打造自己的产品,这就等于是要依附于OpenAI。所以一旦有的选,大家显然并不希望将身家性命交付他人之手。

而Meta此前泄露的LLama给了资源有限的创业者施展拳脚的舞台,基于LLama模型以及LoRA训练技术,开源社区也打造出了ChatLLaMa、Koala等模型。利用社区的力量群策群力最终实现极低成本下的高速迭代,这就是开源大模型的优势。就像有谷歌员工坦言的那般,“如果存在一个没有使用限制的免费高质量替代品,谁又还会为带有使用限制的产品买单呢?”

以闭源自研产品为核心,用API或插件的形式向开发者赋能,这是OpenAI、百度的道路,也是当年苹果在iOS上所采取的策略,但入局大模型领域慢人一步的Meta已经失去了先机,因此选择开源就是试图复刻Android当年的成功路径,用开放来吸引更多人来共建生态。以史为鉴,可知兴替,这点几乎放之四海而皆准。


返回网站首页

本文评论
苏宁大数据显示:激光电视是好评率超99%现象级产品
  “‘超大屏’、‘性价比’、‘健康护眼’是消费者评价激光电视的关键词。”在上周举办的首届全球激光显示技术和产业发展论坛上,苏宁易购副总裁范志军表示,“海信激光电...
日期:10-04
智慧图科技华东总部落户昆山,打造元宇宙小镇!全面推进元宇宙产业创新发展!
1 月 10 日上午,智慧图科技华东总部签约仪式在昆山宾馆举行,昆山旅游度假区管委会与北京智慧图科技有限责任公司签订项目投资协议,标志着智慧图科技华东总部项目正式落地,将全面...
日期:01-19
坚果投影发布致智能投影行业的公开信 呼吁良性竞争_网易订阅「坚果投影是哪个公司的」
  【宅秘新闻】近日,坚果投影官方发布了《致智能投影行业的一封公开信》,呼吁每一位同行者,为中国智能投影行业共尽一份力。  在公开信中,坚果投影表示,坚果倡导共创三色激光...
日期:06-11
苹果要启动大规模换屏_苹果换屏要拆机吗
  (原标题:苹果要启动大规模换屏:iPad酝酿多年的升级来了)   iPhone 12系列已经全系用上OLED显示屏,最新消息称,预计2022年开始,苹果iPad、Mac产品线也将开始OLED化之旅。...
日期:07-16
快播创始人王欣已成立人工智能和区块链公司_快播创始人王欣:区块链产品“灵鸽”预计年底上线
《快播创始人王欣:区块链产品“灵鸽”预计年底上线》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成...
日期:08-07
郑纬民院士:算力联网形成统一调度是大势所趋
通信世界网消息(CWW)“算力是数字经济的底座,和高铁、5G一样会拉动国民经济。”中国工程院院士、清华大学计算机科学与技术系教授郑纬民在7月2日,出席中国绿色算力大会时讲道。...
日期:07-02
需求不足 消息称特斯拉上海工厂将主动减产20%_特斯拉上海工厂量产了吗
图注:特斯拉上海工厂iphone12pro max增加了什么misfitshine2使用说明小米civi前置柔光灯怎么开凤凰网科技讯 北京时间12月5日消息,知情人士称,特斯拉公司计划降低其上海工厂的...
日期:12-08
机构预计特斯拉9月份在美国将交付近4.3万辆电动汽车 同比大增「特斯拉美国占比」
9月30日消息,据国外媒体报道,9月份及三季度都已只剩下最后一天,电动汽车厂商特斯拉这一季度的产量和交付量也备受关注,外媒称多位分析师预计特斯拉在三季度,将向用户交付35-37万...
日期:10-01
微星将在下周推出泰坦GT77 HX 13V:首款配备4K@144Hz Mini LED的笔记本
微星宣布,新一代的泰坦GT77 HX 13V将成为首款配备4K@144Hz Mini LED显示屏的笔记本电脑,相比上一代的4K@120Hz面板更进一步,这是迄今最强的笔记本电脑显示屏。新产品将会在下周...
日期:12-29
乐森机器人推出新品「精英版」乐森擎天柱,带来小型人形双足机器人最新研发成果
北京时间 2023 年 1 月 13 日上午 10 点,国内消费级机器人厂商「Robosen乐森机器人」于大中华区正式上线新品「乐森擎天柱 精英版」,这也是该款产品于 2022 年 10 月上线美洲...
日期:01-13
95%用户是机器人,这家公司宣布关闭,软银等曾投资2亿美元_软银pepper机器人程序
6月24日消息,即时通讯应用IRL发言人周五表示,董事会调查显示,公司用户中有95%是“机器人”。基于这个调查结果,公司将关闭,并将资本返还给股东。opporeno十倍变焦版支持65w快充吗...
日期:06-24
压缩软件进化论:从诞生说起
  回顾到DOS年代的时候,1984年的个人计算机标配是容量360kB 的 5.25 寸软盘。计算机存储介质容量之微小价格之昂贵和今时今日完全不能同日而语。当时,数据如果能进行压缩之...
日期:07-27
索尼和三星技术实力「MR热潮推动下,三星、LG、索尼争夺Micro OLED开发」
据Business Korea报道,三星、LG 和索尼之间在OLED开发方面的竞争正在加剧。随着苹果公司采用Micro OLED来显示其混合现实(MR)头显,预计相关市场将快速增长。pc行业竞争格局银...
日期:07-11
iPad 2发布仍然神秘 锁定2、3月份发布_ipad2官网下架时间
  如果传言属实,苹果公司为下一代iPad举办的大型发布会可能不会太大张旗鼓了。苹果可能将计划于2月份或3月份举行一次“小规模活动”来发布iPad 2。   苹果在举行及其奢...
日期:07-26
淘宝直播发布《商家成长经营指南》「淘宝店铺直播运营」
9月30日消息,淘宝直播依托今年宝藏好店主打的“五力模型”推出《商家成长经营指南》,旨在帮助不同层级的商家成功打通成长力、货品力、内容力、流量力、粉丝力五大方面中的“...
日期:10-06
豆瓣跌至3.9分!《三体》动画停播两周后复播 第12集上线「三体动画上映」
改编自作家刘慈欣的系列同名长篇科幻小说,由艺画开天联合出品承制的《三体》动画,在停播两周后正式复播,最新第12集已在B站上线。截稿前,《三体》动画豆瓣评分为3.9,超15万豆瓣用...
日期:03-05
惠普发布 Elite x2 G8 平板:13 英寸 3K 屏,内置追踪器不怕丢(惠普elite x2 g4)
  1 月 11 日消息 根据外媒 Notebookcheck 的消息,惠普今天发布了 Elite x2 G8 平板,搭载了英特尔 11 代酷睿和 13 英寸屏。   惠普Elite x2 G8 平板可选英特尔第 11 代...
日期:06-26
微信键盘0.9.7内测版新增实用功能:悬浮键盘功能终于来了_微信键盘内测下载
近日,微信发布了微信键盘安卓版的内测版更新,版本号为0.9.7.8109,更新包122MB。在此次更新中,微信键盘终于加入了悬浮键盘这一实用功能,在横屏等情况下输入内容的便捷性获得了有...
日期:12-01
iPhone14还没捂热,15系列三大升级曝光,值得再等一年_新买的iPhone12发热
从9月16日iPhone14首销到今天,不少用户都已经用上了机器,随之而来的是对灵动岛设计的吐槽,对手机发热量大的质疑等。而当很多人还没捂热iPhone14的时候,网上又传来了iPhone15系...
日期:09-29
带状144骨架光缆线序「总预算9101.9万!中国移动启动骨架式带状光缆产品集采」
2023/5/26 09:21 总预算9101.9万!中国移动启动骨架式带状光缆产品集采  焦焦 C114讯 5月26日消息(焦焦)从中国移动官网获悉,中国移动日前发布招标公告称,启动2023年至2024年...
日期:05-26