您的位置:首页 > 互联网

微软密谋小尺寸AI模型,撇开OpenAI搞起了“B计划”

发布时间:2023-10-07 18:31:57  来源:互联网     背景:

声明:本文来自于微信公众号 三易生活(ID:IT-3eLife),作者:三易菌,授权转载发布。

AI大模型无疑是2023年的关键词,更是各大科技厂商竞逐的热门赛道。然而象征着未来的AI大模型实在太费钱,以至于财大气粗如微软都开始考虑“Plan B”了。近日有爆料信息显示,在微软内部由Peter Lee领导的1500人研究团队中,有一部分人转向研发全新的LLM,它的体积更小、运营成本也低得多。

关于微软的小尺寸AI模型,实际上在3个月前就已经初见端倪。此前在今年6月,微软方面发布了一篇题为《Textbooks Are All You Need》的论文,用规模仅为70亿token的“教科书级别”数据训练了一个13亿参数的模型phi-1,证明高质量的小规模数据一样能够让模型具备良好的性能。并且在phi-1的基础上,此前微软研究院还发布了名为phi-1.5的全新预训练语言模型,可适用于QA问答、聊天格式和代码等场景。

根据微软方面的说法,在测试常识、语言理解和逻辑推理的基准下,phi-1.5的表现超出了相当一部分大模型。phi-1.5在带LM-Eval Harness的GPT4AL跑分套件中,可以媲美Meta旗下拥有70亿参数的开源大模型llama-2,在AGIEval得分上甚至超过了llama-2。

为什么微软要突然做小尺寸的AI模型呢?首要因素被外界认为可能是与OpenAI之间的纠葛。作为OpenAI的“金主”,微软能够在旗下产品中永久使用OpenAI现有知识产权的独家权利,但这也并不代表他们就能控制OpenAI。所以对于微软这样的巨头而言,无论是出于自身战略安全的考量,还是为了在后续与OpenAI的合作关系中占据更有利的地位,开发高质量的LLM都是一个必选项。

当然,目前AI大模型实在太耗能也是关键因素之一。在今年年初的设计自动化大会上,AMD首席技术官Mark Papermaster就展示了一张幻灯片,显示机器学习系统的能耗与全球发电情况的对比。根据国际能源署估计,训练大模型的数据中心变得越来越耗电,其用电量占全球电力消耗的1.5%至2%,大致相当于整个英国的用电量,预计2030年这个比例将上升到4%。

根据Digital Information World发布的相关报告显示,数据中心为训练AI模型产生的能耗将为常规云服务的三倍,到2028年数据中心功耗将接近4250兆瓦、比2023年增加212倍。而OpenAI训练GPT-3的耗电量为1.287吉瓦时,大约相当于120个美国家庭1年的用电量。但这还仅仅只是训练AI模型的前期电耗,仅占模型实际使用时所消耗电力的40%。

事实上,训练AI大模型不仅耗能、还费水。在谷歌方面发布的2023年环境报告中就显示,他们2022年消耗了56亿加仑(约212亿升)的水,相当于37个高尔夫球场,其中52亿加仑用于该公司的数据中心、比2021年增加了20%。

arm芯片市值

罗永浩评价苹果ceo库克

但AI大模型的高能耗是非常正常的,用ARM高级技术总监Ian Bratt的话来说,就是“AI计算需求是没法满足的。网络规模越大、结果就越好,可以解决的问题也越多,电力使用与网络规模成正比。”

有AI从业者表示,在此次疫情前,训练一个Transformer模型所需的能耗在27千瓦时的范围内,但现在Transformer模型的参数从5000万增加到了2亿,能耗也已经超过了50万千瓦时。也就是说,参数的数量增加了四倍,可能耗却增加了超过18000倍。从某种意义上来说,AI大模型带来的种种创新功能,其实都是以处理性能和功耗方面的高昂成本为代价。

更多的电力驱动更多的GPU进行AI训练,又要大量消耗水资源来冷却GPU,这就是问题所在。以至于微软被曝光正在制定一个路线图,希望用小型核反应堆产生的电能来运营数据中心。更何况即便不提ESG(“环境、社会及管治”),单纯从成本层面出发,研究小尺寸模型也是有价值的。

众所周知,搭建了CUDA生态的英伟达是这一轮AI热潮中的最大受益者,更是已经占据了AI芯片市场的70%,如今H100、A100等计算卡更可谓是一卡难求。可现在的情况,是向英伟达购买算力已经成为了一个推高AI厂商成本的重要因素。所以小尺寸模型也就意味着需要的算力资源更少,只需购买更少的GPU就能解决问题。

虽然功能更强的大模型确实很好,但现在大模型的商业化还处于蒙昧状态,唯一赚得盆满钵满的是“买铲子”的英伟达。所以在这样的情况下,微软自然也就有意来改变现状了。

蔚来小鹏汽车股价

哪一款投影仪家用又实惠又好用


返回网站首页

本文评论
全国多地华为门店抢购Mate 60 老外评价绝了「华为mate抢购教程」
华为Mate60系列新机于9月3日在美国主流媒体上正式亮相。这款手机的推出被认为是华为技术能力的新高峰,尽管美国实施了严格的出口管制,旨在阻止中国在芯片技术方面取得突破,但华...
日期:09-04
讯飞翻译笔生词导出_如何快速查生词?讯飞翻译笔让孩子的学习更高效
  前几天我家孩子的期中考试成绩下来了,他考得不错,总分和排名都位居班级前列,我也很替他高兴,不过看到了他的英语成绩之后,我不禁开始担心起来。我家孩子今年初二,其它学科的...
日期:07-16
中美审计监管合作破冰 中概股迎转机「证监会 中美审计」
  备受关注的中概股审计监管问题迈出重要一步。近期,证监会官网显示,证监会、财政部与美国监管机构签署审计监管合作协议,将于近期启动相关合作。对于此次合作的主要内容、意...
日期:08-29
Magi 搜索已暂停服务,提供基于知识图谱的结构化搜索体验
  2 月 20 日消息,据 Magi 搜索官网显示,magi.com 定于 2022 年 2 月 19 日暂停服务。测试,目前该搜索引擎已经无法进行搜索服务,搜索后提示“发生错误,请稍后重试”。   M...
日期:06-15
超光影潜望长焦让所爱跃然眼前 OPPO Reno10 系列6月1日开售_opporeno10倍变焦版售价
5月24日,轻薄人像旗舰OPPO Reno10 系列正式发布,其不仅全系标配长焦镜头,还内置了Find 系列同款的超光影图像引擎以及充足的SoC算力,展现出强大的影像实力,引领移动人像摄影领域...
日期:05-29
激励网络影视产业精耕细作 《网络剧片发行许可证》明起全面发放
  近年来,网络视听行业蓬勃发展,观看网络剧片已经成为人们重要的休闲娱乐方式。从明天起,国家广播电视总局将对网络剧片正式发放行政许可,这也意味着网络剧、网络电影正式拥...
日期:07-18
奢侈品电商第一股寺库人去楼空_寺库奢侈品电商平台
来源:北京商报   寺库的危机正在不断浮出水面。8月16日,北京商报记者探访发现,曾经摆满了奢侈品的寺库大厦如今已空空如也,仅剩5层还有部分工作人员,大厦内还专门设立了消费者...
日期:08-19
特斯拉中国Model Y后轮驱动版交付时间缩短为4至8周_受产能影响,特斯拉更新了Model Y和Model 3的交付时间
讯 8月18日上午消息,据特斯拉中国官网显示,特斯拉Model Y 后轮驱动版预计交付时间已缩短为4-8周,此前预计交付时间为8-12周。 充电会减少手机的寿命吗...
日期:08-20
Whale帷幄发布“搞钱GPT”——Alivia 专为营销打造
4月21日 消息:Whale帷幄发布了国内首个MarketingGPT产品Alivia,它是一个专为Marketing打造的类ChatGPT产品,能够妥妥hold住整个营销运营工作的一整套闭环。iphone se屏幕材质...
日期:04-21
酷狗联合绿联耳机推专属耳机音效 突出耳机降噪功能人声更清晰_酷狗蓝牙耳机推荐
近日,酷狗音乐蝰蛇音效与绿联耳机达成合作,推出T3 蓝牙耳机专属耳机音效、煲机歌单,通过酷狗蝰蛇音效数字音频处理技术,突出耳机本身深度降噪功能的同时,让人声更清晰、细节更丰...
日期:04-17
华为投资8.7亿元成立极目机器公司_华为投资8.7亿元成立极目机器公司了吗
近日,天眼查显示,东莞极目机器有限公司成立,法定代表人、董事长为李建国,注册资本8.7亿元人民币。股东信息显示,该公司由华为技术有限公司全资持股。苏宁super会员领券峰米R1超短...
日期:06-21
微软将为私有云推出服务器操作系统_微软将为私有云推出服务器操作系统英文
  软件供应商微软将正式推出一款名为Windows Server AppFabric的服务器系统,它是一款主要面向私有云计算的系统。   Windows Server AppFabric作为微软日后进军私有云市...
日期:07-29
2020全球移动游戏收入排名_2022年7月全球热门移动游戏收入TOP10 王者荣耀蝉联冠军
谷歌怎么挣钱铁路双十一黄金周运输   Sensor Tower 商店情报数据显示,2022年7月腾讯《王者荣耀》在全球 App Store 和 Google Play 吸金超过2.25亿美元,蝉联全球手游畅销榜...
日期:08-17
联想拯救者电竞手机拍照_联想拯救者电竞手机曝光
  (原标题:不止有骁龙865 :首发90W快充)   4月13日消息,博主@数码闲聊站爆料,联想拯救者电竞手机首发90W快充。   从2019年开始,手机快充进入快车道,快充功率不断在突破,不...
日期:02-25
华为Mate50系列如何跨越山海逆境逢生?, 以磨难淬炼领势而上的钢铁毅力
迄今为止的国产手机系列中,如果说到国内做得最成功的旗舰,华为Mate系列必定榜上有名。今年9月6日发布的华为Mate50系列,则是华为Mate系列问世十周年后的强势回归之作。回顾华为...
日期:09-20
首届大湾区网络安全大会 麒麟软件聚焦教育医疗行业自主安全
4 月 20 日- 21 日,首届大湾区信息网络安全大会成功举办,本届大会由广东省公安厅、广东省卫生健康委员会、广东省教育厅指导,广东省计算机信息网络安全协会主办,麒麟软件等企业...
日期:04-23
lazada官方跨境电商运营全书「阿里旗下电商平台Lazada拟进军欧洲市场 挑战亚马逊」
9月1日消息,在东南亚取得了巨大成功后,阿里巴巴旗下电商平台Lazada正准备进军欧洲市场,挑战亚马逊和德国电商Zalando等欧美竞争对手。Lazada首席执行官董铮在新加坡接受采访时...
日期:09-01
中兴通讯董伟杰:筑基数字底座,FTTR加速新生长「中兴董振江简历」
通信世界网消息(CWW)近年来,我国政府大力推动千兆光网发展,工信部在2021年3月印发的《“双千兆”网络协同发展行动计划(2021—2023年)》中有明确要求,到2023年底,我国千兆光纤网络将...
日期:07-06
2022年国庆档总票房破13亿:《万里归途》档期票房_2021春节档票房破百亿
灯塔专业版数据显示,截至10月6日15时06分,2022国庆档(10月1日-10月7日)总票房(含预售)突破13亿 ,当前档期票房前三影片分别为:百度AI课程1、《万里归途》8.83亿(累计9.40亿);三星s6拍照...
日期:10-15
超越iPhone15的3纳米A17!vivo新机首发最强旗舰芯!
8月一过,即将到来的9月随着苹果iPhone15系列的发布,手机圈也将迎来彻底的洗牌。因为iPhone15系列相当于提前让手机进入了次世代。虽然高通已经加紧脚步,在10月份发布新款旗舰芯...
日期:08-25