您的位置:首页 > 互联网

我们为最“in”大模型,找到了另外一条解题思路

发布时间:2023-08-19 18:33:59  来源:互联网     背景:

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

“in”,是近年来兴起的一个网络用语,通常是in fashion的简称,意指走在潮流最前沿。

随着GPT的爆火,生成式AI正式进入全球科技舞台的中央,大模型也已经成为当下最“in”的话题。

用“百模大战”来形容当下大模型的火热程度一点也不夸张。据目前市场已公布的大模型产品来看,10亿参数规模以上的大模型产品已多达80个。

一些企业更是将大模型视为人工智能的核心,认为这很可能是引领第四次工业革命的颠覆性创新技术,将推动各个行业的变革。

不过大模型已不再是你以为的“大力出奇迹”,它的发展正在迎来一些微妙的变化——

济南房产在线网

Smaller is Better。

这并非是无中生有,此话正是出自HuggingFace首席布道师Julien Simon。

但纵观大模型(尤其是大语言模型,以下简称为:LLM)的发展,参数体量逐渐庞大似乎成为了一种大趋势,动辄便是千亿甚至万亿的量级:



△图源:Information is Beautiful(数据截至2023年7月27日)

那么Simon如此“背道而驰”的观点,又是从何而来?

我们都知道模型的参数体量越大,它们从大量非结构化数据中学习的表现通常就会越出众,但随之而来的一个老大难问题便是需要大量的计算能力。

这也就是为什么现在人们谈及大模型时,往往都绕不开“大算力”的原因。

(甚至连OpenAI的CEO也在为算力发愁……)



因此,Simon给出了新的解法,让大模型“瘦身”(Smaller)的同时还能提高效率(Better)。

oppo find x 5pro vs 小米12pro

并且这并非空口无凭,有测试数据为证:



从结果上来看,测试的各种大模型有的被“瘦身”到了先前的一半,但效率反倒提了上来。

更直观一点的,我们可以看下文本回答的效果:



△大模型“瘦身”后自然语言对话效果

这便是当下大模型很“in”的一种打开方式。

站在现在这个时间节点,我们也想以《最“in”大模型》专栏的形式,提供给大家两个更in的解题思路:inside intel和in practice。以此来对大模型这个科技圈最in的顶流做一次全新角度的解析和展望。

最Inside Intel的创新解决方案

不仅仅是在这一波大模型热潮,自深度学习爆火以来,似乎GPU相比其它硬件来说更受AI圈的青睐。

究其原因,无外乎以下几点:

  • 并行计算能力:GPU可以同时进行大模型训练和推理,加速计算过程。
  • 加速训练速度:在传统CPU上进行大型模型训练非常耗时,使用GPU可以缩短训练时间,加速模型研究和开发。
  • 适应深度学习计算:GPU高度并行的架构在深度学习的计算中表现出色,特别适合处理神经网络的计算需求。

但开发人员往往会小瞧CPU这个“潜力股”。

没错,让大模型发展发生微妙变化的解法之一,正是CPU!

例如在上文Simon的例子中,他先是用SmoothQuant这种训练后量化的方法来为LLM“瘦身”:将LLM通常进行训练的16位浮点参数(又名 FP16/BF16)替换为8位整数,以便更容易执行任务,和减少需要的内存。



而后Simon选择实验的CPU,正是英特尔的第四代至强®️ 可扩展处理器,其可在AI推理方面,为大模型的落地部署提供更易获取、应用门槛更低和性价比更高的平台。

但是,如果你还以为英特尔只有CPU能来跑AI的话,那就又错了。

就在上个月,英特尔新鲜出炉了AI专用加速器——Habana®️ Gaudi®️2,专为训练LLM而构建,并为数据中心大规模扩展而设计,同时为深度学习推理和训练工作负载提供更具性价比的解决方案。

重点来了!

在MLPerf最新报告中的多种训练和推理基准测试中,与其他面向大规模生成式AI和LLM的产品相比,Gaudi®️2拥有卓越的性能,甚至可以表现得比GPU更“专业”。

据悉,预计今年9月Gaudi®️2便可支持FP8,在帮助用户提升运营效率的同时,即将迎来更优的性价比:



客观地说,相较于主流大模型硬件平台,CPU虽更容易被获取和部署,但其提供的解法仍会更倾向于那些要求部署和应用门槛尽可能低,同时性价比较高的推理场景;但英特尔已发布的Gaudi®️2和即将登场的其他加速芯片,例如数据中心GPU,则有望实现进一步的补全,进而形成CPU可在主打通用计算时兼顾AI加速,GPU提供通用加速支持,即兼顾科学计算和AI加速,而Gaudi®️ 则能一心一意专攻深度学习加速的一整套异构硬件产品布局,这种布局的意义,就在于会提供更加多样化、更具性价比的解决方案。

就更别提英特尔还会为多种异构硬件产品搭配可以进行统一编程、轻松迁移并能跨异构调度算力资源的oneAPI软件工具包了。

英特尔未来在AI或整个企业计算领域的异构多芯布局,已经在脚踏实地地走向现实。其对CPU和AI加速器等硬件的定向优化,也让大模型出现了更多的可能性。

最in practice的落地实战指南

当然,事实上相比于现有的主流大模型硬件平台,大家对英特尔硬件在大模型上的优化还缺乏了解。本期专栏就将直接上干货,为你手把手带来最in practice的实战指南。

如上文中提到的利用第四代至强®️ 可扩展处理器对LLM进行训练后量化的实验,在本期专栏的第一篇文章中,甚至还直接附上了代码:

360儿童卫士2还能用吗



△启用增强型 SmoothQuant 的样例代码

是不是有一种“开箱即用”的味道了?

同时,本期专栏也非常与时俱进地会以ChatGLM、BLOOMZ、PyTorch minGPT主流大模型为案例,step by step教你实战优化之道。

当然,面对实践中可能会涉及的更加复杂的问题,我们也不仅局限于提供硬件加速指南,而是会考虑到更多维度,例如LLM如何与大数据平台进行对接,以及如何更好地进行数据安全或隐私方面的保护。

例如系列第二篇文章中提到的:将至强CPU平台内置的可信执行环境(Trusted Execution Environment,TEE)类技术——SGX用于为LLM提供隐私和数据保护创新解决方案,就可以更好地保障数据在LLM模型训练和推理过程中的保密性。

最后一点,就像我们前文提到的,英特尔加速AI已经不再只有CPU这一个选项,所以Gaudi®️2虽然刚发布不久,但在本次专栏中也会露面,而且同样是落在实战层面,敬请期待。

专栏中涉及CPU的实战分享,更多是希望帮到真正要在业务中落地应用LLM的最终用户,毕竟想要在更为广泛的行业中普及AI应用,如能充分利用部署更为广泛的、基于CPU的IT基础设施和架构,是更有利于达成降本增效的目标的。

期待这些分享能帮助更多部署了英特尔®️平台、对LLM跃跃欲试的用户,能在第一时间开展相关的探索和实践,让大模型Go to vertical + in practice。

小结

基于行业观察、实战案例,我们也会从中迸发出更多大模型加速的灵感。

如大模型“瘦身”提高效率,定然还会有更多更加优化的解决方案。英特尔为此专门开设了GitHub问题反馈,希望与您共同探讨优化之道:https://github.com/intel/neural-compressor/issues



总而言之,英特尔采用多种处理器和加速器,并配以统一且易用的软件工具来实现优化,已然是为大模型的发展开辟了一条崭新的路径。

这背后的意义,正如HuggingFace的Simon所述:

一家独大,从来不是一件好事。

言外之意很明显了:多元化的蓬勃发展才是长久之道。

本次的《最“in”大模型》专栏,也许仅仅是一个通向多元化未来的开始。

欢迎关注专栏,也非常期待可以和大家深入探讨一波。


返回网站首页

本文评论
大疆创新发布高帧率热成像相机禅思Zenmuse XT S_大疆高光谱相机
  全球领先无人机系统及解决方案提供商DJI大疆创新,今天推出禅思 Zenmuse XT S热成像云台相机。这是一款具备高灵敏度与高分辨率、细腻成像的红外热成像传感器,为消防、搜...
日期:08-13
京东手机端对比_手机线上市场格局稳定:京东遥遥领先,超过其他平台总和
  2020年进入下半年,手机市场的复苏态势仍在继续。特别是在线上市场,在以京东为代表的电商平台带动下,市场规模同样急剧扩张,带动手机行业进一步回暖。   今年5月,国内手机...
日期:07-14
雅虎出售传闻满天飞 巴茨被炒引发高层地震
  一份来自ipad的邮件揭开了雅虎这场高层地震的序幕。上周,被誉为“硅谷铁娘子”的雅虎前CEO卡罗尔·巴茨突然向全体员工发送邮件,称自己已被雅虎董事会解雇。随后,雅虎公司...
日期:07-22
红米K60硬件配置曝光,标配30W无线快充「红米k40支持67w充电吗」
中关村在线消息:10月8日,据相关爆料,即将在明年第一季度发布的红米K60系列详细参数已经曝光,新机共将为大家带来两款产品,一款为标准版一款为超大杯,二者均搭载骁龙8+处理器,但在续...
日期:10-09
京东当当“被”推广 木马劫持网购用户为佣金
  1月12日消息,金山网络安全中心截获一款名为“麻雀”的木马,该木马借助一款小游戏“台湾麻将”传播。当用户准备访问淘宝、当当、京东等网购商城时,木马程序会将用户劫持至...
日期:07-25
华为Mate X3折叠屏手机获推系统更新:息屏显示加入全天开启选项
IT之家6 月 8 日消息,华为向华为 Mate X3 折叠屏手机推送系统更新,版本号 3.1.0.161(C00E160R4P4log),具体更新内容如下:稳定性:解决了部分系统稳定性问题熄屏显示:熄屏显示增加全天...
日期:06-09
双节假期共6.37亿人次出游 “国内游”搜索同比涨4149%(“五一”假期国内旅游出游2.3亿人次)
10月9日消息,根据文化和旅游部数据中心统计,国庆中秋8天长假,全国共接待国内游客6.37亿人次,实现国内旅游收入4665.6亿元。10月1日至8日,全国铁路、公路、水路、民航日均发送旅客...
日期:08-01
马斯克的ai技术「马斯克谈新AI公司竞争:对防止一家独大很有意义」
特斯拉首席执行官埃隆·马斯克(Elon Musk)上周公布了自己的AI公司xAI,并表示该公司的目标是“理解宇宙的真实本质”。淘特推广佣金制度上周五在Twitter Spaces的节目中,马斯克表...
日期:07-18
诺基亚中国副总裁_诺基亚前高管获AOL任命担任高级副总裁
  北京时间1月28日消息,AOL今天任命诺基亚前高管迈克尔·马诺斯(Michael Manos)为高级副总裁,负责技术部门的日常运营,直接向该公司CTO亚历克斯·古纳里斯(Alex Gounares,)汇报。...
日期:07-26
张朝阳称大模型国内炒得过热:搜狐仍在观望_张朝阳长什么样
快科技5月18日消息,在搜狐科技峰会上,搜狐董事局主席兼CEO张朝阳在接受媒体采访时谈及了对大模型的看法,并表示搜狐现在没有去做大模型,目前还在观望。thinkpad x1 fold折叠屏幕...
日期:05-18
腾讯控股回购股份后的处理方式「腾讯控股今日回购110万股」
  财联社8月30日电,腾讯控股公告,于8月30日回购110万股,回购价格为315-323港元,共耗资约3.52亿港元。ios去内置广告iPhone14配色家用绞肉机哪个品牌好选择凯琴家用电动绞肉机...
日期:09-04
有人竟在Reddit上出售AI生成的裸照
4月12日 消息:人们开始使用人工智能软件生成虚构人物的露骨图片,而这已经成为部分人的赚钱手段”。尽管深度伪造色情图片长期以来一直是成人产业的一个问题,但最近人工智能图...
日期:04-12
恒大汽车回应「恒大汽车达成复牌指引 恢复买卖」
7月28日消息,昨晚恒大汽车发布公告称,恒大汽车股份自2022年4月1日上午9时正起暂停买卖。由于公司已达成所有复牌指引,故公司已向联交所申请自2023年7月28日上午9时正起恢复公司...
日期:07-28
华虹半导体2023年第一季度销售收入6.308亿美元 同比上升6.1%「华虹半导体第一季度财报」
2023/5/12 13:05 华虹半导体2023年第一季度销售收入6.308亿美元 同比上升6.1%  颜翊 ...
日期:06-02
LPL春季赛ing,三星玄龙骑士陪你整装待发
  2021年1月9日,LPL春季赛如约开战,作为2020年春季赛冠军的JDG于1月14日迎来BLG的挑战。经过两局的鏖战,凭借Zoom公爵的强势表现2:0轻取BLG,拿下了自己春季赛的首胜,也用一场...
日期:03-09
展现音画质巅峰实力,TCL经评估荣获2020年企业标准“领跑者”!_TCL电视音质
  TCL作为位居彩电品牌排行榜前十名的电视品牌,一直以来,致力于为广大消费者提供高品质的彩电产品和优质的服务。近日,2020年度国家首次对电视机企业进行“领跑者”评比工作...
日期:07-16
东风电动车挑战烈火穿行:通行200米的火焰路 电池无爆炸起火_东风电动车质量怎么样
快科技7月20日消息,东风旗下纯电车风行雷霆”成功完成国内首次公开挑战TOP Grade风行雷霆铠甲电池驭电闯火路”安全测试。有人用支付宝小荷包吗在本次测试中,经历了低温、高压...
日期:07-20
腾讯财报背后的危险信号(财报 腾讯)
  作者/黄青春   当市场以为2022Q1是腾讯(0700.HK)上市以来最差财报(营收停滞、净利润腰斩)时,更浓的悲观情绪弥漫在腾讯2022Q2财报里。   8月17日晚,腾讯发布2022年二季报...
日期:08-20
1个月涨粉160万、多个视频获赞百万,变装赛道又卷出新的爆款达人?
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:小龙果,授权转载发布。“变装+反差”还能玩出新花样?花床单变成复古高定“礼服”、白色蚊帐变成优雅高贵的“婚纱”,就连快递箱...
日期:12-30
小米13系列正式官宣 搭载骁龙8 Gen2
中关村在线消息:今天上午,小米官方宣布小米13系列手机将于12月1日正式发布。同时官方放出了新机的预热图,小米13系列将有直角中框和弧面中框两个版本,徕卡将继续与小米进行合作,...
日期:11-29