您的位置:首页 > 互联网

终端测评「大模型应用新战场:揭秘终端侧AI竞争关键」

发布时间:2024-09-03 00:58:11  来源:互联网     背景:

声明:本文来自于微信公众号 量子位,作者:鱼羊,授权转载发布。

2024年过去2/3,大模型领域的一个共识开始愈加清晰:

AI技术的真正价值在于其普惠性。没有应用,基础模型将无法发挥其价值。

于是乎,回顾这大半年,从互联网大厂到手机厂商,各路人马都在探索AI时代Killer APP的道路上狂奔。这股风潮,也开始在顶级学术会议中显露踪迹。

其中被行业、学术界都投以关注的一个核心问题就是:

在大模型“力大砖飞”的背景之下,AIGC应用要如何在手机等算力有限的终端设备上更丝滑地落地呢?

这段时间以来,ICML(国际机器学习大会)、CVPR(IEEE国际计算机视觉与模式识别会议)等顶会上的最新技术分享和入选论文,正在揭开更多细节。

是时候总结一下了。

AI应用背后,大家都在聚焦哪些研究?

先来看看,AI应用从云端迈向终端,现在进展到何种程度了。

目前,在大模型/AIGC应用方面,众多安卓手机厂商都与高通保持着深度合作。

在CVPR2024等顶会上,高通的技术Demo,吸引了不少眼球。

比如,在安卓手机上,实现多模态大模型(LLaVA)的本地部署:

活体检测公司

△Qualcomm Research发布于YouTube

这是一个70亿参数级别的多模态大模型,支持多种类型的数据输入,包括文本和图像。也支持围绕图像的多轮对话。

就像这样,丢给它一张小狗的照片,它不仅能描述照片信息,还能接着和你聊狗狗适不适合家养之类的话题。

终端测试是啥

△量子位在巴塞罗那MWC高通展台拍摄的官方演示Demo

高通还展示了在安卓手机上运行LoRA的实例。

△Qualcomm Research发布于YouTube

以及音频驱动的3D数字人版AI助手——同样能在断网的情况下本地运行。

Demo原型既出,加之手机厂商们的魔改优化,对于普通用户而言,意味着其中展现的新玩法新可能,在咱们自个儿的终端设备上已经指日可待。

但在顶会上,更加受到关注的是,demo之外,高通的一系列最新论文们,还详细地揭开了应用背后需要重点布局的关键技术。

量化

其中之一,就是量化。

终端测评

在手机等终端设备上部署大模型/AIGC应用,要解决的一大重点是如何实现高效能的推理。

而量化是提高计算性能和内存效率最有效的方法之一。并且高通认为,使用低位数整型精度对高能效推理至关重要。

高通的多项研究工作发现,对于生成式AI来说,由于基于Transformer的大语言模型受到内存的限制,在量化到8位(INT8)或4位(INT4)权重后往往能够获得大幅提升的效率优势。

其中,4位权重量化不仅对大语言模型可行,在训练后量化(PTQ)中同样可能,并能实现最优表现。这一效率提升已经超过了浮点模型。

具体来说,高通的研究表明,借助量化感知训练(QAT)等量化研究,许多生成式AI模型可以量化至INT4模型。

在不影响准确性和性能表现的情况下,INT4模型能节省更多功耗,与INT8相比实现90%的性能提升和60%的能效提升。

今年,高通还提出了一种名为LR-QAT(低秩量化感知训练)的算法,能使大语言模型在计算和内存使用上更高效。

LR-QAT受LoRA启发,采用了低秩重参数化的方法,引入了低秩辅助权重,并将其放置在整数域中,在不损失精度的前提下实现了高效推理。

苹果非快充

在Llama2/3以及Mistral系列模型上的实验结果显示,在内存使用远低于全模型QAT的情况下,LR-QAT达到了相同的性能。

另外,高通还重点布局了矢量量化(VQ)技术,与传统量化方法不同,VQ考虑了参数的联合分布,能够实现更高效的压缩和更少的信息丢失。

编译

在AI模型被部署到硬件架构的过程中,编译器是保障其以最高性能和最低功耗高效运行的关键。

编译包括计算图的切分、映射、排序和调度等步骤。

高通在传统编译器技术、多面体AI编辑器和编辑器组合优化AI方面都积累了不少技术成果。

比如,高通AI引擎Direct框架基于高通Hexagon NPU的硬件架构和内存层级进行运算排序,在提高性能的同时,可以最大程度减少内存溢出。

硬件加速

终端侧的AI加速,离不开硬件的支持。

在硬件方面,高通AI引擎采用异构计算架构,包括Hexagon NPU、高通Adreno GPU、高通Kryo CPU或高通Oryon CPU。

其中,Hexagon NPU在今天已经成为高通AI引擎中的关键处理器。

以第三代骁龙8移动平台为例,Hexagon NPU在性能表现上,比前代产品快98%,同时功耗降低了40%。

架构方面,Hexagon NPU升级了全新的微架构。与前代产品相比,更快的矢量加速器时钟速度、更强的推理技术和对更多更快的Transformer网络的支持等等,全面提升了Hexagon NPU对生成式AI的响应能力,使得手机上的大模型“秒答”用户提问成为可能。

Hexagon NPU之外,第三代骁龙8在高通传感器中枢上也下了更多功夫:增加下一代微型NPU,AI性能提高3.5倍,内存增加30%。

事实上,作为大模型/AIGC应用向终端侧迁移的潮流中最受关注的技术代表之一,以上重点之外,高通的AI研究布局早已延伸到更广泛的领域之中。

以CVPR2024入选论文为例,在生成式AI方面,高通提出了提高扩散模型效率的方法Clockwork Diffusion,在提高Stable Diffusion v1.5感知得分的同时,能使算力消耗最高降低32%,使得SD模型更适用于低功耗端侧设备。

并且不止于手机,针对XR和自动驾驶领域的实际需求,高通还研究了高效多视图视频压缩方法(LLSS)等。

在当前的热点研究领域,比如AI视频生成方面,高通也有新动作:

正在开发面向终端侧AI的高效视频架构。例如,对视频到视频的生成式AI技术FAIRY进行优化。在FAIRY第一阶段,从锚定帧提取状态。在第二阶段,跨剩余帧编辑视频。优化示例包括:跨帧优化、高效instructPix2Pix和图像/文本引导调节。

底层技术驱动AI创新

大模型应用是当下的大势所趋。而当应用发展的程度愈加深入,一个关键问题也愈加明朗:

应用创新的演进速度,取决于技术基座是否扎实牢固。

这里的技术基座,指的不仅是基础模型本身,也包括从模型量化压缩到部署的全栈AI优化。

可以这样理解,如果说基础模型决定了大模型应用效果的上限,那么一系列AI优化技术,就决定了终端侧大模型应用体验的下限。

作为普通消费者,值得期待的是,像高通这样的技术厂商,不仅正在理论研究方面快马加鞭,其为应用、神经网络模型、算法、软件和硬件的全栈AI研究和优化,也已加速在实践中部署。

以高通AI软件栈为例。这是一套容纳了大量AI技术的工具包,全面支持各种主流AI框架、不同操作系统和各类编程语言,能提升各种AI软件在智能终端上的兼容性。

其中还包含高通AI Studio,相当于将高通所有AI工具集成到了一起,包括AI模型增效工具包、模型分析器和神经网络架构搜索(NAS)等。

更为关键的是,基于高通AI软件栈,只需一次开发,开发者就能跨不同设备随时随地部署相应的AI模型。

就是说,高通AI软件栈像是一个“转换器”,能够解决大模型在种类繁多的智能终端中落地所面临的一大难题——跨设备迁移。

这样一来,大模型应用不仅能从云端走向手机端,还能被更快速地塞进汽车、XR、PC和物联网设备中。

端模和侧模

站在现在的时间节点,人人都在期待改变世界的技术潮流翻腾出更汹涌的巨浪。

用cad怎么画太极图

而站立潮头的弄潮儿们正在再次验证技术史中一次次被探明的事实:引领技术之先的人和组织,无不具备重视基础技术的“发明家文化”。

不止是追赶最新的技术趋势,更要提前布局,抢先攻克基本方案。

高通在《让AI触手可及》白皮书中同样提到了这一点:

高通深耕AI研发超过15年,始终致力于让感知、推理和行为等核心能力在终端上无处不在。

这些AI研究和在此之上产出的论文,影响的不仅是高通的技术布局,也正在影响整个行业的AI发展。

大模型时代,“发明家文化”仍在延续。

也正是这样的文化,持续促进着新技术的普及化,促进着市场的竞争和繁荣,带动起更多的行业创新和发展。

你觉得呢?


返回网站首页

本文评论
苹果14pro「苹果1」
是一款由苹果公司推出的第一款个人电脑。它于1976年4月1日首次发布,并在接下来的几年内不断更新进化。尽管它现在看起来相当原始,但这款电脑的历史地位无可比拟。ipad pro 9.8...
日期:06-03
任天堂新机型什么时候上市「任天堂新机将至!?老任是怎么走上“机能落后”这条路的」
  距离任天堂发布首代Switch已经过去了7年多,很多NS玩家早已被老任(任天堂)成功忽悠,习惯了30帧720P的渣渣画质游戏……与其相反的,是那些与老任反忽悠到底的玩家,在日本有一位...
日期:07-11
chat官方下载「ChatUp AI官网体验入口 AI聊天助手免费使用地址」
ChatUp AI是一款基于Chat GPT和GPT- 4 技术的AI聊天助手。它能够处理多种任务,包括内容创作、语法检查、AI故事生成、市场营销、SEO工具、语言练习和常识问答等。该产品提供...
日期:01-08
高等学校数字化建设「OOOK:助力推进高等教育数字化转型向深、向实、向新发展」
以科技创新为基因的安博扎根教育事业二十余年,助力推进高等教育数字化转型向深、向实、向新发展。一、创新赋能,打造数字化转型主引擎近年来,大数据、人工智能等技术正在改变高...
日期:10-07
三星galaxy watch active2 评测_春季运动搭档 三星Galaxy Watch Active2直降200元起
  四月迎春生机勃勃,但乍暖乍寒的特点,也是对大家抵抗力的一次挑战。适当的运动不仅可以改善新陈代谢,还能够提高免疫力和抵抗力,所以为了不负春光,大家都应该积极的锻炼起来...
日期:08-11
2021年推荐哪款投影仪选购?这篇2000元档位家用投影仪推荐排行榜告诉你
  投影仪随着普及众多人群的使用,特别是在家用投影仪方面紧追传统电视机,并且因为2020年特殊情况后,在家学习办公、娱乐、健身等需求极大提升,均促使了家用投影仪的选购!...
日期:07-16
安康市政府与中国移动陕西公司战略合作签约 暨数字城市建设专题讲座举办
通信世界网消息(CWW)7月6日,安康市政府与中国移动陕西公司战略合作协议签订暨数字城市建设专题讲座举办。市委书记武文罡,市长王浩出席活动。中国移动陕西公司党委书记、董事长...
日期:07-07
小米SU7开8年/16万公里 电池衰减大于30%将免费换_小米电池寿命75%要换吗
快科技5月4日消息,许多消费者对新能源汽车更换电池的高昂成本表示担忧,担心节省下来的充电费用最终会因更换电池而一次性耗尽。然而,目前的汽车动力电池技术已经相当成熟,通常情...
日期:05-05
中国移动智能喇叭 唱响乡村好日子「移动智能音响叫什么」
通信世界网消息(CWW)乡村治安怎么管?防火防疫怎么防?传统农业如何应用智慧管理?现如今,中国移动依托数字乡村平台,让村委会的村委们一部智能手机在手,便可以随时掌握全村情况。村务...
日期:05-31
十二月份去三亚机票多少钱「去哪儿:十一期间三亚机票平均支付价超800元」
9 月 28 日消息,昨日 12 时起,三亚全面恢复各类生产生活秩序。去哪儿数据显示,临近十一,国庆期间飞往三亚的国内航线机票预订量增幅明显, 9 月 27 日预订量较一周前增长 5 倍。机...
日期:09-28
微软与 Inworld AI 合作:将人工智能增强的游戏开发工具引入 Xbox_微软开发了哪些游戏
11 月 7 日消息:微软今日宣布,其游戏部门 Xbox 将与 Inworld AI 合作,共同开发一套游戏开发工具,使开发者能够创建具有 AI 增强功能的游戏角色等。qq邮箱怎么登录公司邮箱据 Th...
日期:11-07
魅族Q3出货量同比提升218%:增速全行业第一_魅族2021年
快科技11月30日消息,魅族21系列发布会今天下午正式举行,本次发布会将会推出年度旗舰魅族21系列,包含魅族21和魅族21 PRO至少两款机型。在新品发布会上,沈子瑜宣布,魅族2023年Q3出...
日期:12-01
马斯克:特斯拉可能像 Android 那样 向其他汽车制造商「开源更多代码」
(ChinaZ.com)5月26日消息:在与福特汽车公司首席执行官吉姆·法利(Jim Farley)进行的 Twitter Spaces 直播中,埃隆·马斯克(Elon Musk)提出了一个建议,即特斯拉可能会向其他汽车制...
日期:05-26
高校回应考生因航班延误错过复试:通知合规 可按流程重新参加
千军万马过独木桥的研究生考试通过了,却因航班延误没赶上复试,围绕考生小刘的经历(考研最大的遗憾”帖子)日前在网络上引发热议。小鹏汽车发布第三季度财报 总营收68.2亿元是真...
日期:03-26
消息称苹果已考虑从部分 iPhone 14 系列机型中移除 SIM 卡插槽_苹果13电话卡怎么放入卡槽
IT之家 9 月 5 日消息,据彭博社的 Mark Gurman 称,苹果公司内部已经讨论了在明年之前推出部分没有 SIM 卡插槽的 iPhone 的想法。Gurman 在他最新的 Power On 时事通讯中表示,...
日期:09-15
理想 北京「北京最亮的理想MEGA现身:土豪金配色着实显眼」
快科技7月23日消息,要说什么车最显眼,那一定是最为特殊的,这也是很多人热衷于给爱车贴改色膜、车贴的原因之一,毕竟谁不想要独一无二呢?amd和nv哪个快iphone15 会有大变革吗近日...
日期:07-23
女子挂P挡开不动车 导致道路拥堵十分钟:我在玩手机不知道啥挡
快科技5月9日消息,近日在山东济南街头,一辆汽车因违规停放在马路上引起了交通堵塞。图森是哪里的厂家面对交警的询问,女驾驶员还踩油门演示,但车辆并未移动,发动机只是空转。交警...
日期:05-10
微软 Bing Chat 正式支持谷歌桌面版浏览器 Google Chrome_微软用谷歌内核
8月29日 消息:微软正式为 Google Chrome 添加了对 Bing AI 的支持。三星exynos 7872和联发科6763据悉,Bing AI 在六个月前发布时仅限于 Microsoft 的 Edge 浏览器,但现在已经...
日期:08-29
曝网易暴雪重新合作 《魔兽世界》等国服要回来了:暴雪中国回应
快科技12月25日消息,据国内媒体报道称,过去一段时间,暴雪与国内多家游戏厂商洽谈了国服回归”事宜,最终选择与网易重新牵手合作。随后这引发了网友的广泛关注,报道中提到,在合作确...
日期:12-25
仅27999元起!苹果中国开卖Mac Studio官方翻新版:搭载强无敌M2 Ultra_苹果官方翻新mac怎么样
快科技11月18日消息,苹果中国官网的翻新产品又上新了,这次是最强产品线Mac Studio。苹果全新上架了搭载M2 Ultra芯片的Mac Studio,这是目前苹果的最强桌面端产品之一。虽然目前...
日期:11-18