您的位置:首页 > 互联网

性能8.6倍于竞品!高通AI大揭秘:NPU引领四兄弟无敌

发布时间:2024-03-08 02:02:31  来源:互联网     背景:

生成式AI的变革,对于基础硬件设计、软件生态开发都提出了新的、更高的要求,尤其是底层硬件和算力必须跟上新的形势,并面向未来发展做好准备。

近日,高通特别发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书,对于终端侧生成式AI的发展趋势,以及高通骁龙处理器的多模块异构计算引擎,尤其是NPU的设计及优势,都进行了详细解读。

生成式AI虽然这两年才火热起来,但是AI的发展历史悠久,高通也早在2007年就打造了Hexagon DSP,其控制和标量架构正是后续NPU的基础。

2015年发布的骁龙820处理器集成了首个高通AI引擎,支持成像、音频和传感器运算。

之后,2018年的骁龙855又增加了Hexagon张量加速器。

2020年骁龙888里的全新架构Hexagon NPU堪称里程碑转折,并在之后的三代骁龙8中持续迭代演进,AI性能、效能和范围不断拓展。

ROG幻16开箱

比如第三代骁龙8的张量运算核心的峰值性能就大幅提升了98%,同时依然保持高超的能效。

高通在AI方面采用的是异构计算引擎思路,由Kryo CPU、Adreno GPU、Hexagon NPU、传感器中枢四大核心模块共同组成,彼此协作。

根据终端类型、终端层级、关键性能指标、时延等因素的不同,这种架构可以使用不同的组件进行AI处理,以达到最佳效率。

比如说,CPU计算量一般,但擅长顺序控制和即时性,非常合对延迟要求非常高的场景,比如时序敏感性小模型,比如卷积神经网络模型(CNN)或者特定大语言模型(LLM)。

GPU擅长高精度格式的并行处理,比如对画质要求非常高的图像、视频处理,同时算力非常强,可运行大规模的模型。

NPU擅长标量、向量和张量数学运算,而且能效非常高,能够以极低功耗实现持续稳定的高峰值性能,在基于LLM和LVM(大视觉模型)的不同用例中,比如说Stable Diffusion或其他扩散模型,每瓦特性能十分出色。

高通传感器中枢则能以极低功耗运行始终开启的用例,可获取大量端侧情境信息,让生成式AI体验更加个性化,这也是终端侧AI的独特优势之一,并且信息保留在终端上,不会联网上传到云端,隐私更安全。

如此设计的异构计算,能够实现最佳的应用性能、能效和电池续航,以最大化提升生成式AI终端的用户体验。

这里重点说说NPU。

NPU全程为神经网络处理器,是专为低功耗加速AI推理而打造的硬件模块,架构上随着新AI算法、模型和用例的发展而不断演进。

Al工作负载主要包括由标量、向量和张量数学组成的神经网络层计算以及非线性激活函数。

优秀的NPU设计,能正确选择如何处理AI工作负载,同时与CPU、GPU等其他模块协同执行,并与AI行业发展方向保持高度一致。

高通Hexagon NPU就是为了以低功耗实现持续稳定的高性能AI推理而设计,其差异化优势在于系统级解决方案、定制设计和快速创新。

通过定制设计NPU并控制指令集架构(ISA),高通可以让NPU快速演进和扩展,以解决遇到的任何瓶颈问题,并优化性能。

高通透露,最初开始研究NPU的时候,关注的是一些简单用例,比如用于音频和语音处理的卷积神经网络模型(CNN)和长短期记忆网络模型(LSTM),2015年第一代高通AI引擎的Hexagon NPU就集成了标量和向量运算扩展。

2016-2022年间,高通将研究方向拓展至AI影像和视频处理,比如暗光拍照、降噪、多帧处理等,同时引入了Transforme层处理,因此增加了张量运算核心(Tensor Core)。

2023年,Hexagon NPU开始支持LLM和LVM,并支持Transformer,可以更好地处理基于Transformer的模型。

如今第三代骁龙8集成的Hexagon NPU已经能够在终端侧运行高达100亿参数的模型,无论是首个token的生成速度,还是每秒生成token的速率,都处在业界领先水平。

值得一提的是,Hexagon NPU还引入了用于图像处理的微切片推理技术,增加了能够支持所有引擎组件的大共享内存,最高支持到4.8GHz频率的LPDDR5X,LLM处理能力更上一层楼,可快速处理百川、Llama2等等。

谷歌pixel watch

零跑c11汽车报价及图片

说了半天原理,看看实际性能表现,首先是第三代骁龙8和三款安卓、iOS平台竞品的对比。

鲁大师AIMark V4.3测试中,第三代骁龙8的总分达到了竞品B的5.7倍、竞品C的7.9倍。

安兔兔测试中,第三代骁龙8的总分是竞品B的6.3倍。

汽车的abcd柱图解

MLCommon MLPerf推理的不同子项中,比如图像分类、语言理解、超级分辨率等,第三代骁龙8也都保持领先。

PC端对比骁龙X Elite和其他x86架构竞品。

Windows系统下的UL Procyon AI推理测试中,骁龙X Elite在ResNet-50、DeeplabV3等测试项目中都大幅领先,总分是竞品A的3.4倍、竞品B的8.6倍。

近日在巴塞罗那举办的MWC 2024大会上,高通还展示了在终端上运行的多模态生成式AI模型。

在第三代骁龙8上运行的首个大语言和视觉助理大模型(LLaVA),能基于图像输入,回答用户提出的问题。

比如为视障人士在城市内进行导航,就可以将图像信息转换成语音,帮助他们了解周围的事物。

顺带一提,高通还展示了基于骁龙X Elite笔记本,首个在终端侧运行的超过70亿参数的大型多模态语言模型(LMM),可接受文本和音频输入(如音乐、交通环境音频等),再生成多轮对话。

硬件AI能力之上,高通还打造了AI软件栈(AI Stack)。

它可以支持目前所有的主流AI框架,包括TensorFlow、PyTorch、ONNX、Keras;支持所有主流的AI运行时,包括DirectML、TFLite、ONNX Runtime、ExecuTorch;还支持不同的编译器、数学库等AI工具。

此外,高通还有AI Studio,可为开发者提供开发过程中需要用到的各种相关工具,包括支持模型量化和压缩的高通AI模型增效工具包(AIMET),能够大幅提高模型运行的效率。

高通认为,AI终端市场的发展还在初期阶段,但已经为高通的不同产品和解决方案带来了显著的改进,对消费者的重要性也在不断增加,无论教育、医学还是养老等各个领域,AI的作用将愈发凸显。

互联网出现的时候,只有少数人能够利用PC上网,而智能手机的出现让数十亿人都能够连接网络。

相信终端侧生成式AI的发展也是如此,它将让所有人都能充分利用生成式AI,改变工作、娱乐和生活中的切身体验,变革各行各业。


返回网站首页

本文评论
打造智慧城配新生态 天九共享助华商城市配送崛起智慧物流_智慧配送平台
  城市物流配送是推动城市经济活动良性运行的重要支撑,是社会生产、流通、消费的蓄水池与主动脉。随着互联网、物联网、大数据、云计算、人工智能等新技术的普及应用,加速...
日期:05-14
突发!苹果iPhone14发布会画面流出 紫色iPhone 14 Pro现场曝光「苹果12紫色发布会视频」
近日,海外爆料人抛出了一张苹果iPhone 14发布会录制现场画面,从此前官方发布的预告海报中已经提及今年iPhone 14发布会的地点为苹果总部的乔布斯剧场。而这张iPhone 14发布会...
日期:09-27
google被罚「法庭文件显示谷歌遏制苹果公司开发搜索相关功能」
IT之家 10 月 26 日消息,谷歌每年向苹果公司支付高额费用,确保在 iPhone、iPad 等设备上,Safari 浏览器默认搜索引擎为 Google Search,此前爆料的每年协议金额为 180-200 亿美元...
日期:10-26
多所高校宣布将停用微信支付 微信紧急致歉:沟通中存在误解 即刻修正
6月29日消息,近日,多所高校发布公告称将暂停使用微信支付,引发热议。1500元左右的手机哪款性价比最高10月根据西北大学的公告,暂停使用的原因是腾讯公司微信支付将于7月1日起对...
日期:06-30
iPhone 14 Pro灵动岛在强光下露真容 两者并没有完美融合
自从iPhone 14系列发布之后,Pro版上为挖孔打造的灵动岛就一战封神,被称为交互逻辑的“神作”。但目前普通消费者谁也没拿到手机,一切都只是在苹果展现出的完美设想里展现。腾讯...
日期:09-17
事关全球16亿人!统信UOS拿下行业初个认证
又收到一个好消息:统信UOS正式完成GB 18030—2022《信息技术 中文编码字符集》检测认证统信软件也成为全球操作系统行业首 个通过该认证的企业率先助力国家语言文字信息建设...
日期:04-07
iOS 16.0.3正式版来了:iPhone 14必升级_ios升级14.7
苹果于10月11日正式推送了iOS 16.0.3正式版更新,本次更新的版本号为:20A392,根据其版号的小变化也可以看出,这次更新主要是针对BUG进行修复的。iPhone 14 Pro 和iPhone 14 Pro M...
日期:10-25
中兴通讯“5G TSN网络关键技术及应用验证”入选2023工业互联网创新成果
通信世界网消息(CWW)6月14日-16日,2023年工业互联网大会在苏州市太湖国际会议中心召开。大会期间,中兴通讯“5G TSN网络关键技术及应用验证”创新成果对外发布,并成功入选工业互...
日期:06-19
焦点分析|英伟达又逼走一个车企,自研芯片箭在弦上「英伟达芯片制造」
作者 | 李安琪编辑 | 苏建勋通用汽车不是第一个,也不会是最后一个自研芯片的车企。近日,据路透社报道,通用汽车旗下自动驾驶公司Cruise正在同时自研四颗芯片,预计2025年前搭载到...
日期:09-27
2019年工业互联网示范试点项目名单_国双入选“2019工业互联网解决方案提供商TOP 100”
  6月4日,由中国科学院主管、科学出版社主办的《互联网周刊》与eNet研究院共同发布了“2019工业互联网解决方案提供商TOP 100”榜单,凭借在工业互联网领域领先的技术实力与...
日期:08-15
华为P60代号蒙娜丽莎!全新大底来了
中关村在线消息:11月10日,据相关爆料,即将在明年Q1季度发布的华为P60系列内部代号是蒙娜丽莎,说明这款机型更加偏向于女性审美,在设计方面P60将会有独特的美学理念。根据现有的曝...
日期:11-11
延续透明背板 + 灯带设计,Nothing Phone 2 海外发布_透明屏灯板
北京时间昨天晚间,Nothing 公司的第二款智能手机产品 Nothing Phone 2 正式发布。外观设计上,Nothing Phone 2 基本延续了一代产品的设计,背面采用透明手机背板,而在摄像头、无...
日期:07-13
国内第三季度5G手机出货量近5000万台  华米OV占据前四(一季度5g手机出货量)
11月6日 消息:据IDC发布的报告显示,从去年起,我国5G手机累计出货量已经超过了1.16亿台。2020年第三季度,国内市场5G手机出货量约4970万台。其中,华为排名第一,市场份额达56.6%,超...
日期:08-01
远程办公或促企业发展加速升级(远程办公永久化)
  2020年进入2月下旬,全国抗击疫情的战役还在持续。尽管生产型企业已经开始逐渐复工,而很多其他行业为了配合疫情防治仍然选择继续远程办公,大家的目的只有一个,就是为了疫情...
日期:02-09
支付宝回应支付宝(中国)法人及董事长变更:正常公司治理举措
讯 8月2日下午消息,近日,支付宝(中国)网络技术有限公司法定代表人、董事长将由井贤栋变更为倪行军。对此,支付宝方面今日回应称,“这是支付宝正常的公司治理举措,符合公司运营实际...
日期:08-03
MSN中文网_搜狐与MSN共建MSN中文视频频道
  11月2日消息,搜狐视频与MSN中国宣布正式达成视频业务战略合作伙伴,双方将共建MSN中文网视频频道,并由搜狐视频负责该业务的内容和运营。   据悉,上述视频频道将针对白领...
日期:07-24
索尼Xperia 10 Plus发布:带鱼屏设计 侧面指纹终于回归(索尼带鱼屏手机)
  2月26日下午2点,索尼举行了索尼Xperia 10 Plus国行版线上直播发布会。   最令人惊喜的是,从Xperia XZ2开始被索尼去掉的侧面指纹终于回归到了Xperia 10 Plus上,对此,索...
日期:08-07
2023年Q1联想、华为平板电脑西欧地区出货量同比减半-Canalys
【】6月14日消息,Canalys发布数据,2023年第一季度,西欧地区的个人电脑(PC)出货量(台式机、笔记本电脑和工作站)同比下跌37%至1000万台。其中,两大个人电脑品类面临显著的降幅,其中笔...
日期:09-24
当贝酷狗音乐是什么?电视怎么正确安装当贝酷狗音乐?(当贝酷狗音乐怎么下载)
  最近这几年,智能电视行业快速发展,也让家庭娱乐愈来愈丰富,越来越多的人开始摘下耳机,选择与家人共同欣赏美妙动人的音乐。近日当贝市场上线一款当贝酷狗音乐,用户可直...
日期:11-21
优酷视频窗口推动卡_优酷推移动终端站内播放器 颠覆移动网页视频体验
  近日,中国第一视频网站优酷(NYSE:YOKU)悄然推出针对Android、Windows Phone 7等主流手机以及Pad系统的全新站内播放器,结束了电脑用户与移动终端用户共用同一个网页视频播...
日期:07-23