您的位置:首页 > 互联网

爱芯元智AX650N表示无压力 Transformer大模型在边缘侧落地可行吗?

发布时间:2023-09-26 05:12:31  来源:互联网     背景:

【】5月30日消息,ChatGPT成为史上增长最快的消费类应用。这背后,是ChatGPT代表的高阶人工智能表现对人们的冲击。

ChatGPT使用的Transformer架构是以自监督的方式预训练的,作为基于GPT(Generative Pre-trained Transformer)预训练语言模型的消费类产品,ChatGPT的成功也让技术圈看到了Transformer的巨大潜力。

越来越多AI研究领域(例如,CV(计算机视觉)领域)开始把自监督方式预训练的Transformer用在各大应用场景,以期待产生类似ChatGPT的智能涌现。

然而Transformer模型往往需要巨大量的参数,才能出现所谓的“智能涌现”。因此,目前较为成功的GPT模型,大都是在“云端”进行训练和落地。

但是可以预见的是,未来要想让GPT模型应用产品在消费级市场有广泛应用和发展,解决在端侧、边缘侧高效部署Transformer将是关键一环。

专注研究人工智能视觉感知芯片的爱芯元智技术团队敏锐的看到了这一市场机会,对其第三代高算力、高能效比的SoC芯片——AX650N进行了优化,经测试,优化后的AX650N已成为业内首屈一指的Transformer端侧、边缘侧落地平台。

三杯鸡的做法家常做法

这也就意味着,对于那些有在端侧、边缘侧部署Transformer模型以提升图形图像识别精度的企业(比如机器人、自动驾驶企业等)来说,现在,借助AX650N就能实现Transformer模型落地、提升其视觉能力。

承载Transformer大模型 AX650N表现如何?

相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战则来自功耗。

AX650N是爱芯元智于2023年3月推出了第三代高算力、高能效比的SoC芯片,具有高性能、高精度、易部署、低功耗特征。

经适配Transformer调优后,爱芯元智技术团队的测试数据显示,目前大众普遍采用的Transformer网络SwinT,在爱芯元智AX650N平台表现出色:361 FPS的高性能、80.45%的高精度、199 FPS/W的低功耗。

具体来看,361帧的高性能可媲美汽车自动驾驶领域基于GPU的高端域控SoC;而80.45%的高精度成绩同样高于市面平均水平;199 FPS/W的速度也充分体现出低功耗的特点,对比于目前基于GPU的高端域控SoC,有着数倍的优势。

“AX650N会对Transformer支持比较好,因为有一个全面优化的设计,还有一个高性能的多核架构。爱芯元智兼具高性能和低功耗特质的混合精度NPU在一开始设计的时候,就是一个异构多核的设计,里面有一个核具有一定的可编程性,提供灵活性。同时,考虑到有些网络对数据需求量比较大,在架构上做了一些预留,这样最终看到的效果是在AX650N上Transformer跑的效果是比较快的。”爱芯元智相关技术负责人向表示。

同时,AX650N也提供了简单便捷的部署能力。GitHub上的原版模型可以在爱芯元智的平台上高效运行,不需要对模型做修改,不需要QAT重新训练。目前,AX650N已适配包括ViT/DeiT、Swin/SwinV2、DETR在内的Transformer模型,在DINOv2也达到30帧以上运行结果,这也使得用户在下游进行检测、分类、分割等操作更加方便。

曝iphone15pro影像参数

与此同时,AX650N支持低比特混合精度,用户如果采用INT4,可以极大地减少内存和带宽占用率,可以有效控制端侧边缘侧部署的成本。这些特性都保证了AX650N作为人工智能算力平台,最终落地效果更好用、更易用,大幅提升了用户的效率。

据悉,基于AX650N的产品已经在智慧城市,智慧教育,智能制造等计算机视觉重要领域发挥出重要作用。

7月将推出基于AX650N的开发板——AXera-Pi Pro 供开发者使用

目前,爱芯元智AX650N针对Transformer结构仍在进行持续优化,并且探索更多的Transformer大模型,例如多模态大模型,不断让Transformer在爱芯元智平台上得到更好的落地效果。

谈及迭代方向,爱芯元智透露的信息包括,针对于Transformer结构,怎么能让硬件读数据的时候,能够对离散的数据获得一个比较高效的读取以及配套的计算能够和数据读取匹配起来。也会尝试4比特来解决模型参数量大的问题等。

值得一提的是,爱芯元智已经将在7月推出基于AX650N的开发板——AXera-Pi Pro,满足开发者对Transformer深度研究的需求,探索更丰富的产品应用。

科学养生建议

爱芯元智方面表示,未来,这块小板子在电商平台上就可以买到,对Transformer感兴趣的学生、工程师或者社区开发人员都能够很方便地购买开发板,从github上找到软件的工具以及示例,能快速开发出自己的一些应用,包括用户想做的一些落地尝试。

“Transformer之前在NLP方面发展比较深入,在CV领域是最近这几月才开始陆陆续续有大模型放出来,这块目前还处于快速发展过程中。”爱芯元智联合创始人、副总裁刘建伟强调,爱芯元智AX650N在承载Transformer落地时的良好表现,算是抢得了“先发优势”,后续仍将持续优化产品,加速基于Transformer的大模型在端侧、边缘侧落地的节奏。


返回网站首页

本文评论
中国工程院院士邬贺铨:中国未来算力总规模或成世界第一(中国工程院院士邬贺铨:5G技术很不成熟、运营成本极高)
记者 | 姜菁玲   随着数字经济的发展,爆发式增长的数据量对数据计算能力提出了更高的要求,也让算力成为继热力、电力之后新的关键生产力。   7月30日,算力领域的首个国家...
日期:08-02
2023商用密码大会召开 三未信安发布多项密码技术成果「三未密码机」
(原标题:2023商用密码大会召开 三未信安发布多项密码技术成果) 2023年8月9日,2023商用密码大会在河南省郑州国际会展中心开幕,商...
日期:08-11
5分钟5000元,五一挤到天上了_五分钟到一分钱
声明:本文来自于微信公众号开菠萝财经(kaiboluocaijing),作者 | 金玙璠,编辑 | 艾小佳,授权转载发布。“五一出行,怎么才能避开人山人海?”陈琳很早就开始琢磨。她最终决定,“飞到...
日期:05-04
净利大涨168%,唯品会活得很滋润「唯品会盈利能力」
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。唯品会连续10年盈利你可以质疑唯品会日益收窄的规模,但无法否认它赚钱的能力——这已经是唯品会连...
日期:11-28
卖烤肠小伙「欠债4600万大叔直播卖烤肠还债:曾经是知名的餐饮巨头」
在杭州延安路上的小吃街上,有一位白发大叔,一边卖烤香肠,一边做直播,生意挺红火。乍一看,大叔的日子应该很惬意,但事实上,他背着4600万元的债务,全靠卖烤肠还债呢。苹果13上市苹果12...
日期:11-23
凡泰极客 杨涛「「价值共生 擎领未来」凡泰极客 & 阿拉丁 小程序数智化平台产品联合发布会完美落幕」
5 月 23 日,凡泰极客 & 阿拉丁小程序数智化平台产品联合发布会在北京成功举行。此次发布会以「价值共生 擎领未来」为主题,由凡泰极客、阿拉丁主办。发布会上,重磅发布了由凡泰...
日期:05-27
永辉2022年半年报:营收487.32亿元 实现扭亏为盈_永辉超市2021二季度财报
查看最新行情   讯 8月26日晚间消息,永辉超市(601933.SH)发布2022年半年报显示,实现营业收入达487.32亿元,同比增长4.07%;同店同比上升4.2%...
日期:09-04
“国庆住我家” 可行吗?律师:可能存在风险和隐患_国庆出去玩住宿太贵了
9月21日消息,中秋、国庆长假将至,随着人们出行热情的高涨,各个城市的酒店、民宿供不应求。据木鸟民宿平台发布的《2023中秋国庆民宿市场预测报告》显示,提前两周预订中秋国庆假...
日期:09-21
林生斌潼臻一生公司已注销 此前曾发布清算信息
4月14日,有关林生斌潼臻一生公司已经注销的话题成为了微博热搜的第一名。英国解除禁令根据天眼查App显示,杭州乐活几何品牌管理有限公司,该与潼臻一生品牌相关联的公司,近期已经...
日期:04-14
iPhone 14立减900 年底苹果全系都在大促「九月份苹果12会降多少钱」
后天就是小年了。临近兔年春节还有十几天,现在京东开启了年货节的促销活动,苹果旗下的手机、笔记本都有很大的促销,iPhone14领券立减900元,iPhone14 Plus至高优惠1000元,更有多款...
日期:01-12
金山云营业收入「金山云第三季度总营收19.69亿元 同比下降18.4%」
11月24日消息:金山云发布2022年第三季度业绩,实现总营收19.69亿元,同比下降18.4%;净亏损8.01亿元,去年同期为亏损5.07亿元。公有云和行业云分别实现收入13.5亿元和6.2亿元。调...
日期:11-25
智能驾驶迎大消息!特斯拉涨超10%,市值一夜暴涨超5800亿元「特斯拉智能驾驶技术特点」
每经编辑:杜宇当地时间9月11日,美股三大指数集体收涨,道指涨0.26%,纳指涨1.14%,标普500指数涨0.68%,日本还在用软盘热门科技股普涨,高通涨近4%,亚马逊、Meta涨超3%,英特尔、微软涨超1...
日期:09-12
红杉为什么停产了_红杉中国又放了一个大招
国家级信创适配中心   文/张楠   红杉中国,又放大招了。   今日,红杉中国下场做起了培训,宣布推出“YUÈ——红杉中国创业加速器”,定位为“创业者的第一课”,目标是提高早...
日期:08-16
苹果xr售价_苹果xr售价256g实体店多少钱
苹果公司在2018年9月12日召开的新品发布会上推出了三款新iPhone手机,分别是iPhone XS、iPhone XS Max和iPhone XR。这些新手机都配备了全新的A12仿生芯片,并拥有更强大的处理...
日期:05-31
丢失300M数据企业损失50万 服务器安全不容忽视_5+25+9等于几
  尽管早就有朋友建议王强定期给公司的网站做数据备份,尤其对重要的数据要实施多点备份,但是对拥有5年网络经验的王强来说,他怎么也不会相信,这种服务器遭受攻击、客户数据丢...
日期:07-29
8大角度深入解读联发科天玑9200:真快!真冷!「联发科天玑920和1100」
一、CPU首发三大架构、GPU光线追踪飞跃联发科天玑移动平台自诞生以来,一直稳扎稳打,不断向高端、向旗舰迈进,每一代产品都能带来无限的惊喜,让这个市场充满激情与活力。如今,天玑...
日期:11-17
马斯克等千名科技人士发公开信:叫停GPT-4后续AI大模型
3月29日 消息:据生命未来研究所官网,3月22日,生命未来研究所(Future of Life)向全社会发布了一封《暂停大型人工智能研究》的公开信,呼吁所有人工智能实验室立即暂停比GPT-4更强...
日期:03-29
eSIM+荣耀信任环,荣耀手表4实现远场消息同步,首发一表双待功能
通信世界网消息(CWW)2023年7月12日,在荣耀Magic V2暨全场景新品发布会上,荣耀正式发布全新一代智能手表——荣耀手表4。荣耀首次将MagicOS引入智能手表生态,力图打破传统eSIM手表...
日期:07-13
美格智能全球首发5G-A FWA解决方案,持续为全球用户带来万兆优越体验
通信世界网消息(CWW)3GPP定义的5G标准包括Sub-6 GHz和毫米波(mmWave),频率范围在6GHz以下的叫做Sub-6GHz频段,另一种范围在24GHz—100GHz的高频频段,被称为毫米波。其主要特点为超...
日期:09-15
比亚迪发布半年报:营收2601.2亿 研发投入142.5亿
【网易科技8月29日报道】比亚迪(002594.SZ)发布2023年中期业绩财报。报告显示,比亚迪上半年实现营业收入2601.24亿元,同比增长72.72%,实现净利润109.54亿元,同比增长204.68%。2023...
日期:08-29