您的位置:首页 > 互联网

微软亚洲研究院推轻量级视觉网络新主干 AFF Token Mixer

发布时间:2023-08-24 19:33:03  来源:互联网     背景:

文章要点:

  • 微软研究人员发现傅里叶变换可以实现Token融合,计算代价远低于大内核卷积。

  • 基于该发现设计了Adaptive Fourier Filter(AFF) Token Mixer,将计算复杂度降为O(NlogN)。

  • 使用AFF Token Mixer构建了轻量级神经网络AFFNet,在ImageNet上取得79.8%准确率。

8月24日 消息:微软亚洲研究院的研究人员最近在 ICCV2023上发表了一篇论文,提出了一种名为 Adaptive Fourier Filter(AFF)的轻量高效 Token Mixer,可以显著降低视觉神经网络的计算复杂度。论文显示,通过傅立叶变换可以等效地实现 Token 的融合,而计算量远小于直接使用大内核卷积进行 Token 融合。基于该核心思想,研究员设计了 AFF Token Mixer,可以将 Token 融合的计算复杂度从 O(N^2) 降低到 O(NlogN),同时实现全局自适应的 Token 融合。

image.png

论文地址:https://arxiv.org/abs/2307.14008

论文的主要贡献包括:1)证明了频域卷积可以实现与大内核卷积等效的 Token 融合,但计算量更低;2)设计了 AFF Token Mixer,可以高效全局融合 Token;3)基于 AFF Mixer 构建了轻量级神经网络 AFFNet。

诺基亚骁龙835旗舰性能首秀: 强到三星S8凌乱!

image.png

AFF Token Mixer 的设计思路是:首先通过 FFT 把 Token 映射到频域,然后在频域学习一个内容自适应的滤波掩模,最后对频域进行滤波来实现 Token 的自适应融合。根据频域卷积定理,这在数学上等价于在原始域使用一个与 Token 集大小相同的大动态卷积核进行卷积。但频域滤波的计算量仅为 O(NlogN),远小于 O(N^2) 的空间卷积。

image.png

基于 AFF Token Mixer,研究人员构建了轻量级的全卷积网络 AFFNet,以其作为主干网络。在 ImageNet 图像分类任务上,AFFNet 仅使用550万参数就达到了79.8% 的准确率,优于其他轻量级模型如 VoVNet 和 RegNet 等。更令人惊讶的是,AFFNet 在多个下游任务上也展现出色的性能,如在 COCO 检测和 ADE20K 分割上明显超过了使用相近复杂度的模型。

本研究验证了频域变换在降低 Token 融合计算复杂度方面的有效性。AFF Token Mixer 为轻量级全局信息融合提供了新的有效途径。基于该 Token Mixer 构建的 AFFNet 作为新的轻量级 CNN 主干网络,有望推动更多视觉模型在边缘设备上的应用。本研究为探索有效的轻量级视觉网络结构提供了新的思路和范式。


返回网站首页

本文评论
京东会员买苹果更便宜吗「重磅福利!5月20日起京东A+会员买Apple产品可价保618」
5 月 20 日,Apple产品京东自营旗舰店火热推出A+会员节活动,开通店内A+会员选购指定Apple产品可额外叠加 50 元优惠券,iPhone 14 Pro Max至高立省 1500 元,更有价保 618 的重磅权...
日期:05-19
易博士捐赠移动数字图书馆 温总理手中的阅读器走进北川中学
    在512大地震纪念日到来之际,广州金蟾软件(易博士)、龙源期刊、江苏华西集团、中华慈善总会在2010年5月6日联合向北川中学捐赠全球领先的移动数字阅览室以及移动电子书...
日期:07-29
社区团购同质化_团购网站同质化严重 深耕细作成关键
  不知何时开始,洗牌、裁员、亏损、欺诈等字眼频频拥抱团购网站,将团购行业悄悄推入了寒冬,与此同时,阴云笼罩的团购市场并没有阻止进入者的热情,使得同质化竞争形式愈演愈烈...
日期:07-23
QuestMobile2020年度报告:作业帮稳居K12赛道用户规模NO.1App
  近日,QuestMobile发布《2020中国移动互联网年度大报告》。报告公布了“2020中国移动互联网TOP50赛道用户规模NO.1App”榜单,作业帮凭借卓越的市场表现及领先的用户规模,继...
日期:11-22
海底捞已禁止自带食材!官方称安全不可控「海底捞允许自带菜品吗」
近日有网友,发现海底捞已经不让自带食材了,官方也确认了这一点。有网友表示,去海底捞之前在超市买了丸子、年糕、虾、豆腐、蘑菇等,但是到店准备煮的时候被告知不能自带了,因为有...
日期:02-25
新款iPhone唯一的亮点可能就是A13处理器了(苹果的a13处理器)
  每年的下半年才是手机市场最为动荡的时候,因为无论是苹果三星还是华为都会在下半年推出主打旗舰机,华为的Mate系列以及新款iPhone无论是哪一款手机对于市场的影响都是非...
日期:12-02
程序员入侵网站_19岁黑客侵入最高检网等网站 称没学过编程
  凭网购的破解网址入口,两名仅初中文化的青年“菜鸟”,轻松入侵了约80家网站,其中包括最高检网站在内的多家政务网。两人入侵网站,仅是为了通过更改网站源代码为其他网站提...
日期:07-25
宝马卖保险,到底为了啥?「宝马买保险是不是贵些」
  在保险行业“去中介化”的呼声中,近年来有上千家保险中介机构被注销。但在这种情况下,依然有新玩家入场。日前,“宝马也要卖保险”的消息一出,瞬间引起行业关注。其实此前,包...
日期:10-01
酒店回应到211大学招服务员:符合流程 面向所有高校毕业生_酒店服务专业学校
冬去春来,新一批大学生们毕业的日子开始倒计时,招聘活动也忙活起来。不过,前有河南财经政法,后有云南大学,校园招聘会上均出现一些引发热议的现象。iphone14pro暂停充电西部决策...
日期:03-09
中国联通经济大脑荣获“2023数博会领先科技成果奖”_中国联通数字经济
中国联通经济大脑荣获“2023数博会领先科技成果奖” 小米手环8多少钱红杉中国公开市场基金...
日期:05-27
Zoom裁员1300人:创始人放弃奖金 公司市值已蒸发超千亿美元「zoom的股东」
雷递网 乐天2月8日视频会议应用开发商Zoom Video日前宣布裁员1300名员工,约占全球员工总数的15%。Zoom创始人、CEO袁征日前表示,公司人数在疫情期间增长过快,现在需要调整以适...
日期:02-08
南极冰层断裂「NASA发现以前未知的南极冰层损失:“南极洲的边缘正在崩塌”」
在预测全球海平面上升方面,最大的不确定性是南极洲的冰层损失将如何随着气候变暖而加速。由位于南加州的美国宇航局(NASA)喷气推进实验室(JPL)的研究人员领导的两项研究揭示了关...
日期:09-14
美图吴欣鸿:未来AI会更多地参与到美图视觉的创作过程中_美图公司吴欣鸿
6月21日 消息:据美图官方消息,在第二届美图影像节“AI与设计”主题论坛,美图公司创始人、董事长兼首席执行官吴欣鸿表示,美图影像节的很多物料,都是用美图AI生成的。相信未来AI...
日期:06-21
荣耀新机X40 GT官宣:性能越级标杆 战神登场
中关村在线消息:10月8日早,荣耀手机官方微博预热了一款即将推出的新机:X40 GT,Slogan为“性能越级标杆”。官方是这样评价这款新机的:“强悍性能,非凡操控 生来强大,实力霸屏”。街...
日期:10-21
奋斗《正青春》,华硕猎鹰V4一体机与您共同见证
  近日,由吴谨言、殷桃、左小青、刘敏涛等主演的职场女性励志奋斗能量剧《正青春》正在浙江卫视、东方卫视黄金档、优酷火热开播,剧中讲述的是几位不同年龄段的女性在职业...
日期:07-02
美光推出 1α DRAM 制程技术:内存密度提升 40% 节能 15% ,今年量产出货,LPDDR5 速度将更快
  1 月 27 日消息 内存与存储解决方案供应商美光科技今日宣布批量出货基于 1α (1-alpha) 节点的 DRAM 产品。该制程是目前世界上最为先进的 DRAM 技术,在密度、功耗和性...
日期:11-07
1899元起!华为nova 9官翻机开售:50MP主摄+4300mAh电池「nova6 1799」
华为官方今日宣布,华为官方翻新产品nova 9将于今日10:08在华为商城正式开售。官方海报显示,华为nova 9 官翻机提供9号色、亮黑色、绮境森林三款配色,128GB版本售价1899元,256GB...
日期:12-16
系统门窗供应链平台唯必驰落地运营_采购门窗平台
  2020年12月中旬,系统门窗集成供应链共享创业平台——唯必驰在常州落地运营。该平台的成立,将加速我国系统门窗定制及非标定制领域进入系统化、水平化的进程,对非标定制领...
日期:07-10
360数科宣布加入FinOps阵营,推动基于云的成本优化
8月9日消息,360数科正式宣布加入中国产业互联网发展联盟标准专委会“FinOps产业标准工作组”,将与一众云计算相关企事业单位共同通过开展标准规范制定与评测、资源共享、产业...
日期:08-21
c盘红了清理也没有变「C盘真的一下子就不红了!微软官方工具就能解决」
快科技7月18日消息,今天C盘真的一下子就不红了”的话题冲上热搜,引起很多网友关注。不少网友都吐槽现在软件垃圾和占用太多,C盘天天都是红色,还导致电脑卡顿。很多人在话题中给...
日期:07-18