您的位置:首页 > 互联网

Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏_阿里 云通信

发布时间:2024-06-08 18:08:38  来源:互联网     背景:

快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率,Intel进行了全面的软件优化,包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

首先看Intel Gaudi AI加速器,专为生成式AI、大模型的高性能加速而设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2,对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试,以下为详细性能指标和测试结果:

互联网发展论坛新闻发布会

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

阿里云问答

通义千问2 FP8在Gaudi 2加速器上的推理

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器,作为通用平台具有广泛的可用性,适用于各个规模的数据中心,对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC,可以在本地部署大模型,既然可以使用处理器内置GPU核显、NPU AI引擎,也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2:

酷睿Ultra 7 165H上的通义千问2推理

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

锐炫A770 16GB显卡上的通义千问2下一个token延迟


返回网站首页

本文评论
光峰科技最新动态「光峰科技携家用核心器件产品亮相高交会」
11 月 15 日,万众期待的第 25 届中国国际高新技术成果交易会(以下简称“高交会”)在深圳开幕。本届高交会以“激发创新活力 提升发展质量”为主题,超过 100 个国家和地区的团...
日期:11-17
雅迪新车充电「雅迪参展CES:汽车级快充亮相 20分钟充满80%电池」
近日,2023国际消费类电子产品展览会在美国拉斯维加斯开幕,雅迪携旗下全矩阵产品参展。推荐几款3000左右的手机会展上,雅迪VFLY VFD、VFLY 神盾隼VFE150、VFLY 骑兵01、召唤师钛...
日期:01-11
网易联合创新中心落地上海奉贤,加快打造“数字江海”新地标
  近日,以“数字、转型、服务、生态”为主题的“第二届中国(上海)工业品在线交易节东方美谷·爱企谷5.27专场”在上海爱企生产性服务业功能区开幕。开幕式上,“上海奉贤网...
日期:02-15
我暑假最难忘的事「敦煌警察每年从沙漠挖百部手机  网友:这里埋藏了无数手机」
在旅游旺季,还记得那场安哥“超级大V的正义之旅”在甘肃敦煌的打卡吗?在敦煌鸣沙山月牙泉景区派出所,每年都会接到300多起警情,其中98%都是为了游客寻找遗失物品和提供救助服务...
日期:08-18
9人组团盗墓:过程奇葩 3人中途中毒死亡_盗墓几个人构成团伙
近日,内蒙古赤峰市敖汉旗人民法院公布了一起盗墓案,情节之离奇、荒唐,让官方都称之为奇葩”。长城汽车亮相德里车展根据通报,案情是这样的:2022年端午节前夕,陈某纠集郎某、钱某等...
日期:08-15
百度ai开发者大会2020_百度AI亮相全球软件开发大会,侯震宇详解面向AI的基础架构
  “未来,AI无处不在,基础架构‘无’影随行。”5月6日,在第十届全球软件开发大会上,百度副总裁侯震宇发表题为《面向 AI 的基础架构建设》的演讲,分享AI发展对基础架构的挑战...
日期:01-25
SpaceX第四次星舰轨道试飞获批准 马斯克:星舰已准备完毕_spacex星舰最新进展
6月5日 消息:美国联邦航空局(FAA)于6月4日正式批准了马斯克旗下SpaceX的星舰4号飞行测试(Starship Flight4)。据SpaceX计划,此次测试最快将于6月6日从得克萨斯州南部的星际基地...
日期:06-05
安卓机降价快「安卓失速,降价过冬」
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 王敏 编辑 | 向小园,授权转载发布。手机厂商们急了。欣旺达新能源产业基地最近“双11”大促,手机厂商们集体开启了大...
日期:11-07
洋钱罐的借款额度可以循环使用吗?_洋钱罐借款有额度可以直接提现吗
在日常生活中,我们有时会遇到临时的资金需求,而这时候,能够提供便捷、快速借款服务的洋钱罐就显得尤为重要。然而,有些用户可能对于洋钱罐的借款额度存在疑问。例如,洋钱罐的借款...
日期:02-05
200亿美元收购案告吹 Adobe和Figma因监管机构反对同意取消合并_adobe收购flash
12月19日消息,据外媒报道,在英国和欧盟监管机构的压力下,Photoshop制造商Adobe和产品设计软件公司Figma在当地时间周一宣布,双方已达成一致,同意终止此前宣布的合并协议。根据合...
日期:12-19
鲍尔默证实明年推出Win8 将支持平板电脑
(明轩)北京时间5月24日消息,据国外媒体报道,微软首席执行官史蒂夫·鲍尔默(Steve Ballmer)周一在日本召开的2011年度微软开发者论坛大会上证实,微软下一代操作系统名为“Windows 8...
日期:07-28
东软推出添翼医疗领域大模型 及多款AI+医疗行业应用
6月20日 消息:据东软集团官方消息,近日,东软面向医疗领域推出多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。添翼医疗领域大...
日期:06-20
国庆档新片豆瓣开分!《前任4》6.8分、《坚如磐石》6.7分 你看过哪几部?
9月30日消息,作为电影行业一年中主力期之一,国庆档有多部新片扎堆上映,包括《前任4:英年早婚》《坚如磐石》《莫斯科行动》等。目前已有多部国庆档新片在豆瓣开分,其中《莫斯科行...
日期:10-01
这一次,华为还能遥遥领先吗?_华为还能撑下去吗知乎
这一次,华为还能遥遥领先吗? 商用四年多以来,一直被消费者质疑“除了资费贵、跟4G没啥变化”的5G网络,即将迎来一次全面升级。日前,华为在2023全球移动宽带论坛期间发布了全球首...
日期:10-22
支付宝开放中秋付款码皮肤数字藏品,旺旺等商家首批尝鲜「支付宝付款码中秋皮肤怎么获得」
9月1日 消息:中秋佳节临近,观察到,9月1日起,毛戈平、旺旺、太平鸟、海尔、老庙黄金等商家,纷纷在支付宝推出中秋付款码皮肤数字藏品,并借助付款码皮肤数字藏品的热度,为自己的小程...
日期:09-11
“热辣滚烫”的5G-A,在MWC2024释放了什么信号?
通信世界网消息(CWW)一个个前沿技术华丽登场、一批批生成式AI应用酷炫登场、一场场科技峰会引爆全场,在巴塞罗那举办的MWC2024上,全球顶级的创新成果比比皆是,正在显现出全球数字...
日期:03-01
三星Galaxy Z Fold5评测视频Z Fold5重塑影像影视体验 给你想要的移动新生活 三星Galaxy
来源:中关村在线当下,人们更喜欢用精神层面的追求来定义“品质”,比如自洽,情绪稳定,又或者平衡,在大多数人的眼里便是理想的生活状态。而想要做到自洽,除了自我的心理建设,懂得如何...
日期:12-13
估值200亿的AI公司,要干掉谷歌了?_估值200亿的ai公司,要干掉谷歌了吗
声明:本文来自微信公众号“亿欧网”(ID:i-yiou),作者:王鹏,编辑:顾彦,授权转载发布。是什么让全球科技圈都爱上了分享聊天截图?继AI绘画爆火后,又一款AIGC产品刷屏了海内外的社交网...
日期:12-12
海天酱油回应双标:不区分国内外市场、添加剂都有「海天酱油是合资企业吗」
最近,全国闻名的海天酱油因为添加剂问题闹得沸沸扬扬:国内售卖的含有食品添加剂,在日本售卖的却零添加,被质疑双标”。对此,海天味业曾发布公告,否认存在双标”,还指责有人借机炒作...
日期:10-12
公司辞退提前吃午饭员工:最终被判赔付员工2万元_公司提前辞退员工赔偿
12月7日消息,据国内多家媒体报道,一公司员工多次比规定下班时间提前几分钟就餐,被公司以严重违纪为由辞退,并拒绝支付赔偿金。对此,法院作出判决,公司赔付当事员工2万元。手机忘记...
日期:12-07