您的位置:首页 > 智能设备

中国第一款gpu芯片_首颗中国DPU芯片点亮背后 我们对DPU又有了更清晰的认识

发布时间:2023-01-01 14:33:15  来源:互联网     背景:

原标题:首颗国产DPU芯片点亮背后 我们对DPU又有了更清晰的认识

随着国际芯片大厂纷纷入局DPU,市场对DPU芯片的价值肯定进一步坐实。前有英伟达CTO表示“DPU是我们的重中之重”,后有英特尔收购Bearfoot、AMD收购DPU初创公司Pensando,最近Fungible又被微软收购,这些都间接地反映出DPU的核心价值。DPU作为继CPU和GPU之后的又一个重要的算力支柱,将卸载网络、存储、虚拟化、安全等基础负载,有效减轻CPU的负担。

作为国内第一批研究和开发DPU芯片的企业,近日,中科驭数宣布自主研发的第一颗DPU芯片K2成功点亮,这是业内首颗完成点亮的国产ASIC形态的DPU芯片,中科驭数也扛起了国内DPU发展的大旗。

K2是一颗怎样的DPU?功能完整、性能也不差

DPU芯片发展近3年,但关于DPU芯片,其行业标准还没有形成,在工艺和性能方面并没有很多可以对标的商品。那么K2芯片是一款怎样的产品呢?

(图源:中科驭数)

在K2芯片的定义和定位上,据中科驭数创始人、CEO鄢贵海告诉笔者,现阶段的DPU核心是进行功能定义,必须要先解决功能的问题,然后才能考虑更多的性能问题。所以在工艺方面,驭数科技选用的是28nm。28nm的选择又有几方面的考量:首先,28nm实现DPU芯片的功能没有问题;其次,从性价比来看,28nm的成本比较可接受;另外,这也与驭数科技在过往设计方面的积累有关,K2本来的规模比较大,用到的IP也比较丰富,而且大多数IP在28nm的工艺线上已经验证地比较充分。所以,综合考量来看,28nm是一个既安全、工艺又成熟、性价比较高、且能达到功能的诉求的选择。

中科驭数创始人兼CEO鄢贵海(图源:中科驭数)

作为一颗功能型定位的DPU芯片,K2可以支持网络、存储、虚拟化等功能卸载,这也是目前国内首颗功能较完整的ASIC形态的DPU芯片。

功能满足了,性能如何呢?

说到性能上的突破,鄢贵海表示,DPU首先要解决的是时延问题。DPU最早用于网络加速就是为了解决网络延迟的问题,例如在金融证券行业,超低延迟网卡是刚需,必须要做到1.7微秒才是超低时延,而在这个场景下,处于长期被国外厂商垄断的局面,到2021年为止,AMD仍占据90%以上的市场份额,剩下的几乎被英伟达和思科占据。正是因为抓住了行业这一大痛点,低时延成为驭数科技最先爆量的一个产品。

K2芯片达到了1.2微秒超低时延的性能,并且可以支持最高200G网络带宽。驭数科技的K2芯片成功打破了国际厂商的垄断,至少是在金融场景下。

不过对于K2,驭数对其的厚望远远不是仅实现金融计算领域的国产替代这一目标,而是也瞄准了更广阔的数据中心场景。因此,驭数科技把预计未来1~2年能用到的功能都布进去,希望在接下来K2的应用过程中,不断完善软件等方面的支持,推动DPU芯片在数据中心的标准化。“我们很高兴在这个时点看到,现在的数据中心中的运营商对于DPU的需求正在逐渐走向一致,之前我们定义K2的时候,大部分已经预料到它核心的需求点,我们占了一定的先机。”鄢贵海指出。

DPU的路线之争:是FPGA还是ASIC

在DPU的发展路线方面,业界一直有关于是采用FPGA还是ASIC的路线探讨。譬如,全球行业的标杆英伟达采用的是ASIC路线,英特尔采用FPGA加速卡+ASIC的方式。

对此,鄢贵海认为,是选用FPGA还是ASIC,我觉得本身还是要看成本。当两者性能都可以满足一定要求的时候,就要看边际成本是不是够低,是不是可以做到一定的规模效应,保证它的生命周期。目前,业界的DPU运用FPGA的方式,我觉得也是一个阶段性的,DPU的应用场景相对比较多,对于一些特别细分的场景,尤其是那些对设备功耗要求没有那么高、功能也相对简单的场景来说,可能用FPGA就可以满足部分要求,而如果贸然用ASIC,虽然功耗降低了,但是整体的成本还是太高。

驭数科技从第一代芯片K1开始就采用自主研发的敏捷异构KPU芯片架构。鄢贵海指出,我们选择ASIC的路线本质上是ASIC的DPU是能产生规模化效应的,是能包含大量FPGA的方案覆盖不到的细分市场。ASIC芯片所能带来的优势它的边际成本比较低,性能优、功耗小。

ASIC是一条性能最好也是最困难的一条路,鄢贵海说道:“我觉得要把困难想在前面,一开始做的时候就得啃最硬的骨头,后面再做减法的时候才会游刃有余,不要开始就先专挑犄角旮旯去做,尤其在做对技术要求门槛比较高的创新性产品上。通过这种方式,才能让公司技术的积累有一个雏形,你的产品才会一代比一代完善,价值才会得到增加。如果反过来,你的积累看着多,光是积,但是累不起来,最后就会变得很散,散了以后产品就很难具有核心竞争力。”

什么时候做ASIC应该是每一家DPU厂商都会面临的一个问题。怎么选这个时间点?有两个方面的因素,一是内部因素,团队现在的技术积累是不是足以支撑做ASIC的产品;二是外部因素,芯片做出来用于什么场景中,企业必须准确地判断好外部条件的成熟度。

做一颗DPU不难,难的是跟上整个计算基础设施技术的演进

可能很多人看到,现在诸多的云厂商开始投入到DPU的研发中,云厂商能不能做好DPU?鄢贵海的观点是,答案不太好下定论,但我相信一点,DPU终将会成为一颗相对标准的芯片,会跟CPU、GPU一样,成为整个计算的基础设施里面的一部分。从这个角度来看,如果把DPU理解成一个应用型的芯片,那可能是应用厂商能做得好;而如果DPU的定位是在基础设施层的芯片,可能还是得由第三方来做。

从发展的眼光来看,对于一家DPU厂商而言,其实短时间内跟哪个厂商绑定的紧不紧,并没有那么重要。绑的紧并不代表它的方案就是最优的,可能绑的紧的目的就是为了短期拿个单子而已,这种思路不见得对DPU的发展具有生命力。鄢贵海认为,作为一家DPU厂商,要看到整个计算基础设施技术的演进,DPU的产品要随着这一技术的演变而发展,这才是让DPU最后真正变成核心的主流芯片的正确态度。

作为一个在DPU行业已经摸爬滚打了好几年的创业者,鄢贵海表示,DPU还是一个挺复杂的事情,虽然我们在这一块已经做了好几年,但我仍然觉得还有大量的技术难题需要攻克,绝对不是说铺500个工程师就能搞定的事情,需要随着整个应用的基础设施的改进而改进。做出一颗DPU本质上没有那么困难,但是要保证你的DPU的技术迭代跟上整个基础设施的演进步伐,这个是术业有专攻的。

据驭数科技的介绍,K2 DPU自2020年10月开始规划,到立项,再到完成代码、流片,前后投入小200人,历经差不多2年的时间,直到2022年12月,驭数科技这颗DPU芯片才成功完成点亮。

中科驭数联合创始人、高级副总裁(兼CTO)卢文岩也介绍道,整个K2项目进行了60余次方案评审,芯片前端进行了近40万行代码的开发;DPU是一个与应用密切相关的芯片,在研发阶段就要完成云原生、存储、金融计算、边缘计算等5大场景的应用的原型适配;在功能仿真和测试阶段要完成数千个验证和测试用例。 这还是在团队在芯片体系结构领域超过15年的技术积累,已经完成了第一代芯片K1,以及驭数在网络、存储、计算等领域积累的TOE、RDMA、NVMe-oF、大数据处理等功能核,技术积累的前提之下。

miui 13.5什么时候发布

有望成为最快规模化落地应用的国产DPU芯片

芯片从设计到流片回来,成功点亮,接下来量产,这些都不能算是真正意义上的成功。一个芯片产品要最终变成商品、实现规模化落地,才能真正发挥其价值。

在鄢贵海看来,DPU要想形成规模化的应用,很重要的一点就是,DPU必须要跟云厂商、操作系统厂商,以及服务器厂商等建立良性的联系,大家相互开放、做兼容。之前市场上没有成形的产品,厂商之间仅限于初步的交流,所以兼容很难做到很深。要想真正把生态搭建起来,需要有芯片产品真正进入这些现实的硬件平台中,供第三方生态厂商在上面做开发、测试。

在应用场景上,K2可以广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。

譬如在数据中心场景中,通过DPU去卸载云原生,中科驭数在整个行业中可以说是走在前列的,即使是对比英特尔。国内更是如此,尤其是通过DPU卸载方案在金融中心的商业化落地方面。

除了数据中心,5G方面,驭数科技也进行了各种探索和合作,这不仅包括国内的大部分集成商、曙光、联想、浪潮,还有些新兴的服务器集成厂商等都有相关的合作。可以说DPU主打的通用市场,典型的客户都与驭数有很多合作。

三星Galaxy tabs

“我们现在已经有了上量的条件,这将使得K2 DPU也有望成为最快规模化落地应用的国产DPU芯片。”鄢贵海谈道。

不容易形成垄断,DPU的生态是开放的

而规模化落地最大的挑战是应用,这就需要考验软件栈是不是成熟,兼容性是不是做的够好。对于DPU而言,DPU性能好不好取决于硬件,好不好用则是软件说了算。只要软件生态的兼容性做得好,很多上乘的应用都可以无缝迁移到上面,彻底打开DPU的应用窗口。

据张宇告诉笔者,跟GPU芯片不同,DPU面对的是不同的应用场景、不同的客户,从最终客户落地的应用场景来看,DPU不是一个垄断的行业,而是一个开放的、有事实标准的。DPU的生态更加开放。DPU的生态更多的是端,它的上端对接的是现在已有的各种开发平台,另外一端是真正对接到不同的DPU设备驱动层的东西。下面这一层是每家都自己做的,上面那一层开放的水平要比GPU清晰的多。只有开放,才能让更多的应用更方便地导入到DPU平台上面。

现在的app动不动就几个g

在软件方面,驭数科技于2022年12月8日发布了HADOS 2.0版本,这是国内第一个开放DPU软件栈,在系统适配性方面,HADOS完成了与十余个主流操作系统以及七种主流CPU架构的适配工作,为用户提供更多的自主选择权。驭数科技也正在与行业内的伙伴一起构建HADOS DPU生态的坚实基础,帮助开发者快速构建DPU应用和服务

HADOS全景视图(图源:中科驭数)

华为p50pro新官方消息

结语

中科驭数此次K2 DPU的成功点亮,是驭数DPU走向成熟的一大步,也是整个国产芯片又一重要的里程碑。K2将为行业提供一个比较完善的功能平台,对生态直接助力,也为接下来DPU生态扎根提供了一个很好的土壤。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

dpi芯片技术路线


返回网站首页

本文评论
在iPhone XS上能用AI做些什么?_怎么用ai做苹果手机
  美国当地时间周三,苹果公司(Apple)在其A系列处理器中推出了第二版“神经引擎”(neural engine),呼吁开发者在移动设备上为机器学习(ML)引入更多用例。这应该有助于在智能...
日期:07-23
荣耀X20来了,120Hz超窄边全视屏94.4%屏占比,视觉体验升级(荣耀x10有没有超广角)
  今天,荣耀X20正式官宣,产品将于8月12日19:30与荣耀Magic3、荣耀平板V7Pro等产品一同发布。8月4日10:08起,荣耀X20在荣耀商城、各大授权电商及荣耀授权门店已开启预约。苹果...
日期:07-10
Galaxy S5再曝光:2K屏幕+64位处理器
  上周三星举办了分析师日活动,公布了明年产品的大致规划,我们也从中推测了下一代旗舰产品Galaxy S5的相关配置。今天,台湾Digitimes的说法也验证了我们此前的猜测。  按照...
日期:07-26
三星高端手机人脸识别_曝三星新专利:支持屏下人脸识别系统
  9月28日消息,近日有传闻称,三星可能在开发一个新专利,而该专利是屏下人脸识别系统,其中包括两个屏下摄像头!  据专利介绍称,这就是从两个角度来获取使用者的多张图像,这样能...
日期:09-28
河北5G应用典型故事⑧:5G+智慧钢铁,让设备点检全程可追踪
打开手持5G点检终端设备,扫描点位二维码,激活“点检任务”,河钢唐钢新区点检员孙远成,开始了一天的设备点检工作。4月29日上午10时40分许,当孙远成到达厂区长材部棒材点检作业区...
日期:08-27
魅族16x蓝色版_黄章透露魅族16X手机:9月发布 配骁龙710
  8月8日,魅族发布了大家期待许久的新机,分别是魅族16th、魅族16th Plus,处理器补齐了之前煤油的遗憾,用上了高通骁龙845,而且是全系标配,同时还有屏下指纹,售价更是被激进的放在...
日期:07-23
三星Galaxy手表血压监测功能即将登陆马来西亚「三星手表galaxywatch3测量血压」
  从 Galaxy Watch Active 2 开始,三星就为其智能手表配备了血压监测功能,但该功能只在少数几个国家 / 地区提供。现在,三星将为更多的国家 / 地区提供这一功能,比如马来西亚...
日期:12-12
一加11pro配置详细_消息称一加 11R 将采用6.7英寸屏幕,搭载骁龙8+ Gen 1芯片
  9 月 30 日消息,今年 4 月 29 日,一加在海外推出了一加 10R 手机,该机作为一加 ACE 的全球版本,售价约 3377 元。今日,有消息人士带来了一加 10R 的迭代机型 —— 一加 11R...
日期:10-10
欧洲的iphone将使用c接口_跟进欧盟 印度市场要强制iPhone使用USB-C接口
每天分享科技热点!在欧盟之后,印度也开始计划在2025年3月开始强制要求在该国发售的手机必须具备USB-C接口了。根据Business Standard报道,印度消费者事务部秘书Rohit Kumar Sin...
日期:12-31
应用体验新概念 爱奇艺华硕高清平板“奇异果”势在必行
windows10系统自带小程序  根据Analysys易观智库产业数据库发布的《中国移动互联网数据盘点&预测专题报告2015》数据显示,2014年中国移动互联网用户规模持续增长,用户数达到...
日期:07-27
联想手机又一款良心优品诞生 滑盖全面屏仅售1998元「新款滑盖手机」
  随着科技的不断发展,用户与手机的黏性逐渐增强,用户普遍发现,较高的屏占比能带来更舒适的使用体验。近年来,手机厂商们在手机屏占比上不断创新,成为衡量厂商实力的重要方面。...
日期:07-24
智能投影科普:5秒自动方正,秒杀一切梯形校正_极米投影自动梯形校正
  “打开投影—进入设置—点击'梯形校正'—上下左右逐一手动校正”蒲公英远程局域网辅导作业被气死  这是大多数人在投影侧投时获得一个方正画面的路径,往往都比较繁琐。...
日期:07-23
天玑系列处理器跑分「ROG 6天玑至尊版手机官宣:安卓CPU跑分之王」
  今日消息,ROG宣布将于9月19日举行新品发布会,正式发布ROG 6天玑至尊版。  根据官方发布的预告片,ROG 6天玑至尊版的安兔兔综合成绩突破了114万分,其中CPU部分跑分接近30万...
日期:08-31
什么切入点更有利于国产品牌做硬件「什么切入点更有利于国产品牌做硬件设计」
三星学苹果支持用户下载广告拦截工具吗  最近一直在想一个问题,国产品牌做不好产品,是技术问题,还是态度问题。记得以前一个朋友说,国产汽车在一个关键部件上总是搞不定,一直没...
日期:07-28
华硕zenfonemaxprom1_华硕全面屏新机 ZenFone Max Plus发布
  11月29日消息,继推出全面屏新机飞马4S之后,华硕昨日又在俄罗斯发布了Zenfone系列首款全面屏手机——ZenFone Max Plus (M1)。黑色星期五电商活动ZenFone Max Plus发布520...
日期:07-22
airpods pro2橙色灯_AirPods Pro 2篆刻内容会弹窗显示!用户点赞苹果细节拉满
上周五,苹果的旗舰降噪无线耳机AirPods Pro 2已开始发售,首批用户已经用了几天时间。特斯拉semi卡车内饰虽然整体在外观和体验上,AirPods Pro 2与上代没有带来巨大提升,甚至初代...
日期:09-30
2015至2016苹果平板销量_平板市场销量连续四个季度衰退:苹果降 15%、华为联想降 25%、仅亚马逊增长!
平板电脑等电子产品的销售,在疫情期间曾一度飚升,不过随着疫情稳定及教育需求消退,未来趋势走向并不乐观。蔚来汽车股价今年涨幅据调研机构 Canalys 最新报告指出:平板电脑市场...
日期:09-19
英伟达rtx 40被曝「消息称英伟达RTX 40系已于8月开始备货 涉及4090/4080/4070」
IT之家 9 月 15 日消息,tweaktown 援引中国台湾消息人士称,英伟达下一代 GeForce RTX 40 系列“Ada Lovelace”GPU 即将发布,而渠道商几个月来也一直在囤积下一代显卡。今天香...
日期:09-16
华为胡厚崑谈5G_推进5.5G技术!胡厚崑:华为目标让10Gbps/s无处不在
近日,华为在泰国曼谷拉开了华为全联接大会2022全球之旅的帷幕。在大会上,华为公布了自己在数字化发展中的一些核心举措,其中就包括正在推进的5.5G技术。iphone14pro预计发售价...
日期:09-27
比大更大?微软规划新Surface Pro路线_surface发展
  Surface系列价格高,专用平板应用不足,微软Surface系列产品自推出后销量一直表现平平,Windows平板电脑第二季度只占全球平板电脑市场3%的份额。但12英寸Surface Pro 3的上市...
日期:07-27