您的位置:首页 > 互联网

英伟达与华为事件「黄仁勋:华为是英伟达在AI芯片领域“非常强大”的竞争对手」

发布时间:2023-12-06 14:14:51  来源:互联网     背景:

12月6日消息,英伟达首席执行官黄仁勋今日表示,在生产最好的人工智能芯片的竞争中,华为是英伟达“非常强大”(very formidable)的竞争对手之一。

周三,黄仁勋在新加坡接受采访时表示,华为、英特尔和不断壮大的半导体初创公司对英伟达在人工智能加速器市场的主导地位构成了严峻挑战。

华为英伟达合作gpu

“我们在中国和国外都有很多竞争对手,”黄仁勋说。“我们大多数竞争对手并不关心我们在哪里,无论我们走到哪里,他们都想与我们竞争。”

英伟达的芯片已成为人工智能热潮中最受追捧的商品,因为它们为训练大数据模型(例如支持ChatGPT的模型)提供了最有效的方法。

黄仁勋今日早间还表示,英伟达正考虑在新加坡进行重大投资。

12月5日,黄仁勋宣布,英伟达将在日本建立一个人工智能(AI)研究实验室,并在当地打造一个AI工厂网络。(易句)

延伸阅读:

猫鼠游戏中的英伟达

来源: 硅星人

自步入人工智能时代以来,中国一直是英伟达的大客户。

2022年,英伟达销售数据中,25%来自中国客户,尤其是一些互联网大厂,他们对英伟达的算力产品,比如H800,可以说是疯狂买买买。

但是随着美国在2023年10月更新了先进半导体和计算设备的出口管制,英伟达中国特供版GPU A800和H800都将在11月17号后禁止出口中国。而且更难处理的是,华盛顿新的出口管制下,几乎绝大多数高算力产品都不再能出口中国了。

不过英伟达有他们的小心思,25%的巨大收入来源不可能说断就断,所以英伟达决定要和美国政府来一场猫鼠游戏,要在这只猫的眼皮底下,偷走奶酪。于是英伟达开始布局一款新的产品——H20。注意,这个H20是“H”和“二十”,不是水分子的化学式。

H20这款产品的浮点运算能力仅有296TFLOPs,性能密度只有2.9。这意味着它从纸面上看已经是一款超低性能产品,然而有意思的事情来了,如此低性能的产品,依然有公司会买,而且它继续引发美国的监管部门以及英伟达竞争对手的恐慌。在硅星人此前的文章《》中已经提到,英伟达的美国对手批评它不够美国,而英伟达认为这些批评不合逻辑;而最近的消息是,美国商务部长Gina Raimondo又点名英伟达,警告它停止为中国设计绕过出口管控的AI芯片。

所以,这个猫鼠游戏里,英伟达到底是如何做的?

3A090里的文字游戏

3A090,是华盛顿出口管制中的ECCN编码物项。3A090特指特定高性能集成电路,当一颗芯片输入输出双向传输速率超过每秒600GB,或算力超过4800TOPS时就属于3A090,也就意味着禁止向中国出口。

上一次美国规定先进半导体出口措施的时候,英伟达旗舰产品A100和H100都被划在了禁止向中国出口的列表当中。英伟达当时采取的措施是推出低配版、但是同架构、且同样配备高带宽插槽版本(也就是SXM版本)的A800和H800。这两块产品在性能上和原版的A100、H100几乎完全一致,甚至连内存芯片用的也都是HBM2e和HBM3这种当时的顶级内存芯片。颇有种孙悟空和六耳猕猴的感觉。

在上一次禁令发布的时候,美国只是对产品的具体型号做出了禁止出口的规定,这才有了H800和A800这种李逵李鬼的情况。所以这次新规就加入了更为严格的限制,规定了算力总和以及性能密度,所有人工智能产业能用到的高端张量计算GPU全都被划进了限制。

说得更直白一点,高性能的GPU不让卖,低性能的GPU买了也没用。

然而有意思的事情来了,禁令所限制的两个词汇“性能密度”和“总算力”,其实是一个文字游戏。

什么是性能密度?国际上有两个说法,第一个是人工智能公司常用的,浮点计算能力FLOPs,也就是每秒浮点操作数除以单位面积内的晶体管数量得来的。第二个是MIPS,也就是每秒百万指令数除以单位面积内的晶体管数量得来的。

我们都清楚一个道理,那就是“大人时代变了”。就拿英伟达刚推出的新品H200所搭载的HBM3e来说,这颗芯片采用了一种3D技术,通过立体空间堆叠的方式增加内存。如果只按面积来说,那这颗芯片的性能密度就很高,但是要按体积算,这颗芯片的性能密度也挺高,只是没有按面积算那么高而已。所以如果想要性能密度这个数字越小,算的时候以体积为单位就可以了。毕竟除法嘛,分母越大结果越小。

另外MIPS通常比FLOPs大,因为在计算过程中除了浮点,还有整数类型(INT)的运算。而且浮点自己还囊括了单精度(32位)、双精度(64位)等以所需存储空间来划分的类型。因为传统FLOPs计算方式,往往只会统计单精度和双精度,因此一颗张量计算用的GPU,在数据测试的时候,也可以只报单精度、双精度的浮点,这样无论是它的MIPS还是FLOPs都会很低。毕竟除法嘛,分子越小结果越小。

总算力这块能玩的花活就更多了。总算力,这个词指的是每个核心的时钟速度总和。英伟达H20,或者说整个H系列所采用的Hooper架构,它都是有多种核心的,比如专门用来做张量计算的TensorFloat32核心,还有脑浮点(BF16)核心。那刚才咱们聊了,计算FLOPs时,可以只计算单精度,双精度,也就意味着它在算力总和的测试中,就可以只计算单精度和双精度核心,而不再启用上述的这些张量计算核心。毕竟自然数加法嘛,加数越少结果越小。

综上,作为一个算力芯片厂商,他们可以很简单地把芯片数据弄得很低。这只是一种可能的假说,因为英伟达的最终目的不是通过3A090的限制,他是要把产品卖出去,赚取利润。一个性能极低的产品根本没有市场销路,就算设计出来了也没有实际的价值。

H20背后的真正秘密

区区是一张中上游的游戏显卡RTX 4080,它的浮点运算能力都能达到320TFLOPs,同时RTX 4080的性能密度有6.8。H20尊为一个张量计算用的GPU,296的浮点和2.9的性能密度,就好像是一个超级富二代独生子,从出生开始就享受世界上最优质的资源,顿顿早餐吃的煎饼果子都能加俩鸡蛋,喝酸奶从来用不着舔盖,结果到头来算个10以内加减法都能把CPU干冒烟了。

英伟达向华为供货

英伟达向华为供货

极氪汽车公司官网

可我要是说H20的Die足足有814平方毫米,和H100完全相同,阁下应该如何应对?这并不是好钢用在刀背上,相反这正是H20的隐藏属性。也正因此,才让我更加相信,英伟达在H20的数据上,存在一些猫腻。

Die指的是芯片的裸晶,一般来说,越是性能优越的芯片,Die尺寸就会越大。比如RTX 4080的Die尺寸是379,而目前性能最好的游戏显卡RTX 4090的Die尺寸是609。因此,H20实际上并不是低端芯片,至少从芯片的制程来讲,H20是站在第一梯队的。

老鼠没有猫力气大,速度上也不占优势,如果老鼠不想被猫抓住,那就要想方设法地躲起来,不暴露自己。

诚然,H20的浮点运算能力很低,可是H20 SXM的内存足足有96GB,更恐怖的是它的带宽来到了4Tbps。相较之下,1979TFLOPs浮点运算能力的H100 SXM只有80GB的内存和3.4Tbps的带宽。在人工智能领域,尤其是现在火热的大语言模型中。内存是影响模型运行的关键,每10亿参数就要消耗3到5GB的内存,如果内存溢出则会严重影响模型的质量,产生不可预估的后果。那也就是说,在面对实际应用的时候,H20能比H100承担更大规模的大语言模型。

可能你会问了,H20的浮点运算能力不行啊,光有内存没用,跑的速度会慢。如果是2022年,那这的确是个大问题,毕竟没有人工智能公司会考虑低效率的GPU,这样做会拖垮整个训练过程。可是2023年,英伟达的TensorRT-LLM已经问世,并且拥有TensorRT-LLM功能的H200即将要在2024年发售了。

苹果线上线下质量一样吗

TensorRT-LLM是一个帮助GPU快速解决复杂计算的优化软件,搭载在GPU内部,类似于游戏显卡驱动一样。以H100为例,使用TensorRT-LLM后的H100,在对一些媒体网站进行文章摘要时的工作效率,比使用前快出整整1倍。而在700亿参数的Llama2上,前者比后者快77%。目前流通在市面上的A800也好,H800也好,都没有搭载TensorRT-LLM功能。H20很有可能,或者说板上钉钉的会搭载TensorRT-LLM。

英伟达虽然一直以硬件销售为主,然而其软件能力非同小可。比如DLSS,这是一种专门用来“欺骗”软件。不过DLSS所骗的目标并不是用户,而是显卡。当计算机需要大量图形计算时,DLSS会把图形以极低分辨率的形式交给显卡,它去骗显卡说:“你干这么点活就得了,剩下的不用你操心”,再通过DLSS技术还原成高分辨率的图形,这会大幅减轻显卡的压力,进而提升画面效果。

回到现在,TensorRT-LLM也是一个给GPU减压减负的软件技术,这就让GPU能够表现出本不该属于它的性能。此外,如果英伟达真的隐藏了H20的真实数据,实际上H20的表现力很有可能会超过H100。

你以为英伟达是壁虎,断尾求生。实际上英伟达压根不打算“阉割”,他们想的是换一种方式,绕过监管,达到目的。毕竟,如果H20算力很低,就算可以出口中国,也没有买家愿意购买这样的产品。当猫堵住了一个老鼠洞,老鼠还是能有办法溜出来,因为不可能只有一个出口。

不只是英伟达自己的猫鼠游戏

英伟达有个好朋友叫做SK海力士,英伟达最新旗舰产品H200 SXM上的内存芯片HBM3e,就是SK海力士的。目前他们正联手开发HBM4,以颠覆整个产业。英伟达也是SK海力士最大的客户之一,如果英伟达失去了中国市场,那么SK海力士的损失也会是巨大的。

最重要的是,GPU是一个横跨软硬件两个领域的事情,造就了一个附加值极高的交易体系。比如英伟达的Hooper架构,也就是H100、H200、H800、H20所采用的架构,多种同架构的GPU并联在一起,能够更好地分配计算资源。一般来说,人工智能企业都是买很多块GPU,而不是就买一块。所以当人工智能公司进行算力扩展的时候,GPU的第一个附加价值就体现出来了,它会要求人工智能公司只能接着购买该公司的GPU产品。

iqooz6国内最新爆料消息

第二个附加价值在于算法的开发,不同的GPU产品,比如AMD的MI,英特尔的Gaudi,他们的差别不只有浮点运算能力、性能密度这些,还有指令集、逻辑芯片、底层语言上的差异等等。一个能在H100上运行的算法,不一定就完美适配MI300X。换言之,如果开发伊始就是基于某公司产品的话,后续的开发大概率也只能基于同公司,甚至是同架构的产品。

第三个附加价值是反向的,由人工智能公司给予GPU公司。在算法的开发过程中总是会遇到各种各样的难题,当这些难题反馈给GPU公司时,GPU就会清楚下一代产品应该做怎样的改进。就比如上文说的HBM4,英伟达和SK海力士要非常清楚目前GPU在当前场景下还有哪些不足,才能做出足以颠覆产业的产品。

正是这些附加价值,绑定了GPU公司和人工智能公司,形成了复杂的裙带关系。所以英伟达不能失去中国市场,不单单是为了25%的销售额,还有比销售数字更重要的这些附加价值。中国的人工智能水平增长非常迅速,英伟达深知其中的利害。

在猫鼠游戏中,老鼠之间也会互相打配合,有些负责吸引猫的注意力,有些负责搬运奶酪。还有一点,猫和老鼠都明白两者虽然对立,但是存在着一个用来维持双方平衡的灰色空间,既不黑也不白,两者都能生存。猫不能一下子将老鼠全抓死,那样猫就失去了作用,老鼠也不能太猖狂,那样会压缩猫的生活空间。


返回网站首页

本文评论
科大讯飞 数字人「科大讯飞入股AI数字人公司良胜数字」
10月23日 消息:天眼查App显示,近日,良胜数字创意设计有限公司发生工商变更,原股东文旅旅游咨询有限公司、章群星退出,新增科大讯飞旗下安徽讯飞云创科技有限公司等为股东。罗永...
日期:10-23
红米note128g多少钱「Redmi Note 12 Turbo惊现“神价”:仅需1679元」
618电商大促近日拉开了大幕,令人惊喜的是,刚推出不久的新机型也纷纷推出了折扣力度较大的优惠活动。其中,Redmi Note 12 Turbo在京东自营旗舰店中出现史低价格,8 256GB版仅售167...
日期:06-08
中兴声明:将按计划参加MWC20,展示5G技术和终端_中兴2020 5g
  2月5日消息 今天早些时候,美国科技媒体The Verge报道,中兴通讯今日证实将取消其在MWC20上的新闻发布会,原因是受到中国新型冠状病毒爆发的影响。现在,中兴的推特账号发文进...
日期:12-04
siri太蠢了「Siri 们的“智障”终于有救了?」
“今天北京比上海热吗?”摸着良心讲,问这个问题的时候,并没有想刁难Siri。但是Siri它就是回答不上来。“今天似乎是晴天。”Siri天真(但驴唇不对马嘴)地回答,配以用户所在的上海的...
日期:04-30
更新iOS17后位置服务自动开启?苹果称正调查部分用户诉求_苹果手机定位服务打开的 但是位置不更新
9月25日 消息:据外媒报道,苹果正在调查部分iPhone用户报告称,更新iOS17后,其重要位置服务和iPhone分析选项被自动打开的问题。据悉,这两项功能原本在用户的“设置”中是关闭状态...
日期:09-26
华为Mate60 RS主板维修价格为6999元_华为mate主板坏了修要多少钱
华为Mate60 RS 非凡大师手机今日正式上市销售,其起售价格高达11999元人民币。尽管如此,仍有超过200万消费者进行预约购买。值得注意的是,华为Mate60 RS 非凡大师的维修价格也在...
日期:09-30
网络动态(网络动态表情包)
  怎样恢复微信聊天记录?如今这个互联网的世界,微信成为我们重要的社交工具,我们可能使用它跟我们的父母聊天语音、视频,也可能使用它跟朋友谈天说地。如果一些重要的微信聊...
日期:12-13
将成未来计算平台的核心 Meta重申元宇宙地位
据报道,Meta全球事务负责人尼克·克莱格(Nick Clegg)在Meta的Horizon Workrooms中重申会继续发展元宇宙,计算的未来将发生在这个仍未被充分定义的虚拟世界中。虽然如今的元宇宙...
日期:10-04
“贱卖”推特家产,拟让特斯拉填“窟窿”,痛失全球首富头衔…收购推特,还会给马斯克带来什么麻烦?
  记者/文巧; ;  编辑/兰素英;;  近日,在一家拍卖网上,原本价值几千上万美元的办公设备和家具电器,通通仅以25美元或50美元起售,而这些资产正是来自备受关注的推特。  ...
日期:12-13
天玑9200处理器发布 联发科股价起飞「联发科天玑1200跌落神坛」
联发科日前发布了新一代旗舰处理器天玑9200,不仅发布时间比去年更早,而且上市更快,vivo已经确定首发,X90系列预计本月份就会第一个用上天玑9200处理器。天玑9200升级了工艺、CPU...
日期:11-15
前程无忧没有迁移总部的打算 否认年底裁员_前程无忧招聘职位已过期
  日前有消息称,国内互联网招聘三巨头之一的前程无忧将在今年底实施“减员增效”计划,且正考虑将公司总部从上海搬迁至武汉。   昨日(12月29日),前程无忧上海总部相关负责人...
日期:07-25
即将跌入“幻灭的低谷”,Gartner报告称生成式AI已达到“膨胀预期峰值”
8 月 17 日消息,市场调查机构 Gartner 近日发布报告,以生成式 AI 的炒作周期(Hype Cycle)来看,目前已达到“膨胀预期峰值”。谷歌游览器小恐龙该机构将生成式 AI 的炒作周期划分...
日期:09-17
rtx2060守望先锋帧数「《守望先锋:归来》将上线!NVIDIA新驱动适配:RTX 40系狂飙360帧」
今天是暴雪《守望先锋》生命的最后一天,这款6年经典之作将于今晚正式停服。不过,这并不是结束,而是新的开始。续作《守望先锋:归来》将于10月5日正式上线,其客户端预下载现已开启...
日期:10-08
华为鸿蒙OS 3 Beta版升级名单出炉:7款机型 2年前老机型也在列「华为鸿蒙OS可升级名单」
华为官方公布了最新一批的华为鸿蒙OS 3 Beta版的尝鲜机型名单,其中增加了7款新的机型,最早的有2年前的老机型也可以升级。升级名单中手机包含了:nova 9 SE、nova 8、nova 8 Pro...
日期:10-12
空客生产的最后一架a300「第 600 架中国制造空客 A320 系列飞机交付」
IT之家 9 月 23 日消息,今日,空中客车宣布交付由位于天津的空中客车 A320 系列飞机亚洲总装线完成总装的第 600 架飞机。这架 A320neo 飞机配备 CFM 国际公司 Leap-1A 发动机,...
日期:09-26
2023中移大会,中兴终端联合秀出创新科技产品_中兴通讯中标中国移动
10 月11- 13 日,2023“数实共生,算启新程”中国移动全球合作伙伴大会在广州举行。中兴通讯以“兴算力,智生长”为主题,携最 新合作亮点成果以及年度重量级产品亮相大会。中兴终...
日期:10-12
乐Phone、iPhone贴身肉搏谁能最终胜出?
  今年4月,联想发布新品时,“乐Phone”首次在大众面前亮相,联想掌门人柳传志明确发出对苹果iPhone的挑战宣言:“联想下定决心要和 iPhone背水一战.”坊间在佩服老柳勇气...
日期:07-29
60真机谍照曝光_双色拼接设计+居中大圆环后摄 「大杀四方-华为Mate」
此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将迎来更新,全新的华为Mate60系列将正式与大家见面,更有数码博主给出了9月12日...
日期:09-09
华为数字资产继承功能发布 每个账号可设置5位继承人_华为继承人制度
凤凰网科技讯 8月5日消息,在华为开发者大会2023(HDC.Together)上,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东正式发布了数字资产继承功能,HarmonyOS提供了安全便捷...
日期:08-05
欧普照明点亮未来_欧普照明:点一盏创新之灯,开启自在未来
  “超越所见”,走在欧普照明的吴江厂区,随处可见这四个大字。它或是被悬挂在林立于厂区道路的灯杆上,或是被放置于办公大楼里最显眼的位置。   如果对欧普照明没有足够...
日期:08-28