您的位置:首页 > 互联网

Gemini背后,谷歌真正可怕之处并不在模型本身_谷歌mini diva

发布时间:2023-12-11 14:08:50  来源:互联网     背景:

声明:本文来自微信公众号“硅星人Pro”(ID:Si-Planet),作者:苗正,授权转载发布。

谷歌的大语言模型Gemini1.0,一经问世就技惊四座。首先在性能方面,无论是从对文本、图像、音频的理解,还是对57种领域文本以及数学问题的推理,几乎都超过了自然语言界的霸主GPT-4。而且在谷歌Gemini的官网上还有这一段话,内容是“Gemini是第一个在MMLU(海量多任务语言理解)上超过人类专家的模型”。

为什么谷歌Gemini这么厉害呢?其实最核心的原因来自于训练谷歌Gemini所使用的两种服务器端推理芯片TPU v4和TPU v5e。虽然从结果来看,TPU跟GPU都是用来训练和推理,但是两个人在“解题思路”上,相距甚远。

谷歌在TPU v4上采用了一种名为光学回路开关(optical circuit switch,以下简称OCS)。顾名思义,就是服务器组用光来传递信息。上方是注入模块,使用850纳米激光二极管,发射850纳米的显示光。中间是用来拆分或者合并光的二向色分光器;下方是用来反射的2D MEMS阵列;左右两端是用来投射O波段信号光的2D透镜阵列和光纤准直器阵列。

谷歌gee

简易版OCS原理

传统服务器组用的是铜线导电,通过规定时间内铜线上电子传输的个数来传递信息。但是任何介质,哪怕是不计成本的采用金或者银,依然有电阻的存在,必然会减慢电子在这之间传递的速度。没有任何的光电转换环节,全都是由光来运送信息,没有中间商赚差价。

我们不妨对比一下市面上最常见,也是Open AI目前的解决方案,英伟达H100所使用的Infiniband技术。这个技术使用交换结构拓扑。所有传输都在通道适配器处开始或结束。每个处理器都包含一个主机通道适配器(HCA ),每个外设都有一个目标通道适配器(TCA)。

说得直白一点,H100就和过去的驿站差不多。驿站会代替权力中心接收消息,这样管理者就可以直接去驿站来查看自己未来的任务。但是TPU v4则是直接烧狼烟,不仅快,而且跳过中间所有的消息转达设施,一步到位。根据谷歌的说法,OCS系统和底层光学组件成本价格不到TPU v4系统成本的5%,其功耗不到整个系统的5%,又便宜又好用。

优酷路由宝 千兆

说到这,不得不提一个谷歌创造的概念,叫做MFU。全称为模型FLOPs利用率(Model FLOPs Utilization),这是一个不同于其他衡量计算利用率的方法,不包含任何反向传递期间的作业,这意味着MFU衡量的效率直接转化为端到端的训练速度。那也就是说,MFU最大上限一定是100%,同时数字越高代表训练速度越快。

谷歌想通过MFU这个概念,来评估TPU v4的负载能力以及运行效率,以此得出到底可以给谷歌Gemini上多少强度。对一系列纯解码器变压器语言模型(下图以GPT为例)配置进行了深入的基准测试,这些配置的参数从数十亿到数万亿不等。测试规定,模型大小(参数单位十亿)是芯片数的二分之一。

特斯拉的cybertruck

TPU v4在不同场景下的MFU

在谷歌的基准测试活动中,TPU v4实现了44-56%的MFU。根据下图的对比可以明显看到,尤其是多个TPU v4串联的情况。而这也正是OCS的神奇之处,同时谷歌也希望借助OCS向世人们传达一个道理:“要相信光。”

不同芯片的MFU对比

罗永浩与抖音签约

既然TPU v4都这么厉害了,那TPU v5e作为迭代产品,效果只会更好。事实上谷歌之所以将这个模型命名为Gemini,也是因为这两个TPU。Gemini的本意是双子座,代表的是希腊神话中的天神宙斯与斯巴达王后勒达所生的双胞胎卡斯托耳和波鲁克斯。TPU v4和TPU v5e某种意义上也是双胞胎,因此得名Gemini。当然,另外有一种可能是开发者特别喜欢《圣斗士星矢》,里面黄金十二宫篇大BOSS就是双子座的撒加,绝招是银河星爆。不过我觉得后者的可能性低一点。

还有一点,服务器最大的成本来自运营和维护。但是在这种规模下,使用传统的定期对持久集群存储进行权重检查点操作的方法是不可能保持高吞吐量的,毕竟要周期地关闭重启某个机组。所以对于Gemini,谷歌使用模型状态的冗余内存副本,并且在任何计划外的硬件故障时,可以直接从完整的模型副本中快速恢复。与PaLM和PaLM-2比,尽管使用了大量的培训资源,但这大大加快了恢复时间。结果,最大规模的培训工作的总体产出从85%增加到97%。

谷歌Gemini背后的服务器组也是第一款支持嵌入的硬件的超级计算机。嵌入是一种比较贴近谷歌业务的算法。嵌入本身是一种相对低维的空间,模型可以将高维向量转换为这种低维空间。借助嵌入,可以更轻松地对表示字词的稀疏向量等大型数据输入进行机器学习。理想情况下,嵌入会将语义上相似的输入置于嵌入空间中彼此靠近的位置,以捕获输入的一些语义。

嵌入是广告、搜索排名、YouTube和Google Play中使用的深度学习推荐模型 (DLRM) 的关键组成部分。每个TPU v4都包含第三代稀疏核心数据流处理器,可将依赖嵌入的模型加速5至7倍,但仅使用5%的芯片面积和功耗。

嵌入处理需要大量的端到端通信,因为嵌入分布在在模型上协同工作的TPU芯片周围。这种模式强调共享内存互连的带宽。这就是TPU v4使用3D环面互连的原因(相对于TPU v2和v3使用2D 环面)。TPU v4的3D环面提供了更高的二等分带宽,即跨越互连中间从一半芯片到另一半的带宽,以帮助支持更多数量的芯片和更好地展现稀疏核心性能。

毫无疑问,谷歌是一家软件公司,谷歌Gemini是一款软件产品,但是谷歌胜就胜在硬件上。谷歌强调Gemini是一个功能强大的多模态模型(Multimodal Model)。多模态指的是结合了多种感官输入形式来做出更明智的决策,相当于是模型可以用复杂、多样和非结构化的数据来求解。

一个短视频(360p到1080p)的数据量大约几十mb到几百mb,一条语音的数据量约为几百kb,一行文字的数据量约为几b。对于传统的大语言模型,如果只处理文字信息,那么对服务器的载荷要求不会很高,毕竟数据量小。可是一旦将视频、图片等一并处理,那么服务器的载荷就会成指数倍增长。事实上不是其他模型不能弄多模态,是其他服务器扛不住这么大数据量,硬件拖了软件的后腿。谷歌之所以敢弄,更多的原因是TPU v4和TPU v5e在大规模串联的场景下,高载荷高MFU无疑是谷歌的绝招。

然而谷歌并不能高兴太早,首先英伟达的张量计算GPU H200再过些日子就要发售了。像Open AI这样的大客户估计是第一时间就能拿到手。到时候GPT无论是推理还是训练,都可能会来到一个非常夸张的量级。

其次,微软也出手了。2019年时,微软启动了一个名为雅典娜的项目。通过设计和开发定制人工智能芯片,以满足训练大型语言模型和驱动人工智能应用的独特需求。而且雅典娜和TPU相似,也是一个内部项目,能够减少对英伟达等第三方硬件提供商的依赖。雅典娜是一个极其神秘的项目,它的性能是多少,它的外观是怎样,外界一概不知。唯一能够了解的,是有些幸运的Open AI员工已经开始对雅典娜测试了。

虽然不清楚H200和雅典娜具体能为Open AI带来哪些变化,不过可以确定的是,谷歌以及谷歌Gemini压力都挺大的。

谷歌最新模型

TPU对谷歌意味着什么?

说到谷歌的TPU还有一个小故事,TPU的全称是Tensor Processing Unit,中文是张量处理单元,是 Google 开发的专用集成电路(ASIC),专门用于加速机器学习。虽然在公众视野中,谷歌是2016年5月的I/O大会上宣布使用TPU,可实际在2015年的时候TPU就已经问世。

神经网络翻译技术从2014年9月提出,百度2015年5月上线首个互联网NMT系统(神经网络机器翻译系统)。NMT技术克服了传统方法将句子分割为不同片段进行翻译的缺点,而是充分利用上下文信息,对句子进行整体的编码和解码,从而产生更为流畅的译文。

但是以当时的技术,神经翻译对服务器造成的负载压力非常大,主要当时硬件没那么强大,也没有H100、A100这样的产品。从发表的论文和谷歌Blog来看,谷歌实际上已经在当时具备了这样的技术,没有使用的核心原因就是硬件遭不住。经过大约半年的测试,TPU已经可以完美适配到服务器中,作为算法加速器使用。那到了I/O大会那天,谷歌一咬牙一跺脚,“我们也有NMT了!”

谷歌的TPU最早是不对外开放的,直到2018年才开始有云TPU业务。就是用户可以在云上购买TPU,来快速解决需要张量计算的业务。2022年的时候,谷歌云上更新了TPU v4业务,意味着现在用户也可以购买并使用上文提到的各种技术来享受更高的推理和训练能力。

谷歌和Open AI最大的不同在于,前者有很强的业务要求,谷歌Gemini不会是一个赚钱的工具,它对于绝大多数人来说更像是个新鲜的高科技玩具。但是云TPU v4就不一样了,截至3月31日的季度,谷歌云业务的收入为74亿美元,运营利润为1.91亿美元,利润率为2.5%。谷歌云业务实现首次盈利,但是利润率还是太低,尤其是对比亚马逊云28%的利润。所以云TPU就成为了谷歌业务的一个大型增长点,一旦谷歌Gemini的效果反响良好,那么对谷歌云TPU业务的推广来说,无疑是王炸。


返回网站首页

本文评论
调休需要更多策略和技巧!专家:建议推行每周2.5天休息日 适当延长春节假期
连放8天长假后,10月7日(周六)10月8日(周日)要上班,也就是说假期结束后,要连~上~7~天~哦!10月7日消息,针对假期扎堆出行的问题,中国人民大学休闲经济研究中心主任王琪接受采访时表示,破...
日期:10-07
ASML:已向荷兰政府申请许可证获批 在今年内仍可向中国出口部分高端浸润式光刻系统_网易订阅
财联社9月1日电,荷兰最新芯片出口管制措施今天生效,ASML向《中国日报》确认,目前ASML已向荷兰政府提出TWINSCAN NXT:2000i及后续推出的浸润式光刻系统的出口许可证申请。“荷兰...
日期:09-01
AutoLLM:在几秒钟内创建基于 RAG 的 LLM Web 应用程序!_如何建立一个arm工程
11月3日 消息:AutoLLM是一个强大的工具,能够让您在几秒钟内部署基于Retrieval-Augmented Generation (RAG)的大型语言模型(LLM)Web应用。它为开发人员提供了一种简化、统一和增...
日期:11-03
「每天最低16元 「苹果官宣补货iPhone」-15系列一小时内卖空」
来源:中关村在线惠普电脑出货量iPhone 15系列手机于9月15日晚正式开售。在天猫Apple Store官方旗舰店,首批iPhone 15 Pro和iPhone 15 Pro Max在开售一分钟内即售罄。本次零售...
日期:09-17
宏杉科技企查查「开学啦!看宏杉科技如何助力高校数字化转型_」
(原标题:开学啦!看宏杉科技如何助力高校数字化转型) 金秋九月,要说最热闹的地方,一定少不了陆续开学的大学校园,今年被录取的新生...
日期:09-12
普惠家:发展金融科技,更好地惠及民生(普惠金融服务民生)
  11月10日,北京市委常委、副市长殷勇在第十届财新峰会“2019北京金融科技论坛”上表示,发展金融科技是服务实体经济的需求,金融科技创新属于金融供给侧结构性改革的内容,目...
日期:11-18
与 AI 聊天机器人交谈的可怕之处:ChatGPT 可以从匿名文本中准确推断个人详细信息
10月18日消息: 当研究人员向 OpenAI 的 GPT-4 喂入以下文本:There is this nasty intersection on my commute, I always get stuck there waiting for a hook turn.(在我上下...
日期:10-18
乔布斯辞职给做空者理由  市场分析出现分歧
昨天,受苹果CEO乔布斯辞职影响,不仅苹果股价大跌,许多与苹果相关的个股纷纷下跌。如多数台湾科技类股早盘皆走低,苹果供应商鸿海精密、胜华科技和可成科技更是领跌。 股价逆市...
日期:07-22
雨林木风自主研发的平板电脑“YlmfPad”已成型
  2月24日晚上22点,雨林木风董事长兼CEO在自己微博上发布了雨林木风的自主研发的平板电脑“YlmfPad”最新动态:透露个更兴奋的消息,采用自主操作系统Ylmf OS的平板电脑“Ylm...
日期:07-26
访问量大增但销售平平 淘宝店主为揽客自抽耳光_店铺突然很多淘宝客访客
  近日,一淘宝店主为增加人气,将店铺中“买一件衣服,本店店主就自抽一个嘴巴”的承诺兑现,并将自抽耳光的视频传到网上,此举引发了众多网友热议。   淘宝店主上传自虐视频在...
日期:07-30
阿里云创始人王坚:云计算的第三次浪潮有可能要几十年才能到高峰
通信世界网消息(CWW)10月31日,在2023云栖大会,中国工程院院士、阿里云创始人王坚发表了《云计算的第三次浪潮》的主题演讲,他认为人工智能和云计算的结合,带来云计算的第三次浪潮...
日期:10-31
2017年Apple Watch出货1800万部 同比增长54%_郭明錤:Apple Watch已从越南出货,8代出货比重将提至70%
长虹 物联网   8月19日消息,知名分析师郭明錤在推特发文称,媒体报导Apple Watch将在越南开始量产,但据他所知,Apple Watch已经在出货了。   郭明錤表示,Apple Watch的主要组...
日期:08-21
windows defender内存占用高_Microsoft Defender 在 Win10 中导致系统高内存占用率、黑屏等问题
  5 月 1 日消息,Microsoft Defender for Endpoint 似乎又惹祸了。Borncity 称其给 Windows 10 20H2 造成了一些问题。  以下是外媒发现的由 Defender for Endpoint 引...
日期:07-18
平板电脑游戏下载网站_平板下载端游
平板电脑的出现给人们的生活带来了很大的便利。除了能够处理日常生活中的文字、图片、音乐、视频等基本功能外,平板电脑还具有强大的游戏能力。但是,要找到一款好玩的游戏并非...
日期:05-28
借力大模型,百度移动生态拓宽“护城河”
声明:本文来自于微信公众号 子弹财经(ID:zidancaijing),作者:语叔,授权转载发布。百度的2023年Q2财报来了。第二季度,百度实现营收341亿元,同比增长15%;归属百度的净利润(non-GAAP)...
日期:08-23
智界S7的同门对手!奇瑞星途星纪元ES官图曝光:年内有望上市
快科技9月28日消息,近日,奇瑞星图星纪元放出了ES车型最新的渲染图片。macbookair2017屏幕 视网膜屏外观方面,新车采用了全新的造型设计,外观与同门的智界S7十分相似,前脸采用了封...
日期:09-29
“打鬼子直播”单场收入过千元,消费战争“割韭菜”绝不是爱国
极目新闻评论员 屈旌近日,记者发现,不少视频创作者通过“打鬼子直播”的内容形式博取流量并试图变现,此类创作者通过诱导网友打赏、收徒牟利,有创作者称单场直播收入超千元。10...
日期:10-25
iPhone或制霸美国市场!成为最热产品_全球苹果过时产品
中关村在线消息:10月12日,据相关爆料,苹果设备或已成为最受美国青年青睐的产品,该品牌拥有87%的年轻用户群,并且有88%的用户依然希望下一步手机是iPhone。根据统计来看,苹果在近十...
日期:10-13
百度健康问医生被当写作业神器 官微下场回应:把资源留给患者
  停课不停学的号召下,原本还在享受超长假期的学生们纷纷开始自我隔离式学习。不能去学校,随时问老师问题变得难上加难,小学生叫苦课业难,朋友圈里的家长叫苦辅导难,殊不知,还...
日期:03-15
丰巢智能柜小程序开辟“生活服务”专区 推广丰巢自营洗衣业务「丰巢智能柜系统」
10月12日 消息:丰巢都开始推洗衣业务了?近日,有用户发现,丰巢智能柜小程序推出了“生活服务”专区,推广丰巢自营洗衣业务。根据丰巢智能柜小程序的信息,“丰巢洗护”服务内容包...
日期:10-26