您的位置:首页 > 互联网

谷歌“复仇”OpenAI:万亿参数大模型性能碾压GPT-4,语言理解首超人类_复仇首次扩展

发布时间:2023-12-09 17:30:43  来源:互联网     背景:

出品 | 科技

作者 | 梁昌均

复仇首次扩展

特斯拉有啥优惠

过去一年,被OpenAI持续吊打的谷歌开启“复仇”。今日凌晨,谷歌正式发布其人工智能大模型Gemini,宣称全面碾压GPT-4。

“Gemini是我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示。

根据谷歌给出的基准测试结果,Gemini在多项测试中完全击败了OpenAI的GPT-4。可以说,Gemini是目前唯一宣称全面超越GPT-4的大模型。

这也意味着,虽然大模型热度有所降温,但科技巨头围绕大模型的技术竞争仍在继续。在谷歌的持续追赶及Meta开源联盟的围堵下,OpenAI-微软联盟也面临越来越大的压力。

万亿参数,30多项性能测试超GPT-4

这是谷歌历时半年多的攻坚成果。今年4月,谷歌合并谷歌大脑(Google Brain)和DeepMind两个内部团队联合攻关Gemini,DeepMind联合创始人、CEO戴密斯·哈萨比斯(Demis Hassabis)成为Gemini团队带头人,并和谷歌搜索等团队开展了合作。

Gemini被定义为多模态模型,可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。公开信息显示,Gemini具备万亿参数,算力高达1e26 FLOPS,是GPT-4的5倍多,总数据集也是GPT-4的两倍。

谷歌Gemini有三种不同版本:Gemini Ultra、Gemini Pro和Gemini Nano。这些模型适用于不同的场景,Gemini Ultra用于处理高度复杂任务,Gemini Pro用于扩展各种任务,Gemini Nano则可用于手机等终端设备。

哈萨比斯称,这是AI发展过程中的一座重要里程碑,也标志着谷歌迈进新纪元的开始。同时,Gemini也是谷歌迄今为止最灵活的模型,从数据中心到移动设备,它能够在所有设备上高效运行。

根据谷歌公布的测试结果,从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的32项学术基准中,Gemini Ultra的性能有30项都超过了目前最先进的水平。

在MMLU的大规模多任务语言理解测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家,也超过得分率为86.4%的GPT-4。在推理、数学和代码等多项核心能力的基准测试中,Gemini Ultra都高于GPT-4。

复仇首次扩展

MMLU是美国俄亥俄州立大学等多所机构研究人员联合推出的大规模、多学科、多模态理解和推理基准测试,综合使用数学、物理、历史、法律、医学和伦理等57个科目,用于测试大模型世界知识和解决问题的能力。

此外,在图像等多模态基准测试中,Gemini Ultra表现也优于GPT-4。在MMMU基准测试中,Gemini Ultra图像得分率达59.4%,高于GPT-4V的56.8%,其余5项测试中也均高于GPT-4V得分。同时,在视频和音频的多数基准测试中也超过GPT-4V。

哈萨比斯认为,这些基准测试凸显了Gemini 的原生多模态性,并显示出Gemini具有更复杂推理能力的潜力。“它拥有通过阅读、过滤以及理解信息,从数十万份文件中提取见解的卓越能力,将有助于在从科学到金融等多个领域以数字化速度实现新的突破。”

目前,业内创建多模态模型的标准方法是分别训练不同模态的组件,然后将它们拼接在一起,以粗略模拟某些功能。这些模型有时可以很好地完成描述图像等特定任务,但在概念性更强、更复杂的推理方面却显得力不从心,这也是目前很多追赶GPT-4的模型所面临的技术挑战。

为此谷歌将Gemini 设计为原生多模态,从一开始就在不同模态上进行预训练,然后利用额外的多模态数据对其进行微调,以进一步提高其有效性,这正是Gemini优于现有多模态模型的关键所在。

谷歌还发布了其迄今为止功能最强大、效率最高且可扩展性最强的TPU系统Cloud TPU v5p。过去数年,谷歌虽然依靠英伟达芯片,但也在持续自研以TPU为核心的AI芯片。随着新算力系统的发布,这将能更快训练下一代大模型,更快推出新产品和新功能。

此外,在AI安全方面,谷歌称Gemini 也进行了全面的安全评估,对网络攻击、说服力和自主性等潜在风险领域进行了研究,在对抗测试、内容安全等方面采取了基准测试、过滤器等方法,以此来应对关键的安全问题。

谷歌开启“复仇”,OpenAI和微软联盟承压

Gemini的推出是谷歌一次真正意义上的“复仇”。

在今年的大模型竞赛中,谷歌多次被外界批评犹疑不决,技术和产品进展长时间也被OpenAI吊打。最先匆忙推出的对标ChatGPT的Bard因演示翻车,谷歌蒙受1000亿美元的市值损失。

后来在5月的I/O 大会上,谷歌宣布推出对标 GPT-4的大模型PaLM 2,但透露出研究重心正在转向 Gemini。显然,PaLM 2更多是试水,而Gemini才是真正的杀手锏。

在AI领域有着长期投入的谷歌并不愿意缺席这场变革,正如皮查伊所说,AI将是影响最为深远的变革,影响力远超过移动技术或互联网。

他认为,AI有着为世界各地的人们创造机会的潜力,它将带来新一轮的创新和经济进步,并以前所未有的规模推动知识、学习、创造力和生产力的发展。

Gemini团队带头人哈萨比斯同样是AI的信仰者,把AI当作毕生工作的重点。他是一位少年天才,16岁就进入剑桥大学,2010年联合创立DeepMind ,在其被谷歌收购后进入谷歌,并主导推出了打败人类的围棋机器人AlphaGo。

“从少年时为电脑游戏编写AI程序,到多年来作为神经科学研究员试图了解大脑的工作原理以来,我始终坚信,如果能制造出更智能的机器,我们就能利用这些机器以不可思议的方式造福人类。”哈萨比斯表示,AI将不再仅仅是一款智能软件,它将更加有用且直观,就像是专业的帮手或助理,而Gemini的推出离这一愿景又近了一步。

为此,谷歌将开启广泛的Gemini落地计划。谷歌聊天机器人Bard 将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等,这是Bard推出后最大的升级,并将在170多个国家和地区提供英语服务,未来还会扩展不同模态,并支持更多的语言和地区。

谷歌还会在手机硬件上搭载Gemini,手机大模型正在成为行业趋势。Pixel 8 Pro会是首款搭载Gemini Nano的智能手机,将具备录音应用的总结等新功能,Gboard推出智能回复功能,WhatsApp也将从明年推出更多信息应用。

此外,谷歌表示,未来几个月,Gemini 还将应用于更多产品和服务,如Search、Ads、Chrome 和Duet AI。目前,谷歌已开始在搜索中测试Gemini,并带来了更快的搜索生成体验,用户在美国的英语搜索延迟降低40%,质量方面也有所提高。

除内部产品,谷歌还将Gemini的能力开放给开发者。从12月13日开始,开发者和企业客户可以通过Gemini API获取Gemini Pro,安卓开发者可以通过AICore使用Gemini Nano。性能最为强大的Gemini Ultra还在进行大规模的信任和安全检查,将在明年初开放使用。

随着谷歌Gemini的推出,压力也来到了OpenAI这边。过去一年里,OpenAI先后推出GPT-4、GPT-4Turbo等大模型,此前还推出名为GPTs的服务和GPT Store等商业化布局。早前持续数日的内部“政变”虽然以山姆·奥特曼回归终结,但也让OpenAI的未来发展蒙上一层阴影。

和OpenAI结盟的微软则也在持续推进新模型的落地。这周稍早前,微软官宣庆祝人工智能助手Copilot诞生一周年,并公布了即将推出的新功能,包括支持GPT-4 Turbo、更新DALL-E 3 模型、增添新的代码解释器功能,以及必应内部的深度搜索功能等。

谷歌Gemini的推出将在技术层面超过OpenAI-微软联盟,这可能会吸引更多用户。相比OpenAI,谷歌拥有更多的全球用户,尤其是手机等硬件终端用户,且自身拥有海量的实时数据,整体生态上更具优势,而OpenAI目前还更多依赖微软。

OpenAI和微软还越发面临开源联盟压力。Meta、IBM、AMD、英特尔等50多家公司和研究机构这周宣布成立人工智能联盟,旨在推动AI开放。该联盟将OpenAI、微软、英伟达等排除在外,多数成员都支持开源大模型,因此也被视为以Meta为首的开源对闭源的OpenAI的集体阻击。

目前,微软、谷歌在大模型上的投入尚未给其带来明显的业绩贡献,但技术竞争、商业布局仍将是这些巨头之间无限的追逐游戏。


返回网站首页

本文评论
马斯克欲在推特上线余额宝功能!利息巨高「马斯克 比特币 推特」
中关村在线消息:11月10日,据相关爆料,推特新老板埃隆·马斯克表示,他计划把推特打造成一个人们可以在这里购物,甚至提供货币市场账户的地方。这个计划有些像支付宝之前推出的余额...
日期:11-11
网友建议退订短信由营销发送方承担资费 工信部回应:将认真研究
快科技9月16日消息,大多数手机号都会经常收到商家各种营销短信,这些短信大多以回复TD退订”、退订TD”等结尾,每条营销短信你有回复退订过吗?今年7月,有网友在人民网领导留言板块...
日期:09-16
阅文集团财务分析_阅文集团上半年营收40.9亿元 净利6.7亿元基本持平
pixel 6 发布淘宝店铺可以卖药吗 查看最新行情   讯 8月15日下午消息,阅文集团今日发布截至6月30日的2022年上半年财务报告。财报显示,2022年上半年,阅文...
日期:08-16
定了:iQOO Neo7系列首发天玑8200 现已上架「天玑810首发」
iQOO Neo系列新品Neo7 SE在京东自营店上架,新机将会在12月2日发布,目前已经确定首发联发科天玑8200,发布时间也早于Redmi K60,成功拿下首发。天玑8200集于台积电4nm工艺制程打造...
日期:11-28
5g 人工智能_AI为核、5G驱动 中智行打造无人驾驶中国技术路线
  无人驾驶技术的研究可以追溯到十九世纪二十年代,但直到十九世纪八十年代,才有一辆真正自动化的汽车在完全封闭的道路上实现了60迈的行驶。2009年,谷歌开始秘密研究无人驾...
日期:05-26
咖啡与茶饮的椰子故事,还能讲多久?「椰子汁泡咖啡」
  文 | 涂梦莹  来源:19号商研社三星第一代galaxy  椰子味风靡  从去年到今年,椰子火得有点久。  这个9月,新式椰子食品饮料品牌可可满分再度完成数千万元A轮融资,这...
日期:09-27
老黄H100再破纪录,4分钟训完GPT-3!全新特供版H20、L20和L2曝光,性能史诗级缩水
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。H100再次在MLPerf中刷新了记录!英伟达超算NVIDIA Eos在GPT-3模型的基准测试中,只用了3.9分钟就完成了...
日期:11-11
腾讯云发布运营商行业五大场景解决方案,助力运营商构建安全自主智算网络应用
(原标题:腾讯云发布运营商行业五大场景解决方案,助力运营商构建安全自主智算网络应用) 9月8日,在2023腾讯全球数字生态大会数智...
日期:09-09
《2022商业卫星产业蓝皮书》发布 卫星产业迎来融合发展新机遇「商业卫星的前景」
4 月 24 日,由新华社中国经济信息社编制的《 2022 商业卫星产业蓝皮书》(简称《报告》)对外发布。《报告》指出,商业卫星产业是兼有航天、通信、互联网三大行业属性的交叉融合...
日期:04-25
公众号重磅更新,微信又挖出一块“流量洼地”_公众号有了流量怎么赚钱
声明:本文来自于微信公众号 微果酱(ID:wjam123456),作者:陈出木,授权转载发布。虽然还没到年底冲业绩的时候,但微信近来的更新属实频繁,比如这几天引发关注的公众号留言区支持更换...
日期:08-31
微美全息(NASDAQ:WIMI)开发基于云计算的高可靠图形渲染引擎优化系统
随着计算机技术和互联网技术的不断发展,图形处理技术也在不断创新和进步,其行业应用也在不断扩展和深化。图形渲染引擎是一种重要的图形处理技术,它可以将三维空间中的物体和场...
日期:06-14
新一代游戏本下周开始扎堆上市:RTX 4090/4080 旗舰型号首发
IT之家 1 月 29 日消息,CES 2023 上发布的新一代笔记本将在 2 月 1 日开始扎堆上市,RTX 4090/4080 旗舰型号打头阵,RTX 4070/4060/4050 在 2 月晚些时候上市。RTX 4090 / 4080...
日期:01-30
警惕!女子用紫外线灯消毒灼伤全家眼睛「被紫外线灯灼伤眼睛」
1月2日消息,据九派新闻报道,浙江舟山赵女士在客厅放了一台紫外线消毒灯,每天消毒一个多小时,这期间家人时不时去客厅来回走动。到了晚上,全家人都感觉眼睛红肿有异物感,并伴有流泪...
日期:01-02
李佳琦直播间,变味儿了?
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:白羊,授权转载发布。最近,美腕又有了新动作,一档名为《所有女生的主播》的节目开始招募主播,在宣传海报中可以看到,该...
日期:02-15
FTX创始人因刑事指控被巴哈马警方逮捕,或将被引渡至美国
  记者/王蕙蓉  FTX创始人因美国司法部提出的刑事指控在巴哈马被逮捕,或将被引渡至美国。 FTX创始人兼前首席执行官(CEO)萨姆·班克曼-弗里德,图片来自TING SHEN(BLOOM...
日期:12-13
amd第四代锐龙处理器「AMD Zen4锐龙处理器在国内偷跑开卖:旗舰7950X卖5999元」
赶在27号正式发售前,AMD锐龙9 7950X的散片已经在某“海鲜市场”出现,标价5999元包邮。和盒装行货5950X当前3799元的价格比,的确是贵上不少。同时,考虑到7950X的官价699美元比595...
日期:09-23
解密文件近1354万次 360安全大脑发布《2022年勒索病毒疫情分析报告》
  B站知名UP主被攻击、德国医院遭勒索导致病患死亡、富士康1200台服务器沦陷……纵观已经过去的2020年,除了“新冠”疫情给全行业带来的冲击外,勒索病毒威胁再次领跑了2020...
日期:07-10
为成功登月 SpaceX与NASA共享星舰飞行数据「登月 飞船」
4月27日消息,SpaceX计划与美国国家航空航天局(NASA)共享星舰飞船的飞行测试数据,从而继续推动阿尔忒弥斯3号登月计划的设计。NASA官员表示,“这有助于我们的风控管理。”NASA官员...
日期:04-27
当直播带货退潮,双十一需要新爆点「直播带货形成热潮的三点原因」
声明:本文来自于微信公众号 孟永辉(ID:menglaoshi0071),作者:孟永辉,授权转载发布。当李佳琦回归,很多人直呼今年双十一总算是有了些看点。然而,我们同样要看到的是,尽管李佳琦回归...
日期:10-13
盖茨女儿走红TikTok 回应称:我靠的不只是出身
凤凰网科技讯 北京时间3月6日消息,亿万富翁比尔盖茨(Bill Gates)的小女儿菲比盖茨(Phoebe Gates)目前已是TikTok上的名人。她在接受采访时表示,自己在TikTok走红靠的不只是她...
日期:03-06