您的位置:首页 > 互联网

突发!谷歌发布史上最强大模型Gemini,打爆GPT-4_谷歌最牛的是什么

发布时间:2023-12-07 19:15:47  来源:互联网     背景:

金磊 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

传闻中的谷歌杀手锏Gemini,来了!

就在刚刚,谷歌CEO皮猜和哈萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。



标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。

notebookpro有mac版吗

具体来说,此次谷歌一共带来了Gemini的三个版本:

  • Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
  • Gemini Pro:可扩展至各种任务的Gemini模型
  • Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)

其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。

而Gemini Pro从今天起,就会在Bard中实装上线。



同时,谷歌Gemini团队还公布了一份60页的详细技术报告。



消息一出,社交媒体瞬间炸了锅。

英伟达AI科学家Jim Fan就第一时间转发评论:

这是OpenAI王座的有力竞争者。



话不多说,一起来看更多细节。

谷歌史上最强大模型Gemini

在LLM中的表现,也正如我们刚才所述,32个基准测试中拿下30个SOTA。

其中,通用、推理、数学和编程等大方向的成绩如下表所示:



十大谷歌

△Gemini 在包括文本和编码在内的一系列基准测试中达到SOTA

在多模态方面,Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOTA分数。

这项基准测试是由跨不同领域的多模式任务组成,需要大模型进行一个深思熟虑的推理过程。

马斯克spacex股权

根据谷歌给出的图像基准测试结果来看,Gemini Ultra在没有OCR系统的帮助下,表现优于之前最先进的模型。



△Gemini 在一系列多模态基准测试中达到SOTA

接下来,我们以具体的案例来看一下Gemini的能力。

例如科学家们经常要面对从成千上万的文献中提取数据的难题,像下面这篇研究,作者就通过手动的方法从上万篇遗传学论文中创建了数据集。



像这样的数据集是需得随着时间流逝而进行更新的,但现实的情况是,自2021年以来,这个领域便已有超过200000篇新增的论文……

再像以往手动的方式显然是不可行的,不过现在有了Gemini,一切就变得简单了起来。

首先,通过自然语言的Prompt,告诉Gemini去过滤相关的科学论文:



只需片刻时间,Gemini就能找到相关论文和非相关的论文。



而后,继续用Prompt告诉Gemini去阅读相关论文,并提取关键数据,甚至是可以要求它添加注释的那种。



如果你给Gemini一个午休的时间长度,它就能阅读200000篇论文,从中筛选出250篇并提取数据!



并且由于Gemini是多模态的,我们还可以让它对上面的数据表格做进一步的深入操作,例如更新图表:



对于学生党来说,Gemini现在也可以成为非常得力的学习助手。

例如“喂”给Gemini一张手写物理题,它不仅能看懂,而且还可以辨别手写答案的对错。



在此基础上,若是选择一个错误的题目,我们还可以跟Gemini通过自然语言沟通,让它对每一个细节步骤进行详解。



在看图像做理解和推理方面,谷歌还亮出了更多有意思的案例。

例如替换图片素材的组合方式,Gemini就能像人一样精准猜中所指的电影名字:



就连下面这种高难度的也能hold住:



再如寻找两张图片的相似之处:



更有意思的是,谷歌还特意用中文做了个demo,来展示Gemini对多张图片的组合理解能力:



那么接下来的问题就是:Gemini是如何做到的?

rtx3060显卡什么水平

60页报告透露技术细节

谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

谷歌对此表示:

这样的训练方法,有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型;而且它的功能在几乎每个领域都是最先进的。



具体到模型架构方面,Gemini基于增强的Transformer decoder打造,采用了高效attention机制(如multi-query attention),支持32k上下文长度。



尽管没有透露Ultra和Pro版本的具体参数规模,但技术报告中提到,谷歌使用TPUv5e和TPUv4来训练Gemini。

训练Gemini Ultra使用了跨多个数据中心的大量TPUv4。这意味着与谷歌此前的主力大模型PaLM-2相比,Gemini在规模上显著增大。

此前,PaLM-2被曝参数规模为3400亿。

Gemini Pro实装上线

竞争对手那边,OpenAI的GPTs惊艳全世界,微软的Copilot更是先一步渗透进全线产品。

因此Gemini一出,谷歌也当即强调:Gemini将通过谷歌产品推向数十亿用户。

率先上线的是Gemini Pro。从今天起,谷歌的聊天机器人Bard将由Gemini Pro微调版本驱动。谷歌表示:

这是Bard自推出以来的最大升级。

谷歌还打算把Gemini引入手机:Pixel 8 Pro将是第一款运行Gemini Nano的智能手机。



另外,谷歌计划在接下来几个月中,将Gemini全面推向搜索、广告、Chrome和Duet AI等产品线。

根据官方数据,Gemini能使用户的搜索生成体验(SGE)速度更快、质量更高,比如在美国使用英语搜索延迟能减少40%。

值得关注还有,就在Gemini正式亮相的同时,谷歌还推出了专为大模型而设计的新一代TPU——Cloud TPU v5p。



那么,你觉得这一波,谷歌能赶上OpenAI的脚步吗?

参考链接:
[1]https://blog.google/technology/ai/google-gemini-ai
[2]https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
[3]https://youtu.be/jV1vkHv4zq8?si=jjAw0uV0dkpP3eVT


返回网站首页

本文评论
公共防疫系列方案│玄武疫情智慧短信解决方案 确保信息真实有效&实时触达
  疫情之下,各方信息更新速度极快,信息投放进流量公域后,将在短时间内被来自四面八方的新信息覆盖。且现阶段仍有不少疫情相关的谣言在网络上流传,众多伪装为官方信息的谣言...
日期:02-22
11人狂训2个月,马斯克精准狙击OpenAI!xAI首个大模型Grok炸场,330亿参数每月16刀
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】OpenAI开发者大会前夕,马斯克来截胡了!xAI首个产品Grok炸裂发布,两个月训出330亿参数大...
日期:11-07
方便面消耗大国「方便面消费第一大国是我们:超6成人每周吃三次」
方便面,又名泡面、快食面等,是很常见的即食品。据每天学点经济学的分享世界方便面协会数据显示,2021年全球方便面消费量为1181.8亿份,中国是全球最大的方便面消费市场,消费量为43...
日期:12-17
迅雷公司股票「迅雷:第二季度营收7830万美元 同比增长41.9%」
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:09-30
adol笔记本_adol笔记本开机进不了桌面
Adol笔记本是一家位于台湾的笔记本电脑品牌,成立于1997年,其品牌名称源于德国“阿多尔”,意为“关键”. Adol致力于生产高性能和高品质的笔记本电脑,为用户提供良好的使用体验。...
日期:05-31
8000元以上高端机占绝大多数 iPhone 15系列今年销量将达7500万部「iphone销量」
快科技8月7日消息,再过一个月时间,iPhone 15系列新机就要发布了,今年不论外观还是配置都会是近几年来升级最大的,值得考虑升级。iPhone 15系列这次也会是四款型号,主要区别是命名...
日期:08-07
好莱坞群众演员「好莱坞演员继续罢工 抗议AI和3D扫描技术」
划重点:比亚迪夏mpv混动iPhone11前置有美颜吗...
日期:10-15
Chrome Mozilla「Mozilla向科技巨头 “开火”,指责谷歌、微软垄断浏览器市场」
声明:本文来自于微信公众号 OSC开源社区(ID:oschina2013),授权转载发布。Firefox 开发商 Mozilla 近日发布了一份研究报告(PDF 下载地址见文末),全文长达66页,主题是探讨为什么浏览...
日期:10-03
板卡系统「板卡一哥都撑不住 大佬警告PC市场饱和了:一定要改变」
快科技6月18日消息,从去年下半年开始,PC市场也为需求下滑而且引发行业动荡,不仅AMD、英特尔业绩下滑,PC厂商也不得不裁员、缩减规模,现在板卡一哥华硕也传出了调整的消息。据华硕...
日期:06-19
雷军小米12发布「雷军发文纪念小米12S Ultra一周年、站稳高端」
7月4日消息,雷军在微博上庆祝小米12S Ultra发布一周年,并表示,去年这个时候,小米和徕卡的合作首款旗舰正式发布。根据之前小米公布的财报会议上的数据显示,小米12S Ultra是自2010...
日期:07-05
360杀毒高分通过AV-C五月动态测试
  国际权威杀毒测试AV-C近日公布了2011年5月杀毒软件“动态测试”成绩,该项测试模拟电脑真实使用环境,主要考验杀毒软件的防毒能力。中国唯一入选AV-C测试的360杀毒凭借自...
日期:07-30
推特9月13日开股东大会 就马斯克收购一事投票_马斯克再发推特
百度有多少专利中国移动终端实验室发布了第一期5G通信指数报告switch lite商店发生错误苹果盗窃用户数据   讯 北京时间7月27日消息,推特发布消息称将在9月13日召开股东大...
日期:07-31
笔记本外接显卡坞实测:RTX 4090损失20%性能 等同RTX 4080水准
由于现在笔记本的CPU性能相当强大了,就有不少玩家会考虑核显笔记本+外接显卡坞的方案。这样做的好处,就是在让笔记本保持轻薄便携的同时,也能兼顾到高端游戏的需求,但这样是否会...
日期:01-22
今年淘宝双11怎么买最划算?2023天猫京东双十一红包口令官方立减玩法解读
导读:今年双十一将是一个多元化、个性化、高品质的购物狂欢节。淘宝天猫简化规则、淘宝提供微信支付、京东现货开售、苏宁加入百亿补贴,各平台都在提升购物体验。小红书初次发...
日期:10-22
社区团购怎么做_社群团购&直播货源展览会 调研结果排名
  调研结果,名列榜首的:社群团购&直播货源展览会   社群团购引领者、直播资源整合者——沸点天下,一年一度的春季爆品选品会将于4月7-8日,将在广州广交会馆B区举办!为更好...
日期:07-16
黄章退出魅族股东行列 此前曾以工商系统出错为由否认(黄章退出魅族股东名单)
  天眼查数据显示,6月25日,魅族创始人黄章(原名:黄秀章)退出珠海市魅族科技有限公司股东之列,此前曾以工商系统出错为由否认。   珠海市魅族科技有限公司成立于2003年3月,...
日期:07-14
小爱同学打开朗读功能「小米小爱同学上线朗读屏幕功能」
9月29日 消息:今日,小米旗下人工智能助手小爱同学宣布,朗读屏幕功能正式上线。用户只要在公众号、浏览器界面,语音或按键唤醒小爱同学,说出口令“朗读屏幕”即可。蔚来汽车股价...
日期:10-04
电动车过了过渡期会怎样「超标电动车过渡期结束 处理方式有哪些?答案来了」
电动车新国标,发布至今已经有三年时间了,各地也在陆续推进超标电动车的淘汰置换以及管理工作。对于条例施行前已经购买的电动自行车,综合考虑车辆使用寿命、车辆保有人权益等客...
日期:11-20
干净利落的窄边框直屏+直角边框设计 「华为nova」-11系列渲染图曝光
不久前,全新的华为P60系列、Mate X3折叠屏旗舰正式亮相,带来了全新的外观设计、超聚光夜视长焦、卫星通信2.0等多方面的震撼升级,一经上市便受到了用户的广泛追捧。而现在有最...
日期:09-18
五一假期热门城市出炉:多个省会及直辖市在列!出境游同样火爆
今日已是4月20日,眼看距离五一假期越来越近。中国铁路依据车票发售情况整理的热门城市包括了北京、上海、广州、深圳、成都、杭州、西安、武汉、南京、重庆、长沙等。大众点...
日期:04-20