您的位置:首页 > 互联网

GPT-4大杀器谷歌Gemini来袭!26位研发大佬名单曝出,祭出类Midjourney生图能力

发布时间:2023-08-17 21:47:45  来源:互联网     背景:


新智元报道

编辑:编辑部

【新智元导读】据The Information爆料,谷歌已集结数百工程师团队,全新大杀器Gemini结合了GPT-4、Midjourney、Stable Diffusion三大模型的能力,即将于今年秋天上线。

谷歌的全新大杀器Gemini,即将和全世界见面了!

据传,Gemini不仅能像GPT-4一样可以进行文本对话,还融合了Midjourney、Stable Diffusion的能力,能够生成图像。


为了对抗OpenAI,谷歌CEO劈柴在今年4月迈出了绝非寻常的一步,将拥有完全不同文化和代码的团队——谷歌大脑和DeepMind合并。

现在,集结了数百位工程师的谷歌复仇者联盟已经全军待命,日夜赶工,只为狙击OpenAI的GPT-4,一举重夺AI领域的头把交椅。

谷歌创始人谢尔盖·布林也已重回战壕,亲自操刀Gemini的训练。

小米civi手机参数配置

据称,今年秋天,Gemini就会面世,而谷歌的考验也即将到来。


复仇者联盟名单已被曝出

押注Gemini,打造GPT-4最强杀手

根据知情人士的爆料,Gemini将LLM的文本能力与文生图的能力相结合。

也就是说,它相当于GPT-4和Midjourney/Stable Diffusion的合体版。


这也是外界首次听说,Gemini具有如此强大的绘图能力。

另外,它还能够提供分析图表、创建带有文本描述的图形、使用文本或语音命令控制软件。

在6月底,谷歌DeepMind CEO Hassabis也曾爆料,Gemini将结合进AlphaGo和大语言模型,而谷歌DeepMind已经准备好砸进数千万美元,甚至数亿。


可以说,谷歌把重注押在了Gemini身上,Gemini会为Bard聊天机器人提供动力,推动Google Docs、Slides等企业级应用。

另外,谷歌还希望通过云服务器租赁服务,向开发者收取访问Gemini的费用。


目前,谷歌云通过Vertex AI产品售卖对谷歌AI模型的访问

如果这些新功能实现,谷歌很有可能会赶上微软。

毕竟,微软在AI产品上已经领先不少,Office 365应用中包含AI功能,其应用程序也会对用户出售对ChatGPT的访问权限。

彭博社风投分支Bloomberg Beta的AI初创企业投资人James Cham对彭博社表示,「过去9个月里,每个人都在问这样一个问题:什么时候才能有一家公司,看起来有赶超OpenAI的可能?」

「现在,终于似乎有一个模型,可以和GPT-4旗鼓相当了。」

谷歌,被迫走出舒适区

随着OpenAI的崛起,谷歌也不得不在保证核心搜索业务的情况下,试着推出新的技术了。

据内部人士透露,在推出Gemini之前,谷歌很可能就会在某些产品中使用它。

过去,谷歌会使比较简单的模型来改进搜索,但是像Bard以及Gemini这样的产品,需要通过分析大量图像和文本, 来生成更像人类的回答。

如此海量数据所带来的潜在巨额服务器成本,也是谷歌必须要控制的。


更新之后的Bard,更强大了

手握YouTube的优势

根据The Information报道,谷歌对Gemini进行了大量YouTube视频的训练。


并且,Gemini还可以把音频和视频集成到模型自身,形成多模态能力,而后者,已经被许多研究者认为是AI的下一个前沿。

比如,根据YouTube视频训练的模型,可以帮助机械师根据视频诊断汽车的维修问题。

或者可以根据用户想要创建网站或应用程序的草图,来生成软件代码。此前,OpenAI曾展示了GPT-4的这项功能,但目前尚未推出。


OpenAI老板Greg Brockman曾演示GPT-4读图写网页代码的能力,但似乎鸽了

使用YouTube内容,还可以帮助谷歌开发更先进的文本转视频软件,根据用户想看的内容描述,自动生成详细的视频。

这类似于谷歌支持的初创公司RunwayML正在开发的技术,现在好莱坞的内容创作者们都在密切关注这项技术的发展。

联想拯救者y7000 2017款

Google DeepMind,发起全面反击

2011年,谷歌创立了谷歌大脑(Google Brain),旨在构建起谷歌自己的AI,来优化搜索的结果、广告精准投放,以及在Gmail中的自动填充等功能。

而位于伦敦的DeepMind则更多地致力于学术研究——2016年Alpha Go以4比1的成绩战胜了李世石,这项工作被人们视为通向通用人工智能(AGI)道路上的重要里程碑。

谷歌除了会用DeepMind开发的软件提高数据中心的运行效率外,DeepMind的工作并没有对其核心产品产生太大影响。

但在去年年底,一切都改变了。

什么头骨化石在湖北发现


2022年11月,OpenAI发布了ChatGPT,短短几周内用户人数飙升到了数千万,之后更是达成了用户破亿最短时间的成就。

几个月内,OpenAI的收入就达到数亿美元,并且在这期间微软新投资了100亿美元、数不清的资本热钱向着OpenA流去,OpenAI的市值、知名度都达到了一个前所未有的高度。


这时,谷歌才意识到,自己在AI领域的领导地位已经岌岌可危了。

谷歌大脑+DeepMind=?

今年4月,陷入被动的谷歌放出终极大招:谷歌大脑和DeepMind正式合并!


「王不见王」的两大部门居然合体了,这一举动也是让瓜众们惊掉了下巴。


合并后的Google DeepMind将由DeepMind首席执行官Demis Hassabis领导,而前谷歌AI负责人Jeff Dean接任首席科学家一职。


现在,至少有26名大佬正在负责Gemini的开发,这些人包括曾在谷歌大脑和DeepMind工作的研究人员。

知情人士称, DeepMind的两位高管Oriol Vinyals和Koray Kavukcuoglu,将和前谷歌大脑负责人Jeff Dean一起负责Gemini的开发。他们将监督数百名参与Gemini开发的员工。



谢尔盖·布林和拉里·佩奇

他一直在对Gemini模型进行评估,并帮助员工训练模型。

据爆料,在团队发现Gemini意外地接受了潜在攻击性内容的训练后,布林也参与到了重新训练模型的技术决策过程中。

「意外联姻」的阵痛

随着谷歌大脑和DeepMind的合并,新团队很快就遇到了非常严峻的问题——代码怎么合并,用谁家的软件开发?

毕竟,这两个部门的代码库在之前是完全独立的。

虽然双方在各让一步之后达成了妥协:

- 在模型的预训练阶段,使用谷歌大脑用于训练机器学习模型的软件Pax

- 在后期阶段,使用DeepMind用于开发模型的软件Core Model Strike

但据内部人士爆料,还是有不少员工因为不得不使用自己不熟悉的软件而愤愤不平。


除此之外,谷歌和DeepMind都针对ChatGPT开发了自己的模型。

DeepMind着手开展了一个代号为Goodall的项目,旨在使用未公开模型Chipmunk的不同变体来开发一个与ChatGPT竞争的系统。而谷歌大脑则开发立项了Gemini。

最终,DeepMind决定放弃自己原先的努力,选择基于谷歌大脑的项目合作开发Gemini。

有趣的是,在远程工作的政策上,据说谷歌大脑的态度也要比DeepMind宽松得多。

内耗、狼狈、反攻

比起OpenAI那边的形势一片大好,谷歌则陷入了一场精疲力尽的内耗中。

先是一连多个高级技术人才出走,如Liam Fedus、Barret Zoph和Luke Metz等在内的研究人员,纷纷选择加入OpenAI。

虽然谷歌找回了一些人才:比如重新招回了Jacob Devlin和Jack Rae。

Jacob Devlin批评Bard的开发后,在今年1月份去了OpenAI。而Jack Rae是前DeepMind的研究员,在2022年加入了OpenAI。


此前,Devlin向劈柴、Dean等高管表达了对Bard团队使用ChatGPT数据训练的担忧,随后辞职

接着,谷歌为了对抗一枝独秀的ChatGPT,也为了重回人工智能赛道领航者的地位,在今年2月的时候匆忙发布了聊天机器人Bard。

然而,发布会却因一个低级的事实性错误惨遭翻车,导致公司的市值在一夜之间蒸发了千亿美元。

谷歌的第一次反攻,以狼狈收尾。


同时发布的,还有将生成式AI和自己传统搜索服务结合起来的Search Generative Experience(SGE)。

简单来说,SGE是一个类似Bing Chat的AI搜索服务,但并没有直接使用新的聊天窗口,而是将AI生成的内容集合在搜索结果中展示给用户。


也就是说,在搜索的同时,谷歌会利用AI为搜索的内容提供说明,回答用户提出的问题,帮用户做旅行规划等等。

而用户不再需要货比三家般的在多个链接之间来回跳转,也不用花心力去判断哪个链接背后的信息是真的,因为所有可用的内容都被集中到了AI收集到的回复之中。


在最近的更新中,谷歌添加了让SGE在AI生成的回复内容中附加图片和视频的功能,帮助用户更加直观的了解自己搜索的知识和信息。

就像Bing Chat一样,SGE的AI响应中也会有标注了发布时间的链接,来支持由AI生成的回复内容。如果用户对于相关的信息感兴趣,点击链接就能更加全面地了解具体的内容。


在AI生成的回复中,对于很多知识性的信息和概念,用户能够直接通过鼠标的悬停,就能获取到概念准确的定义。

现在针对科学,历史,经济等知识性问题的AI回复,都已经上线这个功能。


而对于需要浏览很冗长的网页信息来学习或者了解信息的用户,SGE还更新了一个网页内的AI概括功能——SGE while browsing。

这个功能相当于给用户提供了一个随时听候差遣的「大纲生成器」。对于任何篇幅比较长的网页内容,用户都可以用它来生成大纲,快速掌握要点。

在下方的Explore the Page部分,用户还能看到和页面内容相关的问题。如果用户对于问题感兴趣,直接点击,就能看到文章中内容是如何解答这些问题的。


然而,是由于谷歌保守的市场策略,SEG目前只允许美国本土的用户采用Waiting List申请测试。

所以可能大部分用户甚至都不知道,谷歌已经推出了这样一个服务。

总之,据悉两部门合体后,至少测试了21项生成式AI工具,甚至还包含为用户提供生活建议和心理辅导的工具。


在去年紧急解雇了声称聊天AI有意识的工程师的谷歌,现在居然也开始探索这类「敏感」地带,可见真的是决定放手一搏了。

Gemini项目,目前形势大好

不过,两个团队的合并,对于一些正在负责Gemini项目的工程师来说,确实是个不小的惊喜。

曾在DeepMind工作的James Molloy和Tom Hennigan与谷歌资深研究员Paul Barham一起负责基础设施。

Timothy Lillicrap曾在DeepMind从事国际象棋和围棋方面的系统开发工作,而谷歌大脑的研究员Emily Pitler则领导一个团队,专注于使LLM具备处理数学或网络搜索等专门任务的能力。

但除了合并组织中的人员安排问题,Gemini团队在开发过程中还面临着巨大的挑战,如确定可以用于模型训练的数据等。

因此,谷歌的律师们一直在密切评估这项训练工作。

在一个案例中,由于担心版权持有者的反对意见,律师们要求研究人员删除了来自教科书的训练数据。

而这些数据本可以帮助训练模型回答有关天文学或生物学等领域的问题。

不过,谷歌前高管、VC公司Felicis Ventures的创始人Aydin Senkut评价Gemini的发布让他看到了「谷歌决心再次走在最前沿,而不是极度保守」。

Aydin Senkut也十分赞同谷歌的决定:

「这是正确的方向。最终,他们会火的。」

参考资料:

https://www.theinformation.com/articles/the-forced-marriage-at-the-heart-of-googles-ai-race



返回网站首页

本文评论
力压群雄 | 艾特智能中标中国金茂智慧科技智能家居战略集采_金茂招标采购平台
  重磅!2月3日,艾特智能中标中国金茂智慧科技2021-2023年度全屋智能家居战略集采,负责其在智能家居领域的合作研发、供货安装及调试等工作。   据悉,中国金茂战略集采...
日期:07-16
高铁站近9成是按摩椅? 工作人员:候车厅二60%为普通座椅_高铁站的按摩椅全国通用吗
8月13日消息,随着旅游旺季的来临,不少游客都有出行计划,高铁成为出门旅游首先,但最近山东泰安高铁站候车厅内却遭到了很多人的吐槽。据央视网,网友爆料称,山东泰安高铁站候车厅内,...
日期:08-13
腾讯 模型「大模型时代,腾讯云“复制”腾讯|WAIC2023」
编辑总结:腾讯云在 2023 年世界人工智能大会上发布了面向行业的大模型解决方案,致力于将大模型应用落地。他们通过打造行业大模型商店和提供大模型工具箱和连接器,帮助企业快速...
日期:07-13
埃及金字塔长多少米「埃及金字塔内发现长9米新通道:通向其他空间?」
当地时间3月2日,埃及旅游和文物部长宣布,在胡夫金字塔内发现一条9米长、2.1米宽的新通道。考古专家分析认为,这条通道可能是为了减轻金字塔内部结构压力,但也可能是通向其他空间...
日期:03-04
爽就要吼出来——语音微博Symbian版开启你的激情生活
  当iOS和Android用户拿着手机乐享说的愉悦时,Symbian用户可是各种羡慕嫉妒恨。此时,语音微博Symbian版终于发布,为更多智能手机用户带来能听能说的微博。此次发布的语音微...
日期:07-24
Moka × 乐学 | 教育风口下的人才竞争策略
  一月突发新冠肺炎疫情,这无疑对即将中、高考的学子们产生重大影响。乐学教育的线下业务也无法正常开展。对此,乐学教育集团开始召开紧急会议,积极部署应对方案,用最快速度...
日期:07-14
纸贵科技助力智慧昆山,长三角首个“星火•链网”骨干节点上线
  9月24日,“星火•链网”国家级区块链基础设施骨干节点(昆山)授牌上线仪式在昆山成功举行,标志着长三角首个“星火•链网”骨干节点建设完成。   “星火•链网”骨干节点...
日期:10-03
360pro电话手表_360手表Pro全新上市,它究竟“Pro”在哪儿?
  在父母的养育下,很多儿女们已经长大成人,有了自己的幸福生活,可是为孩子付出了毕生精力的父母,却走到了暮年。在2020年开年之际,为表达自己的感恩之情,送父母一件贴心的礼物...
日期:01-07
微信文章底部增加淘宝入口怎么弄「微信文章底部增加淘宝入口」
声明:本文来自于微信公众号 电商报Pro(ID:kandianshang),作者:老电,授权转载发布。张勇:平台间如果能够互联互通,肯定会带来新的改革红利。淘宝在微信中有了新入口阿里和腾讯,这两...
日期:02-09
国家高度重视青年发展 伊对打造视频恋爱社交平台
  青年兴则国家兴,青年强则国家强,青年一代有理想、有本领、有担当,国家就有前途,民族就有希望。   国家高度重视青年的发展,包括情感和家庭生活。中共中央国务院印曾发布...
日期:03-27
安卓性能小平板!新款联想拯救者Y700参数出炉:升级满血版骁龙8「联想拯救者y7000 2020版」
联想近日宣布,将于7月22日推出全新的拯救者Y700 8英寸电竞平板。新款平板在外观上与老款保持一致,尺寸超小且备受好评,是安卓阵营中唯一能与iPad mini竞争的产品。据数码闲聊站...
日期:07-07
小米13价格公布,3999元起售价没有涨,配色就有9款「小米13发布」
12月11日 小米13全能影像旗舰发布,价格较小米12S没有涨价,8GB +128GB售价3999元,8GB+256GB售价4299元,12GB+256GB售价4599元,12GB +512GB售价4999元。小米13有安卓旗舰中罕见见的...
日期:12-12
文都持续提升安全系数 资本加持下考研教育市场有望长出独角兽
  2020年以来,受疫情影响,全国近百家教育培训机构“倒闭”“跑路”,其中不乏知名钢琴培训机构星空琴行、英语培训四巨头韦博英语、经营近20年的老牌培训机构优胜教育以及在...
日期:07-16
京东618大额券怎么领「至高优惠1920元,京东618最后一波iPhone大额券来了」
6 月 14 日消息,京东Apple自营旗舰店 618 最后一波 iPhone 大额券来了,iPhone 14 Pro Max 系列领券至高优惠 1920 元,6 月 15 日晚 8 点起可用。京东 App 首页搜索“苹果大额券...
日期:06-14
突发!美联储宣布加息75个基点,道指跌超500点,苹果市值一夜蒸发3600亿元!鲍威尔这次又说了啥?
美东时间9月21日,美联储宣布加息75个基点后,三大指数盘中大幅震荡,尾盘下挫集体收跌,截至收盘,道指下跌522.45点,跌幅1.70%,报30183.78点;标普500指数下跌66点,跌幅1.71%,报3789.93点;...
日期:09-23
特斯拉刚买就降价 特斯拉怎么处理「特斯拉大降价1.3万美元,美国新车主:我感觉被骗了」
1月14日消息,特斯拉突然在美国宣布大幅下调汽车售价后,在新车主中引发轩然大波。许多人抱怨称,他们原本可以节省高达1.3万美元的开支,同时二手车的价值也大幅下跌。网页设计师玛...
日期:01-14
2022年TikTok不在榜首的日子里,都是哪些App在霸榜?
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:白鲸小编,,授权转载发布。近日,推特博主 Olivia Moore 发布了一条推文总结了2022年曾经登顶过美国 iOS 下载总榜的 App...
日期:12-29
女子入职10天因老板娘不同意被开除:当事人感觉“很离谱”
员工被公司辞退,理由很奇葩。3月6日消息,浙江杭州一女子入职10天因老板娘不同意被开除。iPhone14百度百科当事人肖女士表示,自己应聘入职了文员助理岗位,上了10天班,入职没办理手...
日期:03-07
京东双11预售战报:家电1分钟成交额破10亿 折叠屏手机销量增长400%_京东双11销售额超2715亿
凤凰网科技讯 10月31日消息,刚刚迎来预售的双11电商大促中,家电市场继续呈现如火如荼态势。根据京东发布的数据,今晚8点预售开启后,家电全品类1分钟成交额超10亿,10分钟整体成交...
日期:11-02
发货受阻,50多万斤西红柿仍销售一空,苏宁什么神操作
  疫情蔓延的这段日子里,潮客生鲜的老板周亚芳感受到了前所未有的压力:农田里几万斤西红柿正值丰收,如果不尽快卖出去,西红柿就会烂到地里。   与周亚芳遭遇相同的还有很多...
日期:12-04