您的位置:首页 > 互联网

GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!

发布时间:2023-09-19 20:35:51  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】多模态大模型的战场上,已有人闻到风声。据外媒爆料,OpenAI的全新多模态模型Gobi似乎已在筹备中。谷歌和OpenAI的这场对决,似乎已是箭在弦上了。

随着今年秋天的临近,谷歌和OpenAI的多模态模型之战,也进入到白热化阶段。

就在上周,谷歌已经对一些外部公司开放了多模态大模型Gemini的功能。

而OpenAI,当然不会坐以待毙。他们正在争分夺秒地把多模态功能整合进GPT-4里,争取推出功能与Gemini类似的多模态大模型,一举击杀谷歌。

传说中的多模态功能,在今年3月OpenAI那场震惊全世界的GPT-4发布会上,已经被展示过——

在纸上画个草图,拍个照发给GPT-4,说一声给我按照这种布局做个网站,它立马就写出了网页代码。

老板Greg Brockman亲自上线演示

不过随后,多模态仿佛昙花一现,再也没人见过产品化的实体功能。

所以,谷歌和OpenAI的多模态大战,终于要来了吗?

对战谷歌,OpenAI抢发多模态大模型

面对传闻中谷歌要击杀自己的这款大杀器,OpenAI当然不会无动于衷。

据外媒The Information爆料,一款名为Gobi的全新多模态大模型,已经在紧锣密鼓地筹备了。

OpenAI计划,在Gemini发布之前就推出多模态LLM,彻底击败谷歌。

OpenAI的Greg Brockman vs 谷歌的Demis Hassabis

其实,在3月份推出GPT-4多模态功能的预览后,OpenAI已经向一家名为Be My Eyes的公司推出了这项功能,但并没有向其他公司提供。

从名字就可以看出来,这家公司在研发让盲人或视力不佳人群看得更清楚的技术。

最近,OpenAI打算更广泛地推出名为GPT-Vision的功能。

OpenAI为什么花了这么长时间?

最主要的原因,是他们担心新的视觉功能会被不法分子利用,比如通过自动破解验证码来冒充人类,或者通过面部识别来追踪人类。

不过,对于这些法律上的安全风险,OpenAI的工程师们似乎已经解决了。

同样,一位谷歌发言人也表示:谷歌已经采取了一些措施,防止Gemini被滥用。

在7月做出的承诺中,谷歌保证会在所有产品中开发负责任的人工智能。

Gobi能成为GPT-5吗?

在GPT-Vision之后,OpenAI有可能会推出更强大的多模态大模型,代号为Gobi。

跟GPT-4不同,Gobi从一开始就是按多模态模型构建的。

所以,Gobi就是传说中的GPT-5吗?

现在,我们还无法知晓。Gobi训练到哪一步了,也没有确切消息。

在9月初,DeepMind联合创始人、现Inflection AI的CEO Mustafa Suleyman,在采访时曾放出一枚重磅炸弹——据他猜测,OpenAI正在秘密训练GPT-5。

Suleyman认为,Sam Altman最近说过他们没有训练 GPT-5,可能没有说实话。(原话是:Come on. I don’t know. I think it’s better that we’re all just straight about it.)

而在这边,根据试用过Gemini的人士,Gemini产生的幻觉,会比现有的模型都更少。原因详见下文。

总之,谷歌和OpenAI的这场多模态模型大战,可以说是AI版的iPhone和Android对决。

一个是称霸AI领域多年的硅谷巨头,一个是风头无两的顶流AI初创公司,二者差距有多大,所有人都在屏息等待。

谷歌秘密测试Gemini

另一边,谷歌也在开始邀请部分外部开发者加急测试,即将推出的下一代多模态大模型Gemini 。

上周,The Information独家报道称,Gemini可能很快准备好进行测试发布,并会集成到像Google Cloud Vertex AI等服务中。

在今年的谷歌I/O开发者大会上,劈柴曾公开介绍Gemini,是一个多模态模型、高效集成工具、API。

为了合力干大事,谷歌还将谷歌大脑,与DeepMind实验室进行了合并。

据称,至少有20多位高管参与了Gemini的研发,DeepMind的创始人Demis Hassabis领导,谷歌创始人Sergey Brin参与研发。

还有谷歌DeepMind组成的数百名员工,其中包括前谷歌大脑主管Jeff Dean等等。

一位测试过的人士说,Gemini至少在一个方面比GPT-4有优势:除了网络上的公开信息外,该模型还利用了大量谷歌消费产品(搜索、Youtube)的专有数据。

因此,Gemini在理解用户对特定查询的意图时应该特别准确,而且它产生的错误答案,即幻觉,似乎更少。

据此前SemiAnalysis分析师的爆料,谷歌的下一代大模型Gemini,已经开始在新的TPUv5Pod上进行训练,算力高达~1e26FLOPS,比训练GPT-4的算力还要大5倍。

另外,Gemini的训练数据库包含Youtube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。

据称,谷歌下一代大模型也是由多种规模组成,可能使用了MoE架构,以及投机采样技术。

通过小模型提前生成token并传递给大模型进行评估,以提高模型的总体推理速度。

谷歌DeepMind的负责人Hassabis在采访中曾表示,Gemini预计花费数千万到数亿美元,与开发GPT-4的成本相当。

Gemini会整合AlphaGo中使用的技术,这将赋予系统全新的规划、解决问题的能力。

可以这么说,Gemini把AlphaGo系统的一些优势,和大语言模型惊人的语言能力结合在一起了。并且,我们还有一些其他有趣的创新。

AlphaGo背后的技术,就是强化学习,这是DeepMind首创的技术。

RL代理随着时间的推移与环境交互,通过反复试验来学习策略,从而最大限度地提高长期累积奖励

通过强化学习,AI能够通过反复尝试和接受反馈来调整自己的表现,因而学会处理很棘手的问题,比如在围棋或电子游戏中选择如何采取下一步行动。

另外,AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法,来探索和记住棋盘上所有可能的动作。

现有模型相比,Gemini将大大提高软件开发人员的代码生成能力,谷歌希望用它来追赶微软的GitHub Copilot代码助手。

谷歌内部还讨论了,使用Gemini来实现图表分析等功能,比如要求模型解释完成图表的含义,以及使用文本或语音指令来浏览网页浏览器或其他软件。

谷歌云开发者平台Google Cloud Vertex AI也将得到Gemini加持,大小版本都有,这样开发人员就可以付费购买小模型在个人设备上运行。

现在,谷歌已经在全力备战,就等着Gemini开启逆袭之路。

gpt-3.5-turbo-instruct发布

7月,OpenAI曾公布GPT-4API全面可用,并且在接下来几个月要推出新模型。

特斯拉语音控制指令

这不,就在今天,网友纷纷收到了gpt-3.5-turbo-instruct新模型发布的邮件,以代替旧模型text-davinci-003。

据介绍,gpt-3.5-turbo-instruct是一个InstructGPT风格的模型,其训练方式与text-davinci-003类似。

使用方法和以前的Prompt-Completion类似,根据提示词的指令补全。

就价格来说,gpt-3.5-turbo4K保持一致。

有网友已经开始用上了最新模型,去玩1800Elo左右的国际象棋。

而他此前还发现GPT根本做不到这一点,但现在看来这只是RLHF聊天模型的问题,纯Completion模型就成功了。

在对弈中,gpt-3.5-turbo-instruct轻松击败了Stockfish4级(1700分),在5级(2000分)的比赛中仍不落下风。

它从不走非法棋步,使用巧妙的开局牺牲,以及令人难以置信的卒与王将死,允许对手毫无实际意义地晋级。

网友用的是如下PGN风格的提示来模拟大师级游戏。高亮显示有点错误。GPT自己走棋,他手动输入了Stockfish的棋步。

顺便提一句,OpenAI即将在11月召开的首届开发者大会,已经开始注册了,快上手申请吧。

参考资料:

https://www.theinformation.com/articles/openai-hustles-to-beat-google-to-launch-multimodal-llm

https://devday.openai.com/

https://news.ycombinator.com/item?id=37558911#:~:text=Key%20Features%3A%20Gpt%2D3.5%2D,speed%20as%20our%20turbo%20models.


返回网站首页

本文评论
苹果乔布斯之子创办Yosemite风投公司,目标治疗癌症-成功融资超2亿美元
8 月 2 日消息,苹果联合创始人史蒂夫・乔布斯(Steve Jobs)的儿子里德・乔布斯(Reed Jobs)近日创办了 Yosemite 风投公司,公司已成功融资超过 2 亿美元(备注:当前约 14.3 亿元人民币),...
日期:09-19
双十一最后冲刺,如何抢占流量洼地?_双十一营销热点
声明:本文来自于微信公众号 友望数据(ID:youwangshuju),作者:西楼,授权转载发布。redmi note11t pro 5g 67w快充今晚8点,视频号“超品日-11·11购物狂欢节”就要开启。经过了两年...
日期:11-02
蔚来首款手机正式入网:预计价格7000元_蔚来首款车上市
蔚来汽车首款手机近日获得了工信部的无线电核准,这意味着产品的设计已经完成,即将上市。据蔚来创始人李斌所言,该手机将于今年第三季度发布。根据工信部公布的入网数据,该手机将...
日期:06-21
马斯克:人类已经是半机器人 记忆绝大多数外包给了电脑「马斯克人类意识永生」
最近,特斯拉的首席执行官马斯克在推特上发表了一条评论:我们人类已经是半机器人了,因为我们把大部分的记忆都交给了电脑来保存。马斯克这样说是针对风投家安德森最近写的一篇...
日期:06-14
被PC玩家狂吐槽的《赛博朋克2077》:彻底翻身了!「赛博朋克2077游民星空论坛」
据《赛博朋克2077》官方消息,《赛博朋克2077》在最近连续四周内日活跃玩家数目都超过了100万人。最新的华为手机会搭载鸿蒙3.0吗自2020年游戏发售以来,《赛博朋克2077》累计销...
日期:10-22
飞信停航 运营商不舍社交赛道
来源:北京商报   横跨PC和移动互联网的飞信,只是令人唏嘘的社交产品之一。中国移动近日宣布和飞信(前身为飞信)将从2022年9月30日起停止提供服务。2007年上线的飞信,背靠中国移...
日期:07-31
小米1亿像素实际像素「小米2亿像素即将量产!或命名12T Pro」
中关村在线消息:9月29日,据相关爆料,小米即将发布2亿像素主摄方案的手机,预计为小米12T系列,该机或将采用三星HP1传感器,该传感器尺寸为1/1.22英寸,单位像素面积为0.64μm,支持Chame...
日期:09-30
国内油价下周二调整:本轮有望出现两连降 加满一箱省15元_国内油价下个调整日期是什么时候
快科技5月12日消息,根据国内成品油价调整安排,下周二(5月16日)24时,国内第十轮油价调整将正式开启。继上一轮油价小幅下调后,本次调价周期内国际油价继续下行,机构测算本轮调价有望...
日期:05-13
真我GT5首发英雄联盟手游144帧模式 引领高帧高画质时代「真我gt5g缺点」
真我GT5首发英雄联盟手游144帧模式 引领高帧高画质时代 通信产业网|2023-08-28 10:55:43作者:通文来源:通信产业网三星s22两亿像素【通信产业网讯】真我realme官宣真我GT5将首...
日期:09-01
高德地图 Beta 手机端车道级导航全新升级:高清展示真实道路场景,华为 / 荣耀部分机型支持
  1月24日消息 近期,高德地图发布了第三代车载导航,随着高德地图 V10.76 beta 新版本的发布,手机端的车道级导航也全新升级。   升级后导航画面出现变化,驾车引导将更加精...
日期:05-07
马斯克与推特ceo「马斯克完成对推特的收购 原CEO、CFO双双离职」
中关村在线消息:据外媒曝光,马斯克目前已经接管推特,推特原CEO Parag Agrawal和原CFO Ned Segal都已经离开公司位于旧金山的总部。美国登月火箭失败新氧市场份额早在今年4月,推...
日期:10-29
传漾科技宣布将推出全新网络营销“一站式”平台(新潮传媒广告)
  2011年2月22日,知名网络广告解决方案提供商传漾科技即将宣布迎来第二轮融资成功暨两周年庆典。除了总部设在美国波士顿的著名风投企业经纬创投继续看好传漾之外,祥峰中国...
日期:07-26
经济日报:乐见中国网络文学“走出去”「网络文学人民日报」
  来源:经济日报联想拯救者r7000p2021外观  据外媒报道,中国网络文学作品首次被收录至英国国家图书馆的中文馆藏书目。英国国家图书馆是世界上最大的学术图书馆之一,一般会...
日期:10-03
天玑王中王!曝vivo全球首发联发科天玑9300:11月见_vivo的天玑处理器怎么样
快科技8月18日消息,博主数码闲聊站透露,天玑9300终端将于11月份登场。此前爆料信息显示,vivo X100系列将会全球首发天玑9300,由此看来,vivo X100系列会在11月份发布,这将是新一代...
日期:08-19
小红书梦工厂:造梦也圆梦
  赚钱不是唯一决定性的,重要的是多看一些活法。  编者按:本文来自微信公众号刺猬公社,作者:弋曈,编辑:园长,创业邦经授权转载。  榫卯,一种中国传统建筑、家具的主要结构,起源...
日期:08-24
华为拿下今年第二大 5G 大单_华为获首个5G
  10 月 4 日消息 中国移动上周发布了的招标公告,其中备受关注的 75 亿大单“中国移动 2021 年 4G/5G 融合核心网采购招标”结束,华为拿下第一份额,这意味着华为夺得今年第...
日期:12-16
可调屈光度的Rokid Air 4K AR眼镜海外众筹额超11万美元(rokid air AR眼镜)
  据报道,国内AR眼镜厂商Rokid在Kickstarter平台启动Rokid Air众筹,已筹集114,672美元。它将成为该公司首款低于500美元的消费级AR眼镜,对于近视人群友好,支持近视用户(500度...
日期:08-24
消费者投诉爱帮网售假 爱帮称供货商违约发假鞋
近日,一家名为爱帮网的团购网站出名了。据了解,爱帮团在4月28日~5月3日上线了耐克鞋团购项目,却陆续接到消费者投诉,称鞋子是假货。 昨日(5月12日),记者从爱帮网方面了解到,截至5...
日期:07-27
CLE中国授权展 | 东京奥运会赛场外,IP/品牌们的角逐同样激烈_CLE中国授权展
  虽然2020东京奥运会由于疫情原因延期了一年,但其受到的关注度始终不减。7月23日,东京奥运会正式开幕,如今比赛已经进入了白热化阶段。赛场内,中国运动员们顽强拼搏、斩获...
日期:07-17
媲美索尼IMX766,5000万像素手机传感器思特威SC550XS量产_思特威sc3335参数
目前,国内CMOS领域供应商思特威旗下,主打高端旗舰主摄市场的50MP超高分辨率1.0μm像素尺寸图像传感器新品SC550XS已经开始量产出货,另外一颗高端产品SC520XS,在本季度也进入小规...
日期:07-03