您的位置:首页 > 互联网

谷歌工程师2018年内部信曝光,5年前就有人拉响AI警报了

发布时间:2024-02-13 17:09:58  来源:互联网     背景:

机器之心报道

编辑:张倩

看起来,虽然行动慢了一些,谷歌搜索的地位暂时还无人可以撼动。

2023 年 2 月,谷歌 CEO 桑达尔・皮查伊(Sundar・Pichai)对内发布了一份红色代码预警,要求谷歌旗下用户超 10 亿的产品尽快接入生成式 AI,以对抗来势汹汹的 ChatGPT。

这一举动给人一种谷歌慌了的感觉,因为 ChatGPT 的到来已经威胁到了谷歌核心的搜索业务:如果大家都习惯用 ChatGPT 这类 AI 对话引擎直接得到答案,谁还会去谷歌搜索呢?谁还会去谷歌投广告呢?

乍看起来,这一切都发生地非常突然,谷歌应对起来也很被动。但其实,早在 2018 年,谷歌内部就已经有工程师拉响了警报,指出 AI 正在对谷歌的业务带来风险,尤其是网页搜索。

众所周知,谷歌借助用户交互数据对搜索结果进行排名。通过观察用户与搜索结果页面的交互方式(点击结果、后退、点击其他内容),谷歌能够知道哪些页面与特定查询最相关。多年来,这帮助谷歌保持了搜索相关性的领先地位,因为它比其他任何搜索引擎都拥有更多的用户交互数据。

但在 2018 年底,谷歌的工程师们突然意识到一个惊人的问题:复杂的语言模型最终将能够仅通过网页文本理解网页,而无需任何用户反馈。而这可能会危及谷歌在搜索领域长达 20 年的优势,这种威胁甚至可能来自一家小型初创公司。

谷歌资深软件工程师 Eric Lehman 就是早早意识到这一问题的工程师之一。为了表达自己的这份担忧,他还专门写了一份邮件:

我想写写我在假期期间思考的一个问题:  

在不远的将来,深度机器学习系统将明显优于谷歌 20 年来积累的网页搜索相关性算法。

此处我所讨论的仅限于相关性—— 即判断一个文档与一个查询讨论的是否为同一主题。网页排名还涉及许多其他方面,在这些方面,机器学习似乎不那么适用。但我认为,基本的相关性是网页排名的核心任务,足够客观,可以很有效地使用 ML。

没有人能预见未来,但我敢打赌,这几乎肯定会在 5 年内成为现实,甚至可能在 6 个月内成为现实。类似于网页排名的问题一个接一个被解决,几乎没有理由认为网页排名会是个例外。实际上,这个问题思考的出发点是源于 AI 最近在网络问答方面取得的进展,深度 ML(具体来说是 BERT)突然取代了之前几乎所有的工作。

对于网页问答团队来说,过去几周深度 ML 带来的巨变是完全出乎意料的。有了这次预警,我们不应再被意外打败;相反,我们应该从现在开始考虑其后果。而且,现在正是时候,因为我预计在新的一年里,很多网页排名工程师将会反思 BERT,并开始沿着这些相同的线路思考。

一个需要考虑的事实是,这样的深度 ML 系统可能会在谷歌之外的地方被开发出来 —— 比如在微软、百度、Yandex、亚马逊、苹果…… 甚至是一个创业公司。在我的印象中,翻译团队已经有过这种经历。深度 ML 彻底改变了翻译领域;过去的优势被一扫而空。幸运的是,谷歌在深度 ML 上的巨大投资得到了回报,我们在这个新领域表现出色。然而,我们的新 ML 翻译器在基准测试中仍然被一家小型创业公司超越。

我们可以从 BERT 中得出一个惊人的结论:大量的用户反馈在很大程度上可以被原始文本的无监督学习所取代。这可能会对谷歌产生重大影响,导致谷歌在相关性方面输给其他公司。

网络搜索中的相关性可能不会很快被深度 ML 所颠覆,因为我们依赖的记忆系统远大于任何当前的 ML 模型,并且包含了大量关于语言和世界的重要知识。此外还有许多性能挑战和特殊考虑等。尽管如此,我认为我们当前方法的优势最终会消失;ML 正在迅速进步,而传统技术则不然。

我不知道其他人怎么看。个人而言,我倾向于认为这个未来几乎是不可避免的,但我还没有深入思考其后果。我们可能需要思考的一些问题包括:

我们能不能现在就采取措施,确保自己引领这一变革,而不是成为变革的牺牲品?就我个人而言,我不想在未来几年,人们回顾时认为,那些坚守传统网页排名方法的人被新潮流碾压,而他们却毫无预警……我们能否制定一个 2019 年的合作目标,结合研究力量,利用深度模型击败我们现有的最佳预测呢?

我们如何在不打击士气的情况下与从事网页排名工作的人讨论这个可能的未来?

我听说翻译团队几年前就决定all in大规模 ML,现在回想起来,这似乎是明智之举。今天,我对围绕相关性采取如此极端的措施持怀疑态度,因为从现在到深度 ML 方法真正占据主导地位的这段时间里,我们可能会牺牲传统方法所取得的重大成果 —— 我认为这至少还需要几年的时间。然而,听到 BERT 的警示而不调整我们的计划似乎也是不明智的。

在谷歌内部,Eric Lehman 可能不是唯一发现并指出这一问题的人。在此之后,谷歌也确实采取了一些做法来更新自己的搜索系统。比如,在 2019 年 10 月,谷歌正式宣布,他们的搜索引擎用上了 BERT,能够改善 10% 的搜索结果。一年后,谷歌又宣布,几乎所有的英文搜索都用上 BERT 了。

不过,在之后的两三年里,谷歌并没有采取更激进的措施,比如直接做一个基于大型语言模型的搜索系统,直接给用户答案。这就给很多创业公司提供了机会,比如 AI 驱动的搜索引擎 perplexity。

这家公司的 CEO 表示,在推出 perplexity 的最初几周,一位谷歌老员工就对他说过,不用太担心吸引大量用户来与谷歌竞争。你生活在一个可以从原始网络文本中进行无监督学习的时代。你并不需要那么多点击流数据就能构建出好的索引和排名系统,这就是你的机会。

荣耀magicbook152021锐龙版

那么,谷歌为什么没有再接再厉,及早推出基于大型语言模型的搜索系统呢?有人分析出了谷歌当时的几个顾虑:

  • 会对依赖蓝色链接(即传统搜索结果链接)流量的生态系统造成太大伤害:谷歌搜索的一个主要功能是将用户引导到其他网站,而采用 LLM 答案系统可能会直接提供答案而非链接,这样会减少引导到外部网站的流量,对依赖这种流量的网站造成影响。

  • 即使谷歌决定因为竞争对手的压力而接受这种变化,监管机构可能也不会同意。从监管的角度看,直接提供答案而减少对其他网站链接的引用可能会引起关于市场垄断和竞争公平性的担忧。

  • 即使在美国,监管机构可能不采取行动,这种威胁本身也是令人瘫痪的:这意味着,即便没有实际的监管干预,仅仅是存在这种可能性和随之而来的法律和公众压力,就足以使谷歌在采取这种策略方面犹豫不决。

在 ChatGPT 走红之初,Meta 首席人工智能科学家 Yann LeCun 也表达过类似想法,表示大公司确实更难以推动这种大的革新,因为他们面临的公众、监管压力要更大。

后面的故事走向大家都很熟悉了:除了像 perplexity 这样的搜索新秀,谷歌还要应对来自微软的威胁,后者通过与 OpenAI 合作,将自己的搜索引擎彻底重构,打造了新必应。

不过,在过去的一年里,微软的新搜索业务并没有对谷歌形成真正的威胁。根据美国网站流量统计服务商 Statcounter 公布的统计数据,2023 年 2 月 Bing 在全球市场的份额是 3.03%,在一年时间过去后,其市场份额仅仅只是达到了 3.4%。这可能和新必应使用体验不佳、提示工程门槛较高等因素有关。与此同时,基于最新的 Gemini Ultra 模型,谷歌对于搜索引擎的重构步伐也在加快。看起来,虽然行动慢了一些,谷歌搜索的地位暂时还无人可以撼动。


返回网站首页

本文评论
斯坦福科学家仅用600美元就克隆了OpenAI的ChatGPT_斯坦福2%顶尖科学家榜单
如果说复制了一个OpenAI的ChatGPT的成本仅需600美元你会不会感到意外呢?事实上,斯坦福的科学家们真的做到了。上周,斯坦福大学基础模型研究中心上周宣布,其研究人员使用 OpenAI...
日期:10-06
核污水排海韩国已出现连锁反应:没人吃海鲜、鲍鱼养殖户破产量激增、金枪鱼暴跌
当地时间8月24日13时,日本福岛第一核电站启动核污染水排海。由于日本强推核污染水排海,越来越多的韩国人不愿意再购买水产品,餐饮业等多个领域都出现了连锁反应。在韩国仁川市...
日期:08-26
受央视《新闻联播》关注!移动云带来算力网络最新成果
8 月 18 日,由工业和信息化部、宁夏回族自治区人民政府主办的 2023 中国算力大会在宁夏银川隆重开幕。移动受邀参展,重点展示“百川”算力并网、算网大脑、中国移动云电脑、量...
日期:08-22
联想服务器市场份额「连续三个季度居全球第三  联想服务器业务蓄势待发」
通信世界网消息(CWW)近日,全球知名市场调研机构IDC正式对外发布2023Q1 x86服务器全球市场追踪报告,报告显示,联想服务器厂商收入同比增长高达39.9%,再次获得全球第三的的成绩,据悉...
日期:06-10
奥特曼怒赞苹果Vision Pro:自iPhone以来第二惊叹的技术_苹果奥特曼手游
快科技2月11日消息,作为苹果第一款穿戴头显设备,Vision Pro头显是否为划时代产品还有待验证,不过已经有科技大佬给出了很高评价。OpenAI CEO山姆奥特曼(Sam Altman)在X上发帖称,Vi...
日期:02-11
曾宣称创造室温超导的美科学家材料科学论文又被撤回,将面临调查
8月16日消息,今年3月,美国罗切斯特大学的物理学家兰加·迪亚斯(Ranga Dias)声称开发出了一种室温超导材料,受到业内的强烈关注。当地时间本周二,知名物理学杂志《物理评论快报》(P...
日期:08-16
上线 17 年,腾讯《QQ 堂》今日正式停服_QQ堂下架了吗
  今日,腾讯旗下休闲娱乐游戏《QQ 堂》将正式停止在中国大陆地区的运营。这款游戏将于今日 11 点关闭服务器,届时玩家将无法登录游戏。   《QQ 堂》于 2004 年底上线,至...
日期:07-18
这个行业真的凉了?腾讯系宣布“撤离”,专家:越早停产越好_腾讯衰败了
  每经记者 杜蔚;;每经编辑 魏官红 何小桃 盖源源;;  继亚马逊Kindle宣布退出中国后,腾讯也决定从电子阅读器赛道上“撤离”。  自9月26日起,不少网友表示收到了QQ阅读...
日期:10-05
卖手机壁纸,也能赚钱!_卖手机壁纸,也能赚钱是真的吗
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。一直和各位强调,围绕图片的生意,大有可为!不管是PS婚纱照、给别人修改...
日期:12-12
中国电信天翼1号2021京东正式开售,和“手机内存不足”说拜拜_天翼1号2021手机值得购买吗
  很多人买手机一用就是两三年起步,所以更喜欢大内存的手机,但众所周知,大内存意味着价格方面更高一些。最后买了内存相对较低的那款,用着用着就后悔了,尤其对于女性朋友们,光...
日期:08-27
芯片研发上市公司「Arm 架构芯片累计出货量超 2500 亿片 公司 CEO:今年完成上市」
2月8日消息:A日本软银集团旗下的英国芯片设计公司Arm今日公布了2022年第三季度财报,第三季度营收7.46亿美元(当前约50.65亿元人民币),同比增长28%。iphone 13 pro 128g支持4k拍...
日期:02-08
从濒临破产到市值破万亿美元、相当于5个阿里,华人黄仁勋如何创造英伟达?
英伟达CEO黄仁勋在国际电脑展Computex 2023上展示产品出品 | 科技作者 | 梁昌均编辑 | 杨锦GPU巨头英伟达的股价仍在继续上涨。最新美股交易日,英伟达盘中股价一度创下419.38...
日期:06-02
抖音图文带货,很赚钱「抖音图文带货,很赚钱吗」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。在抖音,就只能靠短视频和直播赚钱吗?长城汽车 智能驾驶传统图文真的没...
日期:06-06
荣耀90/Pro系列手机官宣5月29日发布_荣耀九百度百科
据悉,荣耀90系列已于4月现身工信部官网。其中荣耀90和荣耀90 Pro分别配备了66W充电器和100W充电器,荣耀90 Pro还支持20V/4.5A的90W快充协议。此外,据数码闲聊站爆料称,荣耀90系...
日期:05-17
10倍耐摔!官方揭秘小米14 Pro自研龙晶玻璃:复杂工艺叹为观止_小米pro14屏幕材质
快科技10月29日消息,在小米14 Pro屏幕面板中,小米采用了自研龙晶玻璃,让抗跌落性能提升10倍、1.32倍耐刮,比iPhone超瓷晶玻璃还要硬。今日,小米手机官方发文介绍了龙晶玻璃背后的...
日期:10-29
华为云MySQL新增“逻辑预读”特性,高效提升分析型业务的执行效率
  随着用户对数据访问速度的日益重视,MySQL数据库在最初的设计中,采用了线性预读的方式,提前将即将使用的数据预读到Buffer pool中,来提升数据的访问速度,但在实际使用过程中,...
日期:10-14
美国节日假期_经历两年低迷后 美国的传统假日消费季今年迎来“大丰收”
  在经历金融危机以来持续两年的低迷后,美国的传统假日消费季今年迎来“大丰收”。据全美零售商联合会(NRF)的最新预测,今年美国假日消费支出有望达到4515亿美元,较去年同期增...
日期:07-25
摩托罗拉19999元「4999元,摩托罗拉moto razr 2022调价,手机卷王又来了」
12月28日消息 moto razr 2022 调价直降 1000 元。联想中国区手机业务部总经理陈劲宣布,moto razr 2022 要成为首款定价在 5000 元以内的骁龙 8+折叠屏产品,起售价调整为 4999...
日期:12-28
小米三上市价格「小米13要涨价下周四发布,首发价或4499元起」
中关村在线消息:近日有消息称,受定位升级、成本、疫情、汇率波动等因素影响,即将发布的小米新一代旗舰机小米13系列预计售价将大幅上调,上调幅度将达15-20%,小米13售价将在4500...
日期:11-27
哈啰单车崩了?官方回应:已修复,受影响用户补偿1天骑行卡_哈罗单车欠费有事吗
讯 8月15日上午消息,今日早间,有许多网友在社交平台反馈称,哈啰单车崩了,手机无法扫码解锁车辆,由于正好是周一早高峰,不少用户出行受到影响。对此,哈啰在其官方微博回应表示,由于第...
日期:08-17