您的位置:首页 > 媒体评论

ChatGPT带来的巨大范式转移,意味着什么?

发布时间:2023-03-06 02:08:00  来源:互联网     背景:

整理|孔月昕

编辑|马吉英

头图摄影|邓攀

ChatGPT“晕菜”了。

去年第一次跟ChatGPT对话时,周伯文特意给它出了一道难题:“我的朋友比他领导大10个月,他们现在结婚3年了,请问结婚50年时他比他的领导大几个月?”

ChatGPT也的确被这个脑筋急转弯似的简单推理难住了,“它一五一十地跟我分析计算,大意是现在大10个月,结婚3年了,离他们结婚50年还有47年,一年有12个月,47×12等于多少,再加上10个月,那时候他会比他的领导大400多个月。”

周伯文是清华大学惠妍讲席教授、清华大学电子工程系长聘教授和协同交互智能研究中心主任、衔远科技创始人,由于长期研究自然语言、大模型和人机对话相关技术,他清楚地知道当前技术的优势和短板。周伯文表示,目前写作和总结类相关问题,ChatGPT可以有理有据地高情商回答,但一旦涉及到知识与推理的结合,它的短板就显现出来了。

尽管如此,周伯文依然非常看好ChatGPT的前景,“我们对ChatGPT的态度是‘到来不吃惊,影响不低估,未来有办法’。”

目前ChatGPT的应用非常广泛,这背后需要大量的数据和算力去支持大模型。在周伯文看来,虽然国内资金充裕和能力十足的大厂纷纷下场,但受限于自身业务发展,而且也会经历一个较长的研发时间,再加上大厂在公司发展决策上的种种顾虑,比如管理层和技术leader的认知和预期是否一致,还要考虑股价、投资回报率等,究竟谁(的大模型)能跑出来现在要打一个问号。

周伯文也提出了另一条可行的路径,“我认为在垂直领域里结合应用端到端的去训练、逐步发展为大模型的模式是一条值得重视与探索的路,尤其是对创业公司来说。因为目前的市场足够大,创业公司只要先做好一个垂直领域,帮助自有的大模型带来数据、场景的闭环,也因为客户价值清晰明确,有明确的付费模式支持,模型越来越强大的路径就会打通。”

而这一端到端路径也在周伯文的创业过程中逐渐得到验证。2021年底,周伯文创立衔远科技,并研发了多轮对话模型ProductGPT,旨在与专业人员深度交互协同,帮助企业高效打造爆款创新产品。3月1日,衔远科技宣布已完成由启明创投领投,经纬创投跟投的数亿元天使轮融资。

近日,周伯文在与《中国企业家》的一次内部交流中,发表了主题演讲《When we chat about ChatGPT,what do we chat about?》,主要介绍了协同交互智能与多模态学习领域内的最新进展,与对ChatGPT在未来产业应用的展望。

本次演讲要点包括:

1.ChatGPT的出现是必然的,OpenAI这家公司首先做出来则是有一定偶然性的。

2.ChatGPT还远远不到通用人工智能的程度,其推理、知识等能力存在明显短板。

3.ChatGPT第一次实现了人跟AI多轮协同共创,这带来了一个巨大的范式转移。一旦范式成立,会形成一种人工智能推动新知识发现的新飞轮。

4.研发通用大模型的成本非常高而且是一个不断提升的移动目标,从垂直大模型加场景端到端做起,慢慢迭代出更大的商业模型,或许是创业公司更适合的做法。

5.AI的下一个突破会从纯虚拟的存在转到帮助人在物理世界、生物世界和信息世界里更高效洞察、形成新知识并完成任务,创造更高价值场景。

以下为演讲内容,有删减。

01

2021chinajoy直播

ChatGPT的短板与长处

对于我们业界研究的人而言,我们很早就预见了AI能力的涌现。AI的发展是有一个长链条存在的,从机器学习到神经网络到深度学习,到Transformer模型,再到GPT-3,InstructGPT,一直到ChatGPT,整个路径非常清晰,所以ChatGPT的出现并不是一件完全不可预见的事情。

即使没有OpenAI,AI能力技术也会在这一两年里涌现,所以我认为ChatGPT的出现是必然的,OpenAI这家公司做出来则是有一定偶然性的。

OpenAI为什么能做出ChatGPT呢?

我认为,虽然这个工作本身是OpenAI自己参与,但绝对离不开整个学术社区的帮助。

像我们说的Transformer模型,就是基于多头自注意力等学术理论的进一步深入,并在成功后获得更多研究分析其机理的合理性。这些学术社区的研究验证了大模型在被大量数据训练后,确实能存储丰富的知识了,它的表现就不是随机生成的过拟合。这些进展让公司更有勇气砸大量金钱去训练模型,一定需要证据证明方向是正确的,而这些研究就是一个非常好的证据。

另外,还一定要有竞争,如果GPT模型没有跟同期的BERT(Google的预训练模型)模型长期竞争,它的进展不会这么快。

ChatGPT还对两个理论进行了验证,一个是数据越多,能力越强,就是线性放大的理论“Scaling Laws”;另一个是“能力涌现”,就是模型大到一定程度后,它就会突然开始融会贯通了。

但在我看来,ChatGPT还远远不到通用人工智能的程度。ChatGPT证明了通过大量的无监督学习的有效性。但人工智能要更具通用性,还需要具备知识、计算、推理这三种能力的组合能力。

ChatGPT目前做得比较好的是计算,在推理上也出现了一些能力涌现,但复杂推理的程度比较低。比如说人可以进行多跳推理,直接从a推导出c来。但ChatGPT的推理能力在两跳以上后,它就会迅速降低到20%的准确率,因此我说这个能力还远远不够。知识层面,目前ChatGPT的知识是不完备的。

ChatGPT的第二个短板,就是模型越大并不一定意味着越好。当训练模型规模达到一定界限时,AI在某些任务上的表现反而会下降。因为目前AI真正的想象力和推理能力有很大的缺陷,一旦投喂数据越多,模型越大,它的思维和创造力就会被固化了。

ChatGPT能做到现在这个地步,除了底层大模型的能力涌现之外,它有一个非常主要的贡献,就是通过人的协同和交互来加强AI的能力。

举个例子,如果我们问GPT-3(ChatGPT的基础模型),请跟一个6岁的小孩解释登月工程。找到可能的答案对GPT-3一点都不难,它至少能找到4个答案:a是从万有引力出发解释这个问题;b可以从历史出发,比如苏联卫星上天了,导致美国的危机感,所以启动登月工程;c可以从天文学出发,月亮是地球的一个古老卫星;d可以从人类的美好愿望出发,月亮上有嫦娥有玉兔,我们人类老想去那里。

这个问题到底难在哪?是GPT-3不知道哪个答案更适合给6岁的小孩。

OpenAI就想了一个非常好的办法,就是让人给答案进行排序。在面对6岁小孩时,人的排序就是d>c>a=b,即从d开始讲,6岁小孩更容易接受。当人把反馈给了GPT-3后,它就会把反馈学去了,学会对答案怎么排序,排完序之后的模型,就从原来的GPT-3变成InstructGPT(ChatGPT的初始版本)。GPT-3大概有1750亿训练参数,而InstructGPT只有它1%的大小,即13亿参数。但是这个模型它学完后,你再去问它,给6岁小孩写一首关于青蛙的故事,他就会在开头说once upon a time,类似于儿歌一样的开头。

由此可见,人的反馈对ChatGPT非常重要,能够让它以人的价值观和理解去学习排序,这也是人类用户感觉到ChatGPT有很高情商的原因。但这是很多人担心的,ChatGPT能学习到带有带有训练用户价值观的输出,通过排序打分会改变它采用答案的优先级,这也是为什么很多监管部门在关注这个问题的原因。

此外,ChatGPT的多模态协同交互也非常重要。同时,AI与环境的协同演化也很重要。ChatGPT这个人机协同的系统,很难用到非常复杂的需要实时的终端里去。如何在不同的边缘计算资源、通信带宽条件下,有效利用类ChatGPT的能力?这是产业互联网及其生产实践里的一个非常重要的话题。

我们现在也在研究如何让云端的ChatGPT的能力,能够部署到工厂的生产、设计、实践各个环节里进行有效利用,通过终端跟专业用户的交互协同,把人的专业知识学习放到边缘端的模型里,同时又能让云端的ChatGPT根据大量边缘端的进步不断迭代。按照InstructGPT的模式,就变成了原来是云端模型直接跟人交互,现在是云端大模型与边缘小模型交互,这些小模型再去跟人交互,这就是我们团队研究的AI与环境的协同。这也是在学术界,值得我们未来10年去研究的重大课题。

02

一个巨大的范式转移

ChatGPT的出现是一个里程碑事件,过去二十多年里,为公众所熟知的DeepBlue、IBM Watson和AlphaGo等AI应用,往往通过与人类竞争制造热点,并以超过人类的效果获得广泛关注,而ChatGPT第一次提出了人跟AI协同共创,这带来了一个巨大的范式转移。即人工智能的新一轮创新一定会围绕人机的协同共创来展开。这个路径展开后会带来更大量的应用,进而带来生产力格局的演变。这对人工智能技术企业的影响非常深刻。

另外,从更高层面上来讲,ChatGPT对相关行业影响也非常深刻。

我举一个科研的例子,《Nature》杂志1月5日的封面文章,主要就讨论了过去几十年人类科学的论文越发越多,但突破性的成果越来越少的问题,不光在中国,整个世界都出现了同样的情况。

我认为重要原因之一就是随着科技的大量发展,每个学科都已经非常完善,学科里面开始形成了信息茧房。在一个学科非常小的子领域内,论文就越来越多,而在这个领域里,研究人员要读大量的论文才能覆盖一个很小的领域,所以信息茧房内的信息过载,茧房之间壁垒过高,最终导致一个研究人员要花大量时间去掌握这些知识,那他创造的时间就少了,交叉创新的机会就更少了。

设想如果人工智能系统可以把大量领域里的所有基础内容全部掌握,然后去跟人对话、去交流、可以帮人做各种验证、论证和计算,和启发人,这样最终人就可以有更多时间做最有创造力的突破性工作。

这就是我们讨论的一种新范式。这种范式一旦成立,意义极其巨大,会形成一种人工智能跟知识发现的新飞轮。即人工智能做得越强,它的知识、理解、推理等组合能力越强,就越能帮助人类发现更多更好的突破性的科学进展和新知识,包括新药的发现、癌症的治疗、人脑的研究等。

而随着这些新知识的获取,我们就越能帮助世界创造出更好的人工智能,新的人工智能突破又能带来更多知识,形成人工智能-知识的一个正向飞轮。

03

AI加速产业创新与应用

我认为,人工智能会帮助人类做更好的高质量发展。

因为AI能够助力企业创新,这也是我在产学研结合领域非常关注的事情。我们希望借助人工智能的数据分析、理解推理、计算能力、设计能力,去帮助人更好地洞察市场、洞察消费者、进而设计出创新的产品。也就是生成创意、生成产品、完成设计图纸、生成销售计划等原来需要很多专业人士完成的工作,都可以让AI帮助加快做成,最终让人来做判断,这是生成式人工智能、人机协同带来的全新的创新。

如果这样去考虑的话,有很多产业机会值得关注。因此有很多投资者问我,怎么看人工智能和大模型ChatGPT的未来产业机会?

我的回答就是,去观察一家美国硅谷的VC叫A16Z。这家非常有名的高科技风险投资机构把整个生成式人工智能AIGC技术分成这么几类:最底层的是计算硬件,如GPUs;再上层的是做云计算平台的,如AWS,以及国内的阿里云、腾讯云;再往上就是作闭源人工智能通用大模型,如GPT-3、ChatGPT等的公司如OpenAI,以及一些开源模型。基于这些模型,上面有做各种应用的公司;特别值得注意的一类就是把底层自有大模型能力和应用融合起来,我们叫端到端的公司。

A16Z的观点是,目前ChatGPT等非常新的前沿技术,具体的可持续的商业模式还不明确。不像底层的计算硬件和云肯定会获利,包括微软等公司;应用层做APP的,因为没有护城河,也难以保证获利。唯一明确就是端到端的公司,如美国的Midjourney,具有非常明确的前景,这家公司现在每年能拿到1亿美元的可持续订阅费。衔远科技按照A16Z对业务模式分类中就属于端到端的应用。

为什么这种模式从长远看更有竞争力?从技术角度来讲,是因为它把基础设施、大模型、应用场景和终端用户形成了一个非常重要的闭环。当公司有了具体的功能让终端用户使用,进而会产生非常多的使用数据,数据反馈后又能帮助提升应用,也能帮助提升基础模型能力,最终模型也会不断去调优迭代越做越好。

此外,大模型也是未来产业发展的重点,但大模型的商业模式值得探讨。因为大模型的成本壁垒非常高,大公司和小企业都有各自的负担。所以我觉得从端到端做起,慢慢迭代出更大的商业模型,或许是更适合的做法。

这样又会产生一个疑问,就是把闭源模型加上一个垂直应用打包在一起,是否能取得端到端的商业模式?

ChatGPT现存的一些弱点,让这个问题的答案是明确的否定。目前,ChatGPT就像一个典型的“万金油”,它什么都知道一点,也能非常合乎逻辑地把一些信息整合出来,但很多回答存在无法保证信息准确、量化的问题;第二,对于信息特别是数据自身的关联,它难以建立背后的逻辑;第三,它不能提供独特的洞见,它基本上就是一个更高级的留声机。

一旦垂直领域专业用户使用ChatGPT,他就会发现ChatGPT提供的答案,要么就是专业用户都知道的内容,要么它可能一本正经地信口开河,不能保证它回答的对不对。

因此,衔远科技做了一个垂类的模型,叫ProductGPT,帮助企业做产品创新。它可以帮助垂直领域的企业工作人员做创新,在回答时给出非常全面的分析。因为它有很详实的数据支持,另外它能够按照品牌、品类、特点去展开深度分析,真正帮助到专业人士。

ProductGPT作为垂直领域的协同交互式人工智能,按照我们目前收集的测试,它能够让创新机会翻10倍,上市周期快将近10倍,创新成本大量降低,帮企业带来收入、业务增长和利润。

04

ChatGPT对产业、政策、监管等的意义

ChatGPT的多轮生成对话,可能会引发一些新的人工智能治理问题。我总结了三点:

1.如何从治理的角度对ChatGPT的输出加以标注?

对人工智能生成的内容中有可能存在彼此矛盾冲突的信息、错误知识、过时知识、谎言、偏见、种族歧视等予以标注,帮助用户谨慎对待。比如,我们需要讨论是否及如何对AI产生的内容增加数字水印,让大家看到时就知道是人工智能生成的而更谨慎对待?

2.ChatGPT相关的知识产权问题及相关法律问题研究。

rog魔霸5plus3070

ChatGPT在实际应用场景中必然会引发许多版权问题,其训练过程中使用了海量互联网语料,这种对已有文本数据的模仿也会构成侵权。ChatGPT生成内容的知识产权是归用户,还是归原创内容的所有者,还是归OpenAI?同时,因为使用ChatGPT带来不良后果的责任该由谁来承担,相关的法律问题也亟待研究。

iphone13pro怎么截屏

小米13上市时间及价格

3.ChatGPT使用范围的界定,其已经对许多行业带来了冲击。

例1:中学生会借助ChatGPT来完成作业,但由于其生成内容的不可控性,会带来法律、安全、伦理风险,甚至引导学生犯罪。

例2:在学术研究中,如果把思考任务交给自动聊天机器人,也会违反学术伦理规范。

我今年年初在美国计算机协会的会刊ACM Computing Surveys上,发了一篇论文 《可信赖的人工智能:从原则到实践》提出,可信赖的人工智能不是一个孤立的问题,一定要把人工智能的可解释性、抗攻击性放在一起综合考虑,包括ChatGPT现在碰到的问题,都值得在学术上面研究。有关泛化性、可解释性、透明性、可复制性、价值对齐、负责任等问题都是需要去解决的。所以总的来讲,现在人工智能还有很多的工作要做,特别在ChatGPT的大背景下,学术研究、监管和实践是三位一体的,要互相迭代。


返回网站首页

本文评论
他们造最新的电动车 他们开最旧的二手车「旧电车价格」
文|Dedee2022年,中国的汽车出口量超过德国和韩国,达到332万辆,同比增长56.8%。成为世界第二汽车出口国,仅次于日本。与此同时,还有一个发展中国家,以286.56万辆的出口量超过了德国...
日期:03-02
联想王立平:做强混合办公的“1”, 做大行业场景方案的“N”,用智慧办公释放企业生产力
  “我们要做强“1” 做大“N”,才能让智慧办公高效释放生产力。”在30日举办的联想智慧办公发布会上,联想集团副总裁、中国区大客户业务群总经理王立平表示,希望通过对混合...
日期:07-10
理想汽车没了1600亿 蒸发掉一个起亚
本文字数:2561|预计7分钟读完光环褪色。记者丨杨松编辑丨鄢子为一加10月发布会三个月时间,理想汽车港股股价跌了一半,市值蒸发1570亿港元,相当于跌去一个起亚。四家上市的新造车...
日期:10-12
雷军4万字重磅分享:“小米模式”12年,我们培育了巨大的耐心「网友为小米创始人雷军」
2020年,极客公园创始人张鹏曾问雷军:如果站在今天,你作为投资人,会不会投资十年前的自己?雷军的回答是,不会,成功概率太小。相信看完雷军的复盘《小米创业思考》,我们才能真正体会雷...
日期:10-15
美团优选一直都可以这么便宜吗_美团优选,还能再让人省些吗?
现代居民的购物习惯正在悄然发生变化——以往扎堆线下超市、便利店采购的消费者们,从几年前开始多了“美团优选”这个新选项。2020年,董梅在儿子的帮助下学会了网上下单买菜。...
日期:10-14
乾隆、拿破仑和《公司的力量》「拿破仑的领导力」
什么是公司的力量整理 | 曹 毅封面来源 | 摄图网公元1759年,一份御状递到了乾隆的书桌上,告状的是一位名叫洪任辉的英国商人,他声称因为中国商人的欠款问题,“本国公班衙派我上...
日期:09-15
刘强东错过了什么?「刘强东的过去」
作者|小满声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。近日,刘强东现身首都机场的消息引发了公众关注。p2p小牛在线最新消息自2018年开始退居幕后,2022...
日期:02-06
对消费的控制权 终于回到年轻人自己手中_剥夺消费者选择权
你知道“早C晚A加B”吗?如果知道,那么你大概率是一名消费方面很注重论据的“成分党”。近两年,护肤消费市场正刮起一股凶猛的“成分护肤”浪潮,消费者更加愿意亲自下场研究美妆...
日期:10-16
王传福和曾毓群的“新能源二人转”
步入2023年,汽车行业最明显的变化,就是新能源补贴将彻底退出历史舞台,如果后续再取消免费购置税政策,中国市场销售的新能源汽车将与燃油车展开正面竞争。这项从2010年开始实施的...
日期:01-07
三体动漫上线了吗_《三体》动画定档12月 B站推出49部国创作品新内容
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。图片来源 B站《三体》动画将于12月3日...
日期:11-09
马斯克和推特ceo_解析马斯克的经商“秘笈”,他为何玩不转推特?
马斯克曾成功打造特斯拉、SpaceX凤凰网科技讯 北京时间12月19日消息,多年来,埃隆·马斯克(lon Musk)已经建立了一套行之有效的经商秘笈,借此创办了从特斯拉到SpaceX在内的公司...
日期:12-20
微软停止win7更新_你为啥不升级?Win7将彻底退出历史舞台:微软留福利能免费升级Win11
  从本周二开始,微软将不再为专业版和企业版的Windows 7提供扩展安全更新。与此同时,微软鼓励Windows 7设备用户升级到更高的Windows操作系统版本,特别是Windows 11,尽管它在...
日期:01-11
直播带货未来展望_直播带货,未来堪忧?
图片来源@视觉中国文 | 王智远目前主播带货,算是带动消费最重要手段之一,原因在于,它能使商品更多暴露在人们视野中,并通过一系列可显性手段,刺激用户潜在需求,从而促进供给和供需...
日期:11-14
威马最大的问题 不是给创始人12亿年薪_威马管理层
|GUIDE|■ 怎么看待威马创始人的12亿年薪?■ 威马是怎么全方位掉队的?■ 下半场,威马还有机会吗?作者|连禾编辑|嘉辛冷不丁地,“威马年亏82亿创始人年薪12亿”登上了上周末的热搜。为...
日期:09-29
日系混动和国产混动_中国人造混动 就该压着日系打
出品|虎嗅汽车组作者|李文博编辑|周到头图|视频截图“油车时代丢掉的阵地,要在电车时代夺回来。”5 年前,许多中国品牌车企都说过类似的豪言壮语。如今,他们总算交出了不错的答卷:在...
日期:11-20
威马汽车资本局:亏损174亿换来月销2千,沈晖拿走公司三成收入?
核心提示:1. 威马近三年累亏174亿元,亏损最严重的2021 年,威马向管理层支付了17.5 亿的薪酬,其中,总薪酬的72%,也就是12.6亿元落入了威马汽车创始人、董事长兼CEO沈晖手中。2. 在...
日期:09-28
中山大学研究发现:倒班工作导致全因痴呆风险增加30%
倒班工作与非倒班工作相比,全因痴呆的风险增加30%。近日,中山大学孙逸仙纪念医院神经科教授唐亚梅团队研究发现,倒班工作与非倒班工作相比,全因痴呆的风险增加30%,并且这种关系...
日期:01-02
从一颗CPU看中国芯片的未来「当今的cpu芯片除了包括」
原标题:从一颗CPU看国产芯片的未来国产处理器公司龙芯近日发布了用于服务器市场的具有自主知识产权的新一代3D5000系列芯片。具体来说,3D5000芯片是使用Chiplet(芯片粒)技术把两...
日期:01-06
拥抱理想的任正非 可以比谁都现实吗_拥抱理想的任正非 可以比谁都现实
作者 | 丸都山出品 | 虎嗅科技组头图 | 视觉中国8月23日,据第一财经报道,任正非于22日在内部论坛上签发了一篇关于《整个公司的经营方针要从追求规模转向追求利润和现金流》的...
日期:08-26
腾讯会议们为什么就非要免费?「腾讯会议为什么不收费」
1月12日晚间,有媒体爆出腾讯会议取消免费模式的传言,次日虎嗅从腾讯公关部门得到回应:这则消息不属实。目前相关媒体已经做了删帖处理,然而这个传闻却引发了行业对B端SaaS软件收...
日期:01-16