您的位置:首页 > 互联网

对话商汤首席科学家王晓刚:AI 大模型只强调“大”是严重误导「王晓刚教授」

发布时间:2023-05-22 11:45:42  来源:互联网     背景:

声明:本文来自于微信公众号 雪豹财经社(ID:xuebaocaijingshe),作者:黄鹏,授权转载发布。

让4000块GPU协同连接,能高效并行去做运算,这里面有许多的Know-How。

ChatGPT和国内产品都在不断进化,两者可能存在着非线性、加速增长拉开的差距。

通用人工智能不是一个静止的点,而是一个需要不断突破的新领域。

王晓刚教授

商汤科技内部有一个略显神秘的部门:人工智能伦理与治理委员会。去年,他们发布了《智能伦理治理年度报告》,提出AI的发展应“负责任且可评估”,并制定了内部监管要求。

这像是提前回应了年初马斯克等人呼吁暂停AI研究的言论。

当国内企业竞相投入大模型研发时,商汤已经抢跑了一年。这是一家看似“万事俱备”的公司,对AI的发展有充分的预案。

2014年商汤成立时,人工智能被看作一条通往未来的赛道,但躬身入局后,AI四小龙们发现这条赛道从技术到商业落地仍有着众多壁垒,曾被誉为“亚洲AI第一股”的商汤目前还未实现盈利。如今他们为国内政企客户提供包括智慧出行、智能座舱、手机SDK在内的AI解决方案。

今年初,ChatGPT重新带火了整个人工智能行业。4月10日,商汤发布了“日日新SenseNova”大模型体系,以及“商量”、“秒画”等一系列AIGC应用,成为继百度、华为之后,第三家发布大模型的国内企业。

此时,社交媒体的热搜话题已经从“什么时候能用上国产大模型”,变成了“我们和ChatGPT差距有几年”。

“不好简单用时间来衡量,”商汤科技的联合创始人、首席科学家王晓刚认为,一旦AI收到用户的海量反馈,“智慧飞轮”转起来,模型的进化速度将一日千里。

王晓刚2018年便开始带领商汤研发团队开发大模型,起初是视觉大模型,2021年切入NLP自然语言模型等领域。此前,他先后就读中科大少年班、香港中文大学和麻省理工,在顶级的国际期刊和会议发表超过300篇论文。最近半年,作为商汤的技术负责人同时也是绝影智能汽车业务的一把手,他频繁出现在公开场合,推介公司的技术成果。

王晓刚告诉雪豹财经社,公司在2018年就投入算力建设,是一个非常有前瞻性的举动,但他认为,这不是一个大力出奇迹的行业。他回顾了商汤大模型的研发过程,反复强调“Know-How”的重要性,对目前国内热炒的“万模之战”,他也冷静地提出了自己的看法。

以下是雪豹财经社与王晓刚的对话节选(经编辑):

商汤科技联合创始人、首席科学家王晓刚

雪豹财经社:商汤科技是从什么时候开始做大语言模型的?

王晓刚:2018年,商汤把总部落在上海时,我们就提出要建超算中心,后来才有了大装置的建设,奠定了算力基础。我们模型的研发是从视觉开始,先做出了有10亿参数的视觉模型,随后发现当视觉模型体量变大后,它能体现出极好的通用性,小模型也会受益。比如,早期的智慧城市交通项目涉及不同场景下人、车、物的识别,当时需要做出各自的专有模型,后来我们发现一个通用大模型就可以全覆盖。随后,我们在2021年开始了自然语言大模型研究,2022年我们研发了320亿参数的全球最大通用视觉模型,并开源了多模态模型书生2.0,今年3月书生2.5开放给社区,这些最终促成了我们的“日日新”大模型体系。

雪豹财经社:我们体验了商汤的 “商量”和“秒画”,感觉在中文理解方面的表现可圈可点。你们是如何教模型作诗的?

王晓刚:我们首先要解决的是工程问题:让4000块GPU(图形处理器)协同连接,能高效并行做运算,这里面有许多的Know-How(技术诀窍);其次要对模型做多轮训练。一开始,让模型写出一首质量过关的古诗是很难的,经过多轮对话的训练,包括一些辅助语料的投喂,才能逐渐让模型理解汉语的规律。而秒画也是源于我们自己本身的语言模型,因而它对中文语言的理解,生成的图像描述才更加准确。外界方式中,有用英文直接汉化喂给AIGC模型,这可能就会让模型产生误解,影响生成图像的效果。

雪豹财经社:ChatGPT是一个现象级的AI产品,也带火了国内的大模型赛道,这款产品对你有什么启发?

王晓刚:ChatGPT证实了我们的一个判断:随着模型体量的增加,人工智能的天花板会不断提升。这点是非常确定的,也是商汤一直坚持的。2022年底公开的ChatGPT-3.5,带来质的改变的是它对任务的算法处理能力。过去模型学的是数据,但GPT-3.5学习的是任务,而且可以不断解锁新的任务,这个给到大家新的启发。另一个就是AIGC带来的用户反馈,我们叫做“智慧飞轮”,在社区中,不只是专业研究员和科学家,还包括设计师和其他各行各业的人,大家一同参与模型的训练和制作,推动AIGC能力不断进步。

雪豹财经社:国内AIGC产品跟ChatGPT有多大的差距?有企业家说是2年左右。

王晓刚:我觉得这件事不能简单地用时间长短来衡量。单论模型基础能力和训练基础设施,大家都有着一定积累。ChatGPT的特别在于,当它出现的时候,全世界大量的人参与到数据创作过程当中。一方面使用模型创造了很多高质量数据,这些数据反过来又迭代,促进模型能力的提升。因而这是一个加速变化的过程,所以有可能是一个非线性、加速增长拉开的差距,应该用动态的眼光来看待,大家都在不断进化。

雪豹财经社:大模型是目前创投界大热的赛道之一,你怎么看“智能涌现”和这场“万模之战”?

王晓刚:今天国内谈大模型都在强调“大”字,但我认为背后还有很多重要因素,才会出现“智能涌现”,比如许多实现层面的Know-How。如果只强调“大”,单纯依靠模型体量实现“智能涌现”,会有严重的误导性,会让我们浪费很多资源和时间。关键是要结合行业实际需求,大模型不仅要具备相应技术能力,还要有效率,还要有商业化落地场景,这才是这场“万模之战”的意义所在。

雪豹财经社:商汤的大模型团队一共有多少人?

王晓刚:“日日新”的研发涉及到商汤整个研发体系和研发团队,比如大模型的基础设施研发,一个部门就有几百人,他们的工作就是训练系统底层架构。要把一个大模型训好,必须从底层架构、任务数据收集、应用反馈等方方面面都优化到极致,不是几个人能完成的。我们商汤的研发体系正在被大模型重塑。

雪豹财经社:“日日新”大模型和“商量”“秒画”等AIGC应用,在内部测试中有没有让你感到惊艳的表现?

王晓刚:模型发布前要做很多维度的测试,我们有专门的团队在做这件事。拿“商量”来说,测试时给它出一道作文题,它并不会一次就给出一个完美答复,需要通过多轮对话把不完美的地方告诉它,它能快速学习不断修正给出更好的答案,让我惊艳的是它强大的学习能力。我们的AI数字人视频生成平台“如影”就是“商量”起的名字,我们问为什么,它回答“如影随形嘛”。

雪豹财经社:商汤的AIGC应用还没有对公众开放,但有部分合作伙伴已经体验了,他们有什么反馈?

王晓刚:我拿“商量”举例。一开始大家只是对它做一些通用型测试,反馈比较好,后来大家发现它有强大的逻辑推理能力,相当于一个AI大脑,就考虑用它来连接现有的传感器,相当于操控设备的“手”和“脚”。还有客户在上海车展上体验了“秒画”,觉得它生成的车辆效果图可以直接拿去使用。总的来说,我们跟客户交流越深入,就越坚定在这个方向投入的信心。

雪豹财经社:相关应用打算什么时候对公众开放?

王晓刚:商汤目前主要还是面向B端的企业客户。我们欢迎感兴趣的客户去官网申请试用。

雪豹财经社:近期,包括马斯克在内的1000多位人工智能专家联名签署了一封公开信,呼吁暂停开发比GPT-4更强大的AI系统至少6个月,称其“对社会和人类构成潜在风险”。你怎么看?

王晓刚:人们暂时还没有太学会如何驾驭AI。就像出现了新的工具,还不知道如何去使用。任何技术都有两面性,能够给带来价值,也有一些潜在风险。但简单地限制并不能解决问题,还是要在发展中摸索出一套切实可行的办法,能够让我们跟AI共同发展,能够驾驭它,能够让它造福于我们。

雪豹财经社:商汤内部设立了人工智能伦理与治理委员会,它是怎么运作的?

王晓刚:2020年1月,商汤正式成立人工智能伦理与治理委员会,包括2名外部委员和4名内部委员,他们来自技术、工程、法律、伦理等相关专业背景。我们在2021年提出了“负责任且可评估”的发展理念,商汤任何AI产品发布前都要经过该委员会审核,提前发现并去除潜在风险。

雪豹财经社:你认为通用人工智能(AGI)将在什么时候到来?

王晓刚:通用人工智能,我觉得它是一个方向,大家已经在朝着这个方向前进了。公众已经感知到了它在自然语言理解方面的成果,接下来还有视觉、音频等多模态的发展。通用人工智能不是一个静止的点,而是一个我们可以取得不断突破的新领域。

雪豹财经社:商汤科技的研发团队是怎么寻找突破方向的?

王晓刚:2014年,当深度学习技术开始有突破时,大家有许多天马行空的想法,希望通过原创不断取得0到1的突破早期每年,我们会对CVPR、ICCV这些会议进行投稿,投稿那天晚上大家熬通宵;后来我们的技术走向了车厂、手机厂商,我们有了许多AI落地的业务场景,这时候每次合作伙伴的产品发布会就成为了我们的“春晚”,看到AI成果被使用到客户的产品中都非常兴奋。但现在我们发现,光是满足消费者和客户需求还不够,像OpenAI引领了新一轮技术革命,商汤希望借助于在AI落地过程中积累的很多Know-How的行业经验,去引领AI科技取得下一个大的突破。

雪豹财经社:你是商汤的联合创始人之一,当初是出于什么样的机缘加入商汤的?

王晓刚:我们的创始团队来自香港中文大学多媒体实验室,创业前就在人工智能方面有较多积累。我2001年追随汤老师(汤晓鸥,香港中文大学教授、商汤科技创始人兼董事长)攻读硕士学位,当时大家有一个梦想:将人工智能做产业化的落地,改变人们的生活,后来就有了商汤。

雪豹财经社:什么时候开始看到人工智能落地?

王晓刚:2014年时候我们在人工智能方面已经有了技术方面的研究和储备,到2016年,我们看到人工智能开始有大规模的产业落地,比如智慧城市、自动驾驶,我从那时起开始参与商汤的实际业务。也是从那时候,商汤的研发体系从学术实验室的这种小规模的研究团队,向构建大规模工业化研究体系及基础设施蜕变。

爱奇艺星钻会员跟黄金会员

雪豹财经社:AI的突破也让部分人产生焦虑,有声音认为AI会取代许多职业。你怎么看?

王晓刚:AI影响到了文案编辑、财务分析、教育、金融等很多行业,但职场人要学会使用AI,把它当作提升效率的工具,比如模特不用出外景就能变换场景拍照。一句话,学会让AI帮助你。


返回网站首页

本文评论
顺丰控股上半年营收「顺丰控股:预计前三季度净利润同比增长146%-154%」
10月13日消息:顺丰控股公告称,预计前三季度净利润44.2亿元-45.7亿元,同比增长146%-154%,第三季度净利润预计同比增长84%-99%。辣条机器一台顺丰控股表示,在国内实施科学精准防疫...
日期:10-15
微软必应聊天演示被指存事实性错误 专家:这类工具有杜撰内容的倾向
2月15日 消息:几天前,谷歌的聊天机器人演示活动出现翻车,导致其股价当天暴跌7%以上,然而,微软的演示活动也存在着实际性错误,只是当时并没有人注意到而已。据悉,微软嵌入类ChatGPT...
日期:02-15
10月浏览器市场份额出炉:Chrome占比略有下降但仍占主导_浏览器市场占有率排名
  NetMarketShare最新公布了2019年10月份的浏览器市场份额数据。Chrome相比上个月出现了略微的降幅,但仍一马当先,依旧是近七成用户的浏览器首选。   可以看出,Chrome浏...
日期:05-15
对刷视频赚钱套路说“不”_各种刷视频赚钱app套路
  来源:法治日报  □ 丰 收地平线与上汽集团丰田最新概念车suv  “边刷视频边赚钱”“轻松日赚百元”……在部分短视频平台、社交媒体平台上,我们经常能看见这样的广告...
日期:10-04
优酷的成本结构_优酷网成本不再每年平均摊销 调整版权成本核算法
  日前,刚刚发布Q1财报的优酷网(NYSE:YOKU)宣布,将对会计原则做出重大调整。对于视频网站重要的成本——版权成本,优酷决定,将从之前的直线摊销法改为今后的加速摊销法。   所...
日期:07-28
全国年夜饭账单出炉:电商平台麻辣兔头卖爆了
据央视财经报道,电商平台的数据显示,今年春节前电商平台消费者购买猪肉、羊肉、牛肉等肉制品的客单价环比增长40%,各式各样的肉菜仍然牢牢占据年夜饭餐桌的大菜”位置。除了肉...
日期:01-24
谷歌CEO警告AI的负面影响_谷歌ceo警告ai的负面影响是什么
4月19日 消息:谷歌CEO Pichai在接受采访时表示,人工智能技术的发展将对整个脆弱的文明产生巨大影响,并警告人们应该为其做好准备。Pichai认为,人工智能将影响每个公司的每个产...
日期:04-19
台积电招了:扩建美国二期工厂 要把3nm带去_美国要求台积电在美建厂
前两天,华尔街称台积电正酝酿在美国亚利桑那州扩建二期工厂,工艺直指先进的3nm节点。对此,台积电在发布10月运营报告的同时予以否认。不过,EE Times收到台积电的最新邮件回复,对...
日期:11-23
去哪儿CEO陈刚发布新年信:春节全员放假10天,2023年更多机会在海外市场
12月30日消息,去哪儿CEO陈刚发布新年信,宣布去哪儿全员春节提前放假3天,给大家一个10天长假,能更多的陪伴家人朋友。在陈刚看来,行业正在恢复,旅游作为最后一项线下体验,将长期重要...
日期:12-30
iPhone14预售价现身:加价卖,6699元起,新增Plus型号「预售iPhone13」
  苹果已宣布将于北京时间9月8日凌晨1点举办“超前瞻”特别活动。据微博博主;@李昂昂昂啊;等晒出的图片显示,一些线下店开启了iPhone14系列的预售,不出意外就是前期的黄牛价...
日期:09-08
特斯拉马斯克shib「15万特斯拉要来了!马斯克自曝新车:成本降50% 自动驾驶」
一直以来,外界都很期待特斯拉生产比Model 3更便宜的汽车,马斯克已经表态了,这不是问题。阿里收购雅虎事件今天早些时候,马斯克表示,特斯拉公司有明确的计划,可以制造出生产成本仅...
日期:03-08
陆奇:中国要抢占产业制高点,比肩ChatGPT的生态能力【附PPT】_陆奇最新动态
【网易科技5月7日报道】奇绩创坛北京分享会,陆奇发表题为《新范式 新时代 新机会》的演讲,就当前最新前沿技术趋势,尤其是OpenAI爆发的成因进行深入分析,并全面分析了由此诞生的...
日期:05-07
老朋友新面孔:铠侠全系列存储产品亮相热点科技展台
  万众瞩目的ChinaJoy已经于7月31正式拉开帷幕,而ITheat热点科技也在CJ期间设立了自己独立的展台,其中群英荟萃,汇聚了众多酷炫产品,给玩家和消费者带来了一场丰盛的硬件盛宴...
日期:07-15
蔚来在德国、荷兰、丹麦、瑞典开放ET7、EL7和ET5车型订阅服务「eT7蔚来」
10月8日消息,北京时间10月8日0点,柏林当地时间10月7日18点,蔚来在德国柏林举办了NIOBerlin发布会。大会宣布,蔚来的三款最新车型:ET7、EL7和ET5,将通过订阅模式在德国、荷兰、丹麦...
日期:10-16
iphone12pro充电不会自动开机「iPhone 14 Pro再现重大BUG:充电会自动重启」
近日,网络爆料显示,iPhone 14 Pro再次出现重大BUG,有部分用户称,自己的iPhone 14 Pro在通过MagSafe或Lightning充电时,会毫无征兆的出现间歇性重启。游侠汽车b轮融资而且从目前来...
日期:09-29
苹果iPadOS 16.1开发者预览版Beta发布_ipados15公开测试版
IT之家 8 月 24 日消息,苹果今天面向开发人员发布了 iPadOS 16.1 Beta 测试版,该软件与今天提供的标准 iOS 16 开发者预览版 Beta 7 一起提供。IT之家获悉,苹果已决定取消 iPad...
日期:09-15
特斯拉在美再次降价 最高降价9.1%「美国 特斯拉 涨价」
DoNews4 月 19 日消息,美国当地时间 18 日,特斯拉将 Model Y 长续航版售价下调 9.1% 至 49990 美元,Model Y 高性能版售价下调 8.5% 至 53990 美元,Model 3 后轮驱动版售价下调...
日期:04-19
华为折叠屏手机最新消息「华为本月底将召开发布会:折叠屏手机、手表将发布」
上个月华为Mate 50系列正式发布,燃起了不少用户的热情,而有消息称华为将在本月底继续召开新品发布会,其中将会上市华为P50 Pocket new手机,新机将以6000元左右的价格发布,再一次...
日期:10-13
日本拟设置「AI 战略会议」:着眼于人工智能潜力和风险推进举措
5月10日消息:据共同社消息,日本首相岸田文雄 5 月 9 日透露了方针,拟设置磋商制定利用人工智能(AI)相关规则等的「AI 战略会议」。当天在官邸与研究人员和创业人才等开会时,岸田...
日期:05-10
SOSO校园创意LOGO花样百出 五宗“最”吸引网友眼球
近日,小编的“五感”得到了充分的满足,原因就在于小编发现SOSO校园创意LOGO大赛活动官网(http://bigidea.soso.com/index.html)已经开始展示选手的优秀参赛作品,在这些花样百出,...
日期:07-22