您的位置:首页 > 互联网

黄学东告别信首发!微软30年老将出走,担任Zoom CTO,瞄准AI+AR「微软黄爱军」

发布时间:2023-06-11 17:36:09  来源:互联网     背景:


新智元报道

编辑:编辑部

【新智元导读】告别信首次曝光!微软首位全球华人技术院士黄学东转战Zoom,推动从AI到AR的新技术和产品。

黄学东宣布,自己将离开已任职30年的微软,出任Zoom的CTO。


从昨天开始,整个业内被这条消息震动了。

自从ChatGPT引爆了大模型之战,全球的大厂都在重新布局战略版图,AI人才的争夺战,也进入了白热化。

而今,黄学东的离职,也是这场时代洪流中浓墨重彩的一笔。


如此重量级的技术大佬出走,江湖上势必掀起一场腥风血雨。

在微软30年,黄学东带领的团队在语音识别、机器翻译、自然语言理解和计算机视觉等方面都取得了里程碑式突破,可以说没有短板,结合下Zoom的业务场景,这一定是盘大棋。

关于黄学东加入Zoom后要从事的业务方向,专家和网友们已经纷纷展开了猜测。



告别信

在新智元独家获得的告别信中,黄学东也透露了自己进军Zoom后的方向——推动从AI到AR的新技术和产品。


在微软度过了30年不可思议的时光,今天是我告别的日子。 能够为这个杰出的公司做出贡献,并与拥有聪明才智的人们一同共事,是我的荣幸。我会永远铭记在这里的回忆和经历。 我将加入Zoom,担任该公司的新任首席技术官(CTO),我将主要推动从AI到AR等领域的新技术和产品。 Zoom承诺将投资于创新领域,这令人鼓舞,我也很兴奋能够成为这个充满活力的「初创企业」的一员。 而对于微软同事们始终如一的支持、指导和合作,我深深感激。 我们共同取得了非凡的里程碑,在Azure AI上取得的建树已经改变了整个行业,包括最新的OpenAI服务。 对于所有朋友和同事们,我无比感谢我们共同拥有的珍贵回忆和知识。 我相信我们的联系将持久存在,我们对技术和人工智能的热情将继续激励所有人。

除了Zoom给出的承诺,创始人袁征的华裔身份或许也是一个原因。作为第一代中国移民,袁征在国内和美国都有学习和工作的经历,和黄学东应该有不少共同语言。

当30年元老选择离开

作为第一位加入微软研究院体系的华人科学家,黄学东一直是微软华人AI版图上不可或缺的一块拼图。

在微软,他已经任职了超过30年。

离职前,黄学东担任Azure AI首席技术官,不仅是微软首位全球华人技术院士,也是微软最高级别的华人科学家

黄学东分别于2017年和2020年,当选ACM和IEEE会士,并于2023年同时当选美国国家工程院院士和美国艺术与科学院院士。共计拥有170多项美国专利,发表100多篇论文和2本著作。


在此之前,他于1989年获得爱丁堡大学的博士学位,1984年获得清华大学的硕士学位,1982年获得湖南大学的学士学位。1989年曾在卡内基梅隆大学进行博士后研究,之后加入卡内基梅隆大学计算机科学学院的教职。

1992年,黄学东领导卡内基梅隆大学语音识别项目Sphinx-II,实现了业界最低的错误率,并刷新了DARPA语音评估史上错误降低速度的最高记录。

这个消息震动了微软,人事部倾巢出动,想要挖来这个团队。最后,盖茨亲自出面,才终于请动黄学东。

1993年,黄学东加入微软研究院,成立了微软的语音技术团队。

在他的牵线搭桥下,微软于1996年在北京建起第一个亚洲研究院,亚研院也在日后成为中国AI届的黄埔军校。

微软黄爱军

随后,微软研究院陆续加入了李开复、张亚勤、沈向洋、洪小文等知名华人学者。

在三十年间,微软经历了多次人事变动,而黄学东始终坚守,带领微软的人工智能团队取得了一项又一项里程碑式突破。


微软黄爱军

通过Windows SAPI(1995年)、Speech Server(2004年)和Azure Speech(2015年)等产品的推出,黄学东将语音技术带入大众市场。

在1995年,黄学东主导研发了业界首个语音应用程序编程接口(SAPI),让数百万客户能在Windows应用程序中便捷使用语音人工智能技术。

此后,他负责领导的微软人工智能团队,在语音识别、机器翻译、自然语言理解和计算机视觉等方面,取得了多个历史性突破。

2016年,微软首次在对话式语音识别领域,让计算机能够像人类一样识别每一个单词。2017年,准确率首次超过人类专业速记员。

2018年,微软机器翻译系统,首次达到了与人类持平的水准。

2019年,微软机器阅读理解系统,在对话式问答任务中首次超过人类。

2020年,微软计算机视觉图形传字幕系统,在计算机视觉看图说话任务中首次超过人类。


而最近的高光时刻,是黄学东领导微软认知服务团队和OpenAI合作推出的Azure OpenAI Services, 包括微软云的ChatGPT服务。

正是OpenAI服务,使得ChatGPT能在全世界进行大规模商用。

Azure Speech、Vision、Language和OpenAI Services等Azure认知服务,使Azure成为覆盖数百种语言、为全球数十亿客户提供服务的领先工业人工智能平台,使机器看到、听到、说话和理解人类语言成为现实。

在微软云平台上用一个统一的大规模基础模型和多模态基础模型联合工作,实现了人工智能质的飞跃,并且奠定了微软云平台人工智能产业化的全球竞争力。


微软的技术突破

通过巨量包括文本,图片,语音等多模态数据的预训练,基础模型可以被应用到各类任务上,比如问答、物体识别、信息抽取等。相比于处理单个任务的模型,基础模型在部署速度和性能上都更占优势。

而微软的人工智能技术,便是建立在基础模型(Foundation Models)之上。


其实,我们可以从一个独特的视角来看待人类认知的三个属性之间的关系:单语言文本(X)、音频或视觉感官信号(Y)和多语言(Z)。

在这三者的交叉点上,有一种神奇的东西——XYZ-code。这种联合表征可以创造出更强大的AI,从而更好地说、听、看和理解。

语音

2017年,微软就把基础模型融合到了语音产品中。这种方式不但能减少大量的工程劳动,还提升了模型在各个任务上的性能。

根据斯坦福发布的AI Index2021报告,微软的语音识别准确率处于行业第一。


语言

2022年初,微软发布了全新的机器翻译模型Z-Code,可以通过迁移学习利用跨多种语言的共享语言元素,将知识从一项任务应用到另一项相关任务。

与传统的神经机器翻译方法不同,Z-Code不仅使用多语言的数据在机器翻译任务上进行训练,还使用了单语言数据作为补充,在掩码语言模型(MLM)任务上训练。此外,还通过多任务学习,同时优化多个目标函数。


鉴于Z-Code不俗的表现,黄教授团队又进一步将Z-Code升级拓展为Z-Code++,使其可以完成文本摘要任务,并在GENIE benchmark上取得了第一名的好成绩。

Z-Code++仅针对抽象式文本摘要任务进行优化,在5种语言的13个文本摘要任务中,有9个达到新sota性能,成功超越一众大模型,参数量仅为PaLM的600分之一,GPT-3的200分之一,性价比爆棚。


论文地址:https://arxiv.org/abs/2208.09770

视觉

2021年底,微软发布了一个新的计算机视觉基础模型Florence(佛罗伦萨),目的是要用一个模型一统多模态天下。


论文地址:https://arxiv.org/pdf/2111.11432.pdf

现有的视觉基础模型,如CLIP、ALIGN等,主要侧重于将图像和文本映射到一种跨模态的共享表征。

Florence则将表征进行了拓展,不仅拥有从粗略(场景)到精细(对象)的表征能力,还将视觉能力从静态(图像)扩展到动态(视频),从RGB图像扩展到多模态(文字、深度信息)。

通过整合图像-文本数据的通用视觉语言表示能力,Florence可以轻松适用于各种计算机视觉任务,如分类、目标检测、VQA、看图说话、视频检索和动作识别,在多种类型的迁移学习中均表现出色。


Florence成功地表明基础模型可以适应各种下游任务,最终集成到现代计算机视觉系统中,为现实世界的视觉和多媒体应用提供动力。

微软持续裁员,或将迎来离职潮

除了大佬的出走,整个微软团队最近都很动荡。

据说无论是微软中国还是西雅图,很多华人都要出走。


五月下旬,有一亩三分地的网友透露:「微软今年没有merit,increase不增加,base奖金和股票也减少。」

另一位一亩三分地的网友,也吐槽称:「CEO虽然厉害,但是个人的感觉是,对股东是好CEO,对用户和员工来说,是非常差的CEO。」


而一位已经从微软离职的推特网友,也对CEO的表现颇有微词。


根据blind知名爆料人「Rain」的消息,微软七月份将再次裁员数千人。


抖音企业号联系电话修改

初步的时间安排是在7月4日之后,但部分团队尤其是国际团队,可能会在6月宣布变动。

具体数量预计会在本月晚些时候得到更明确的消息,可能会根据一些具体的后勤情况有所调整。

大部分裁员将涉及客户服务和支持等面向客户的角色,但其他团队(包括之前已被定为目标的团队)也将受到影响。


返回网站首页

本文评论
郭明錤:目前iPhone 14机型的供应链没有受到影响「郭明錤预测:iPhone 13系列出货量将超过iPhone 12系列」
【手机中国新闻】近日,媒体称苹果已经开始录制9月份的发布会了,但有消息称新品可能会延后发布。对此,天风国际知名苹果分析师郭明錤表示,目前iPhone 14机型的供应链没有受到影响...
日期:09-22
2023支付宝集五福活动时间公布;巴菲特第7次减持比亚迪;B站公布2022年前9月净营业额
文章目录 2023支付宝集五福活动时间公布 巴菲特第7次减持比亚迪 B站公布2022年前9月净营业额 2023支付宝集五福活动时间公布今日,支付宝“集五福”瓜分红包活动正式开启,活动...
日期:01-10
小米是什么样子的图片「小米是什么」
小米科技有限公司,是一家总部位于中国北京的电子科技公司,成立于2010年。小米公司创立之初,主要从事手机软件开发,后逐渐发展成为一家拥有多个产品线的互联网公司,同时也是中国最...
日期:05-29
高德地图上线北斗卫星定位查询系统_高德北斗卫星地图导航
11月17日消息,近日,高德地图上线了北斗卫星定位查询系统,用户在定位导航时可查看当前所调用的北斗卫星数量,以及具体编号、方位角、高度角、频点、信号强度相关详细信息。redmi...
日期:11-28
苹果Apple Music歌曲数量达到1亿首里程碑_apple music年度最佳音乐
  IT之家 10 月 3 日消息,苹果今日宣布,其 Apple Music 音乐平台的歌曲达到了 1 亿首。欲抢先机 宝马宣布进入全新的电动化战略布局阶段智慧医院整体解决方案第一品牌  苹...
日期:10-04
广东康之家云健康医药股份有限公司 荣获2019中国新经济创新势力榜“最佳新零售平台”大奖
  3月7日,由上海市互联网协会和艾媒咨询集团主办的2019电商超级沙龙在上海圆满落幕,同期举行“2019中国新经济创新势力榜”颁奖盛典,作为优秀企业代表,广东康之家云健康股份...
日期:11-27
史上首次社交媒体挤兑 推特成硅谷银行倒闭的“帮凶”「推特被谷歌收购了吗」
凤凰网科技讯 北京时间3月14日消息,如果没有社交媒体,硅谷银行遭遇的挤兑很有可能不会发生。此前,银行业也发生过挤兑,但硅谷银行这次崩溃是一种由科技推动的新现象,震惊了银行业...
日期:03-14
搜狐2022第四季度营收1. 6亿美元 同比下降17%
2 月 21 日讯:搜狐公司公布 2022 年第四季度及 2022 年度财报称,第四季度,搜狐总收入为1. 60 亿美元,同比下降17%。 2022 年全年,搜狐总收入为7. 34 亿美元。特斯拉在中国销售了...
日期:02-22
维基百科有多少词条_词条总量远超英文维基百科,百度百科打造最大中文百科全书
  2019年过去,百度百科显示其收录的词条正式迈过1600万大关,达到1640万条。相较之下,维基百科英文版收录590余万个词条,中文版仅收录近108万词条,在单一语言词条总量方面,百度...
日期:09-19
苹果火速发布iOS 16:解决BUG 建议iPhone抓紧升级「ios16更新了什么」
今天凌晨,苹果突然发布了全新的iOS 16系统,此次快速的发布共修复了14个系统漏洞,提升设备的安全性。天猫消费者保障服务如果您不更新升级,这些漏洞将会被黑客利用。他们可以通过...
日期:05-19
《2019富士施乐中国可持续发展报告》发布(富士施乐2025)
  (2019年11月6日,北京) 近日,富士施乐5家在华企业联合发布了《2019富士施乐中国可持续发展报告》。报告以全球报告倡议组织(GRI)的《可持续发展报告标准》为编制依据,回顾...
日期:03-10
刚刚公布,余额宝第一大户持有金额下降超2000万元,年赚500万不再_10000万元放余额宝
小米12ultra拍照什么都不干,一年躺赚500万元,你能想象吗?这是一位余额宝投资者三年前的年收入。不过,随着天弘余额宝收益率越来越低,余额宝的第一大户也开始动了,最新持有金额约...
日期:09-14
比亚迪已成功注册“仰望”商标_比亚迪企业
11月9日 消息:11月8日,比亚迪正式公布旗下高端汽车品牌,并定名“仰望”。企查查APP显示,惠州比亚迪实业有限公司全资子公司惠州维士玛科技有限公司已成功注册1枚“仰望”商标,国...
日期:11-15
俄公司推苹果iOS4破解工具 解除硬件加密_苹果6软件加密
5月28日消息,据国外媒体报道,一家俄罗斯的信息安全公司宣布推出第一套商业用途的iOS中破解工具,用以解除苹果最新行动装置上的加密与密码功能。ElcomSoft公司的软件可以破解在...
日期:07-28
《流浪地球》商业化受追捧,跨界营销渐成标配(流浪地球营销事件经过)
  从电影春节档延续至今,电影IP和品牌商的跨界营销合作逐渐火爆,例如苏宁易购与《飞驰人生》合作推出了“飞驰快递盒”、飞驰元素进苏宁影城等活动;《疯狂的外星人》中百...
日期:09-09
机构:2023一季度NAND芯片总营收环比下跌16.1%市场报告_芯片年报
2023/5/30 15:23 机构:2023一季度NAND芯片总营收环比下跌16.1% 爱集微  刘昕炜 ...
日期:06-03
印度政府这手,三星、苹果和中国厂家都郁闷了……「三星印度制造」
作者:耿直哥据多家印度媒体报道,有来自印度政府内部的消息称,为了推广印度本土的导航系统“NavIC”,减少对于美国的GPS导航系统的依赖,印度官方正准备要求所有在印度售卖的手机必...
日期:09-30
凤鸣平台app「声网发布“凤鸣AI引擎”,含AI降噪、回声消除等功能」
3月23日消息,声网正式发布囊括AI降噪、AI回声消除、空间音频、最佳音效等功能在内的“凤鸣AI引擎”。这款新一代音频技术智能引擎,可应用于语聊社交、在线K歌、线上会议、游戏...
日期:03-24
酷狗音乐焕新装扮中心,皮肤、挂件、铭牌等个性化内容轻松设置
近日,酷狗音乐装扮中心全新升级。更新后的装扮中心集合了皮肤、挂件、铭牌与启动页等自定义功能,以及众多精美会员专享个性装扮,丰富多元的个性化设置内容和方便快捷的“一站式...
日期:06-08
后尾灯有裂痕4s店不予保修 快手快说车帮车主维权成功(新车尾灯撞坏要去4s店修吗)
  近年来,随着居民生活水平的不断提高,汽车已成为寻常百姓家里的代步工具,汽车售后维权也受到更广泛的关注。然而,一般消费者不具备汽车专业知识,在汽车定损、维修时处于弱势...
日期:07-27