您的位置:首页 > 人物动态

百度吴恩达:图像和音视频搜索将是新方向

发布时间:2022-07-14 06:46:11  来源:互联网     背景:

  1月20日下午消息,未来论坛创立大会在北京举行。本届大会的主题是“指数Exponential ——通向明天的技术力量The power of technology for a new tomorrow”。

  百度公司首席科学家吴恩达为本次论坛做了主旨演讲,他演讲的主题是“机器学习与AI人工智能”。在他看来,通过移动互联网的兴起,交流方式从文本慢慢转向图像和视频,所以我们看到越来越多的人搜索图像和语言,通过AI我们就能够更好的了解这些文本和图像,以及语言之间的互动关系。

  吴恩达还阐述道,对于小孩和老年人来说,有时候可能打字比较困难,如果你能够让他们使用语音搜索,就能够让他们使用方便的信息产品和服务。对于我们普通人来说,使用语言识别和语言搜索也越来越方便,百度在语音识别方面投入了很多。(半夏)

陕西锌霸动力有限公司

  以下是吴恩达的演讲实录:

  Andrew Ng:在过去几年中,AI人工智能和深层次的学习不断转变技术,而且给公司创建了巨大的经济价值,也在更大改进人类和技术获得的方式。但是关于AI人工智能也有非常多的炒作,我今天要做的就是向大家传达两个信息,一个,我希望能够向大家介绍一下AI人工智能领域所发生的现象,我希望三十年之后,大家能够讲述什么是脚踏实地,什么是炒作。其次,如果你是组织的领导人,我希望30分钟之后你能够有战略性的思维,思考一下最近的历史和AI近期的未来,这样就能够更好的领导团队做出更好的关于AI和技术的决策,因为AI和互联网正在改变着我们的生活和我们的经济结构。

曲面屏的性价比手机

  过去十五年间,我们现在都有一个关于人工智能正循环的理念,我们认为它能够带来一个很好的产品,服务很多的用户,有着很多的用户就能够收集很多的数据,用户数据、服务数据,有很多数据就能够使我们使用AI继续改善我们的产品。但是这张图的问题就在于,直到近期AI这一步其实做的都不好,传统来说,即便是你加大投入,但是它的性能也不会提高。我们现在对AI和深度学习的理解,只要你现在衡量AI的技术等等,他的AI性能会越来越高,这样就能够减少它的成本,提高它的性能,在大数据的时代这些深度学习的算法比传统AI算法要更好,因为他能够逐渐提高AI的性能,因此历史上第一次我们能够在这个图中完成AI的环节,得到数据,得到很好的产品,接触大量的用户。

  大多数互联网信息都是基于文本的,通过移动互联网的兴起,我们认为这种交流方式同文本慢慢转向图像和视频,所以在百度我们看到越来越多的人搜索图像和语言,我认为通过AI我们就能够更好的了解这些文本和图像,以及语言之间的互动关系。我现在想给大家介绍一些例子,向大家解释一下AI是如何使用今天的互联网。

  百度这样的公司在文本上做了很多工作,我们先从图像开始。七年前我问我斯坦福的学习,让他们写一个算法,在图像中找到杯子。七年前当时最好的算法,他们使用了最好的算法,这就是结果,在各个地方都找到了杯子,这是错误的。对于你和我来说,作为人类来说,很难理解计算机为什么无法识别出这个杯子,为什么计算机看不到我们能看到的东西?计算机很难做到这一点,我们详细的看一看,我们眼中看到的是杯子,但是计算机看到的是很多的像素,所以计算机的作用是看这些数字来考验你这些数字代表的是什么,代表的是这个杯子的口,看起来这是一个计算机的问题,六、七年前如果让机器来解决这些问题是非常困难的。

  五年前发生了变化,兴起了深度学习神经网络的技术,我们当时受到了人类大脑运作的启发,开始创造软件,模拟这些神经元的工作方式。深度学习是什么意思?我们建立这些神经网络,深度模拟我们大脑中神经源信息传统的路径和方式。在AI中有很多炒作,这些炒作的原因之一,很多人说这句话,深度学习推动科技发展,这句简简单单的话,这句口号都对AI进行炒作。

  在午餐的时候我跟饶毅进行交谈,他是北大的生命科学家,我们当时都感叹,今天我们其实都不了解人的大脑是如何工作的,所以我们的确无法来准确的模拟人类的大脑。我们深度学习的软件虽然模拟人类的大脑,但是他只是大脑,从特别特别浅的方面来模拟大脑运作方式,我们真的不了解大脑是如何运作的。我们通过不准确的模拟就已经启发了我们新技术的发展,我们使用计算机的视觉,我们给他输入了很多关于杯子的数据。我们在过去五年间发现这些算法,能够从数据中学习,学习这个杯子长的是什么样的,所以我们取得了很长久的进步。今天计算就很容易的识别杯子了。这只是在图像中找到被子,这是一个很简单的任务。我们的视觉系统能够做的比这多得多,我希望能够给大家展示这些图像,问大家您在这些图像中看到了什么,如果我想问您为这些图写说明,你左边可能会写一个黄车在路上行驶,后面是树林。右面你可以写是一个起居室,白色的沙发,蓝色的地毯,还有下午的斜阳照进了房间。之所以你能够写这些说明,你了解这些图像是什么意思,所以你才能够写说明。你能做的是详细的说明这些图像的信息,另一方面计算机只能识别杯子,这两者之间有巨大的差异。这些说明和字幕并不是人写的,过去几年中通过软件的发展,我们现在已经有软件对这些图像进行字幕的说明,有这样的技术对我们带来了新的机会,使我们软件通过深度的学习分析数据,使我们有更多的数据,使计算机视觉做到五年前无法做到的事情,在可预见的未来,这样的软件使我们能够更好的了解医学的图象。计算,自觉的识别可能是很难的,未来是我们的目标之一,百度眼睛产品是我们对未来的愿景而已。

  为什么深度学习现在开始火了,现在开始越来越好了,我现在解释一下深度学习的功能,以及他能为我们带来什么样的价值,解释深度学习是怎样运作的,为什么越来越好?我现在要做一个比喻,如果你想象一下我们建造火箭,火箭有两个部分,第一部分是火箭发射机,是很大的发动机。第二个是燃料,如果发动机小,燃料很多是不可能的,如果发动机很小,燃料很少也不行,燃料烧着烧着就没了,所以火箭必须要有一个大发动机和很多的燃料。深度学习和这个差不多,我们现在神经网络就是我们发动机,它推动着AI的发展,燃料就是我们所用的数据,我们现在有这么多的数据,社会数据化给我们提供了大量的数据,这样输入到我们发动机中给我们作为燃料。在AI最近发展主要推动力,因为我们能够建很大的精神网络。另一方面,百度这样的公司能够收集很多的数据,为这些精神网络输入数据。我们有一个很大的技术网络,同时有很大的数据,这样当然深度学习可以越来越好了。

  我今天提到的一件事,我们现在能够建造很大的神经网络,五年前,2010年的时候在学术界用的最大的神经网络有1000万的连接,于是模拟神经源之间的连接。四年前,2011年的时候我们在谷歌启动了一个工程,建造很大的精神网络,使用1000个谷歌的服务器,我们当时的团队建造神经网络差不多是原来的十倍大。后来我们发现我们当时的技术其实无法更大,后来我们在其他大学应用了其他的技术,你只用三个服务器就实现了100亿的连接,在百度我们使用GPU新的技术,现在可以建造非常非常大的精神网络。在AI和深度网络中做出很多的进步,都是因为我们能够建造巨大的机器,模拟精神网络,吸收这么多海量的数据,做出预测。

抖音818新潮好物节节目名单

  我再给大家举一个例子,语音,解释一下我刚才做的发动机核燃料的比喻。我现在和大家展示一个关于语音识别的例子。百度我们在语音识别方面投入了很多,很多人是使用语音的搜索,对于小孩和老年人,有时候可能打字比较困难,如果你能够让他们使用语音搜索,就能够让他们使用方便的信息产品和服务。对于我们普通人来说,使用语言识别和语言搜索也是越来越方便的,直到最近基本上所有语音识别都是很简单的软件实施,一个方块里是一个复杂的体系,我们最近决定让我们看一看产生语音识别的软件,把它扔掉,取而代之是神经网络,所以这也就是我们的发动机,因为百度在GPU早期投入了很多,所以我们能够建造很大的火箭发动机。燃料是什么?在语音识别方面,大部分学术人士他们都利用数据,有一些人他们有300个小时,最大的是2000个小时,最开始我们用了几个小时的语音数据,后来有几千个语音的数据,后来建立了合成的语音数据。后来我们一共达到了10万个语音的数据,按照语音识别的标准,实际上这是无法想象的数据量。在百度我们有着非常强大的工具,我们可以利用火箭燃料核火箭引擎,把它们放在一起,这样我们就有了语音识别更高的性能,而且也有很好开放的OPI进行发现。我们不到一个月之前有很好的结果,我觉得人工智能会改变用户技术的方式就是语音,我们有语音,因为我觉得这里有越来越多互联网的沟通走向语音的沟通,现在像百度的公司业非常多语音的产品,我们可以利用语音,我觉得整个互联网经济和互联网生态系统只是刚刚开始而已,整个的世界现在都在走向移动的设备,没有人现在还没有设计出一个非常好的移动设备输入的产品,正因为如此,我们现在花很多的时间在小的键盘上进行输字,如果说可以让语音识别运作非常好,在一个安静的环境下,它运作还是非常不错的。

  现在出去你在开车,你的手机是放在旁边的座椅上,没有人会利用语音的环境,因为在嘈杂环境下语音识别是不行的,如果我们能设计很好的,在嘈杂环境下运作良好的语音技术,我们当然愿意利用语音技术。如果我在开车,我的手机放在旁边座椅上,我可以跟自己的手机进行沟通,我可以给我妻子发一个短信,我觉得如果有这样语音技术,这样会改变我们整个的世界,会改变我们和移动设备互动的方式,我想要重新设计大家的手机,围绕着一个语音识别的界面进行重新的设计,除了移动的设备之外,我觉得语音也在改变着物联网,包括很多家用电器、可穿戴设备等等。有一些人知道,现在在物联网上,在家用电器中有太多的界面,如果我们能够和我们的设备进行沟通,进行语音识别将会非常好。如果五年前我们说电视的遥控器能够使你和你的电视进行沟通调频道,人们觉得你疯了,我希望可能在我的孩子和孙子辈生命期之内有这样新的技术,也许有一天我的孙子,或者将来你孙子的孙子会告诉你,他们可以直接和电视进行沟通,调频。也许有一天你可以和你的微波炉沟通,微波炉会忽略你吗,它不跟你沟通真的太粗鲁,它不礼貌了。我们发现语音在改变着移动世界,也改变着物联网,而且现在有太多互联网的沟通,我们与技术的互动太多了,我们的互动都是围绕着文本的,还有很多的图像和语音。现在AI人工智能技术还有深入学习,语音技术已经成为最强大的技术,可以帮助我们了解和识别这些数据,我觉得人工智能是有着很大的潜力,能够改变我们和技术互动的方式,包括百度i和无人驾驶车等等,他有非常大的潜力,改变我们跟技术的互动。基于如此,我对这样的技术感到非常的兴奋,我在这个基础方面开展很多的工作。

  当然,这方面也有很多的炒作,我觉得不幸的是,AI快速的发展现在促成了一些炒作,也许人们会想,某一天计算机会成为好的机器人,会掌控整个的世界,和我们创造一个很好的世界,也许它们不会成为邪恶的机器人,我们现在手机上还有非常多的代码,我个人看来不会出现炒作中出现的状况。我们可以利用这些技术进行预测,技术不断的改变,我们的生活就是围绕着技术,但是神经网络你知道是非常好的识别工具,还有预测的工具,当你输入数据的时候它们可以进行预测,但是我们在AI领域中工作的这些人,我们参加会议,我们发表论文,我们对未来的看法和其他一些有着胡思乱想的人之间有很大的区别,我们的看法不一样。我觉得如果我们能够远离炒作,AI发展是比较健康的,AI创造的挑战并不是机器会掌控世界,他很可能会帮助我们替代劳工,我们领导者必须要认真考虑技术,要让人工智能技术帮助我们替代那些繁杂的劳动。

湖北省近期举办的展会

  谢谢,这就是我的介绍。

  陈恂:非常感谢Andrew,非常感谢你给我们描绘了一个非常光明的未来,和人工智能所驱动的世界相比,我们现在所生活的世界真的是比较粗鲁的,没那么礼貌,我们将来人工智能驱动的世界将是非常礼貌的,我们时间只允许一个问题。

  提问:非常感谢你介绍了人工智能,我是王涛,来自ICE公司,ICE是最大的中国媒体共享公司,在您发言中您介绍了谷歌和百度大脑,他们可以从网络中,文本和图像中学习获得智能。我们ICE研究了一些视频大脑,我们的目标就是让机器能够理解视频的内容,可以让人们玩儿视频,做视频,也可以把有意思的视频推荐给每一个人,我们觉得视频是非常复杂的,在数据方面非常的复杂,在数据库大小方面也是非常大的。我的问题是,在什么样的情况下,视频大脑这些材料会用在我们生活中?在行业中我们可以做些什么加速公司的发展?谢谢!

  Andrew Ng:你知道我生活在美国,当我的妻子和我去看中国电影的时候,我们也会用ICE,我们创建了非常大的机器,它们处理数据,但是视频的挑战就是数据量太大了,正因为如此,深入学习在图像和视频方面取得了长足的进展。这里也有一个非常有意思的说法,比如人们知道怎么样利用时间数据和视频数据,可以了解人们现在做些什么,还有这些物体在做些什么,我觉得这是很有前景的展望,我希望将来在技术领域也可以实现这样的发展。

  陈恂:我们的时间非常有限,我们再次感谢Andrew,谢谢!

电小二户外电源官网


返回网站首页

本文评论
摩托罗拉总裁Rick:将强势回归中国 未来更重视电商「摩托罗拉公司现状」
  凤凰科技讯 12月15日消息,在联想完成收购摩托罗拉移动(以下简称摩托罗拉)一个半月以后,摩托罗拉总裁及首席运营官Rick Osterloh今日在摩托罗拉大楼接受媒体采访,阐述了摩托...
日期:07-14
李彦宏回应员工出走创业:他们竞争不过我_李彦宏的创业精神
  李彦宏   10月12日消息,百度CEO李彦宏近日做客央视《开讲啦》,并回答了现场观众的提问。  对于前百度员工出走创业,李彦宏称,“我知道百度有不少人出去创业,这些创业者...
日期:07-14
库克呼吁从小学编程:这是全球语言_应用语言学理论
  北京时间12日消息,苹果CEO蒂姆-库克在访问新加坡时表示,如果孩子们只能在母语之外学习一种语言,那么它应该是编码,因为“编码是一种全球语言”。网页被流氓网页劫持  这是...
日期:07-19
李彦宏受邀列席十九大闭幕会:新时代需要“科学企业家”
  10月24日上午,中国共产党第十九次全国代表大会闭幕会在人民大会堂举行。百度创始人李彦宏受邀列席,并在会后分享了他对十九大精神以及新时代企业家使命的理解。  李彦宏...
日期:07-16
马斯克称Model Y车型将会是一场“制造革命”_model y 新车型
  最近特斯拉的产能问题一直是行业内关注的焦点,他们迟迟没有达到预期的产能,以至于很多已经预购的用户无法提到车辆,而产能受阻也是特斯拉被质疑最多的地方。马斯克也迫不得...
日期:07-16
传奇大神终露真容 太极核心肖南亮相MSS安全峰会
  矛与盾之间的拉锯,破解与防堵之间的博弈,作为目前世界上最为成熟的移动智能终端设备生态系统,iOS一直是众多黑客、极客所乐于挑战的领域。Chronic-DeV、绿毒、JailbreakMe...
日期:07-14
知乎 CTO 李大海:技术帮助用户轻松获得有用的解答_知乎李大海简历
  10 月 26 日,「知乎杯」2018 CCF CCSP 大学生计算机系统与程序设计竞赛正式揭晓赛果,最终来自清华大学的徐明宽从 63 所顶尖高校的 474 名参赛者中脱颖而出,获得冠军。知乎...
日期:07-22
红麦总裁屈伟:搜索引擎决定企业品牌形象
  2014年3月1日,红麦总裁屈伟参加《传统行业互联网化商机大会》发表演讲:小品牌也需要重视网络品牌管理。屈伟创造性提出搜索引擎决定企业品牌形象。realme的杜比全景声oppo...
日期:09-25
推特马斯克最新消息_大反转!马斯克同意继续收购推特
  10月5日消息,当地时间周二提交给美国证券交易委员会(SEC)的一份文件显示,特斯拉首席执行官埃隆·马斯克(Elon Musk)再次同意以每股54.20美元的价格收购推特,推特股价应声...
日期:10-09
软银孙正义挺阿里:支持合伙人制度_软银首席执行官孙正义
腾讯红魔游戏手机6Spropinterest类似的网站 airbnb创业  网易科技讯 9月27日消息,阿里巴巴今日给媒体发消息,称阿里巴巴重要股东之一日本软银集团总裁孙正义发声明支持合伙...
日期:05-26
性价比黄天财:想让国人大胆谈性
  由于漫长的封建文化,导致对于现代的中国人来说,性仍然是一个隐秘的话题,只能用来做,却不能说。然后作为刚性需求的成人用品,如何突破传统观念开辟出自己的天地?性价比黄天财...
日期:07-14
趣头条联合创始人出席CCTV中国创新创业论坛「“趣头条”」
  10月17日,CCTV中国创新创业论坛 · 上海论坛在上海宝山区精彩上演,该论坛由中央电视台财经频道、上海市科学技术委员会、上海市宝山区人民政府共同主办,上海科技企业孵化协...
日期:07-22
罗清启:乐视对传统彩电企业带来大爆炸式颠覆
  近日,家电产业问题专家、帕勒咨询资深董事罗清启先生在接受媒体采访时指出,从产业演进逻辑来看,乐视对传统彩电企业带来的不是冲击,而是大爆炸式颠覆。这种大爆炸式颠覆不能...
日期:12-09
华为国际媒体副总裁_华为澳大利亚董事长称该公司宣传工作欠佳
  北京时间10月24日上午消息,华为澳大利亚董事长约翰·劳德(John Lord)周三表示,该公司在自我宣传的过程中表现欠佳,没有打破与该公司相关的流言。孙燕姿的线上演唱会 多长时...
日期:02-16
腾讯云副总裁陈广域:腾讯云四大支持策略升级,助力合作伙伴生态建设
  “腾讯一直坚持开放生态,到产业互联网时代,开放是一个更加有价值的话题,它已经真正成为了腾讯的基因。”在10月29日的腾讯全球数字生态大会·成都峰会上,腾讯云副总裁陈广域...
日期:07-17
扎克伯格试戴谷歌眼镜 质问如何避免尴尬
 华硕笔记本oled屏  腾讯科技讯(谭思)北京时间2月22日消息,据国外媒体报道,昨天,Facebook创始人马克·扎克伯格(Mark Zuckerberg)第一次试戴了谷歌(微博)眼镜,似乎真的感到兴...
日期:01-15
柳传志的“宽心”术:永不埋怨_柳传志的观念
  马雪征,前联想集团的高级副总裁兼CFO,曾连续3年荣登《财富》杂志所评选的“全球最有权力的商业女性”榜单。在联想任职前,她曾是中国科学院最年轻的处长、主任。常有人问她...
日期:07-14
任正非又对美媒发声_任正非接受德国媒体采访:西方必须接受其他国家的崛起
  [摘要]“很不幸,美国将5G技术视为一种战略武器。对他们来说,这就像一颗原子弹。”任正非认为,如果西方不希望发生这样的冲突,“它必须保持开放,并接受其他国家的崛起。”(图...
日期:07-17
卢伟冰:Redmi K30 Pro绝不做“丐版”骁龙865手机_Redmik30 Pro
  2月23日消息 IT之家获悉,小米集团副总裁、中国区总裁、红米Redmi品牌总经理卢伟冰今天在微博继续预热Redmi K30 Pro,称Redmi K30Pro绝对不会做“丐版”865手机。小猫 丢丢...
日期:07-19
“AI女神”离职谷歌
李飞飞。来源:视觉中国 李飞飞是中美科技界的重要人物,被视为华裔“美国梦”......
日期:09-12