您的位置:首页 > 人物动态

腾讯音视频实验室杰出科学家刘杉:AVS已经成为编解码领域不可忽视的力量

发布时间:2022-07-16 07:02:12  来源:互联网     背景:

  2017年12月28日,由腾讯社交网络事业群(SNG)主办TSAIC学术&工业交流盛会在腾讯滨海大厦举行,150余位来自麻省理工、斯坦福、卡耐基梅隆、清华、中科院计算机所、微软研究院等海内外知名高校、研究所的学者和研究员受邀出席。

  腾讯音视频实验室杰出科学家刘杉作为主讲嘉宾出席此次大会。在会上,她分享了视频编解码领域技术介绍和编码标准变迁。她说近些年中国的数字音视频编解码技术标准工作组(AVS)做得越来越好、越来越强大,现在是完全不可忽视的一个力量。

  以下是刘杉演讲全文。

腾讯音视频实验室杰出科学家刘杉:AVS已经成为编解码领域不可忽视的力量

  非常高兴也非常荣幸来到这里跟大家做一个分享。我今天分享的主题是“视频编解码和标准化”。

  在分享之前,我简单介绍一下我自己。跟刚才两位嘉宾的背景稍稍不一样,我是来自工业界的博士,之前在一家公司工作过,做过研究、也做过产品。如果在座有同学想了解一下博士在工业界的心路历程,欢迎大家找我分享。

  我们有视频编解码的传输,也包括前处理和后处理等等比较宽泛的项目,近几年我们聚焦在视频编解码的制定标准,也是今天我跟大家分析的内容。我大概在上个月加入腾讯的音视频实验室。

  言归正传,今天分享的主题包括两个部分,一个部分是标准,另外一部分是编解码。

  我先讲一下视频编解码的国际标准,后面花一点时间讲一下音视频实验室的成果和场景。

  我觉得知道为什么要做一件事对任何一个项目来说都是至关重要的。之所以要做视频这件事,因为视频的数据量是非常非常大的,大到什么程度呢?举个简单的例子,有一部电影,这个电影是两个小时的电影,视频编解码背景的同学可不可以告诉大家,这个视频如果不压缩是多大?

乐视 乐1s

  我们大家一起来做一个快速算术,1980×1080,2小时20分钟,如果不压缩是3BT。如果我们买一个移动硬盘。你的手提电脑,如果不压缩,大概可以装两部这样不压缩的电影。如果不压缩,我们需要传输的带宽是很大的。我花了一分钟的时间来做这个数学,这件事情不是重要的,而是必要的。一件事情如果是必要的,我们就要去做。

  我们要了解什么是视频。简单讲,视频就是一组图片,但是它不是一组单独的图片,而是有运动关系的图片,我们要抓住两个点,运动关系和图片。

  基本上基于这两个基本点可以分两类,一类是针对图片压缩的,另外一类是运动路径、运动补偿和一些相关技术。

  我们对色度做一个处理,这件事对博士来说完全没有什么技术含量,下面有技术含量的是transform,我们在这里面最常用的是DCT,最近的标准里面也开始引入了DST。还有其他的一些还在探讨之中。

  右上角是Example quantization matrix,我们做压缩的看到这个会很兴奋,因为我们看到很多很多的0,看到后面的数据我们会更加兴奋,因为会有更多连续的0,这是为下一步做准备。下一步是Entropy Coding,是一种无损压缩方式,可以把这个压缩的更小。

  刚才分享了几种针对图像压缩的技术,我们可以有一个最简单的架构图,这张图是就是最简单的架构图。

  我们又回到刚才讲的什么是视频,视频就是运动关系和图片。图片方面我们已经讲了,下面我们要看一下运动关系这部分。

  我们真正在做编解码的时候,不像很多领域那样做的,在主流的里面我们还是用块状的方式,所以对于运动补偿方面有很多相关技术,比如说预测单元的划分,运动矢量图本身的划分,我们真正在标准制定的时候,关于运动补偿的这一大块,通常都是划分成很多个小的技术分组来具体讨论它相关的各个运动子级、技术子级和细节。

  通过刚才图片压缩和运动关系的分析,我们可以得到一个简单的示意图,我们可以看到它包括了压缩模块、运动补偿模块。

骚扰电话(360)

  刚才给大家看的是最简单的,是我们之前的,经过这二三十年的努力和变化,现在就变得好了很多,有更多模块,也有更多技术细节。这是近期HEVC和H.265的Video Encoder,待会儿我会再详细讲这个标准。

  花了几分钟时间,在座各位已经是视频编解码的专家了,我们可以讨论下一步了。

  我们讨论Video Coding Standards,如果没有一个出入口或者大家都接受的密码本这样的东西,Apple、Orange就没有办法进一步的分级出来,这就是我们需要全世界人民都接受的标准。

  接受标准不是一个人、两个人都说了算的东西,它是有一套标准组织和严格的流程。有两个历史比较久的标准阻止,其中第一个是ITU,在它下面有一个工作小组是在ITU下面负责研究视频编解码的技术和制定它的标准。第二个标准组织是ISO/IEC MIPEG。他们有一个MPEG,是在ISO、IEC下面研发视频编解码的技术,制定它的标准。还有一个公司是AOM,制定视频编解码标准。还有一个标准组织我没有写,但是我觉得也是非常重要的,AVS,是我们国内的标准阻止。近些年AVS做得越来越好、越来越强大,现在是完全不可忽视的一个力量。

  观察从过去到现在的标准,我们可以看到,1984年ITU已经出来了第一个标准,H.120,具体长什么样子我也没有见过,因为稍微有一点早。到1990年推出了H.261,这个已经是被大家广泛使用的。1993年ISO、IEC交替的出了MPEG-1 Part2。在1995年出了H.262,这个标准是ISO、IEC两个组织共同制定的。我不知道在座多少同学用过DVD,DVD这个格式我们小时候用了很久,DVD这个格式就是用了MPEG-2 Part2,很多电视节目也是用的MPEG-2 Part2。2003年有了H.264,像HD、DVD这些格式都是用这个,很多新的节目也都是开使用H.264。又过了大概十来年,出了一个H.265/HEVC,它也是我们认为比较好的。无论是从MPGE Part2恩到H.264还是H.265,它都是翻倍了的。

  下面花一点时间讲一下HEVC。HEVC在2007年左右开始预言,各个公司怎么有新的视频编解码的技术,到2010年1月份,这个标准组织觉得我们有希望,所以就做了一个标准。2014年全世界各个公司、学校和研究机构,全世界的工程师、科学家坐在一起做评估,出台了一个标准,又过了艰苦的努力,在2013年出台了Version1。2014年出版了Version2。2015年出版了Version3和3D。2016年又出了Version4。制定标准是一个蛮艰苦的过程,努力的工作一般来说回报都是不错的,HEVC的标准获得了第69届的艾美奖,工程师们也可以参加一下这种颁奖,蛮有意思的。参加这种活动的人只有十几个,但是这套标准积累了上千个工程师和科学家、研发人员的努力。

  这个地方是HEVC Block Diagram,H.265比之前做了很多改进,由于今天时间有限不太会讲的很具体,因为每一个技术又是一个新的讲座。

  做过264的同学都知道,另外一个重要的模块是运动关系,我们做了更多技术,包括更多预测单元和Coding,很多都有新的更新。265比264的时代有更多Modes以后,做了很快技术的提升。

  Deblockin Filter,之前像263这种都是后处理的模式,264做了一个稍微革新性的,265也做了改进,我们在266会有更新的改进。

  我们标准有一系列的数据,大家不能拿来自己比较,这个是426×240的,但是现在很少人看这样的,如果单单把HD拿出来,这个HD sequences,我们264可以到40-45。我们做视频、视觉或者图像的同学都知道,数据是一回事,有时候科学是另外一回事。Subjective是67% class B sequences,49%for class C sequences。

uber董事长

  做标准的人是永远不会停下来的,标准这个事情是一代一代可以永远做下去的。我们进行266的预言,266的预言大概在2013年、2014年很多公司就开始了,2015年10月的时候,ISO、IEC、ITU这几个相爱相杀的组织说要一起做,就一起进行预言,大概又过了两年时间的共同研究,他们说又有信心可以做一个标准,所以标准组织又发了一个通知,明年公司、学校、科研人员又要坐在一起讨论,在未来两三年时间里面我们又要努力工作,做下一代的新的标准。

  刚才讲我们做了很多预言,我们有这么多编解码的工具。我们看到4K和2K的情况,我们已经有35%的Coding game,我们有一定的信心可以做下去。这是一个起点,不是一个终点,在未来两三年里面,我们会进一步把coding game的数据做大,把另外那个数据降低,带给大家更好的体验。

  这大概就是我今天分享的关于视频编解码和国际标准的浮光掠影的简单介绍。

  下面我用简单一两分钟时间介绍一下我们音视频实验室的场景,让大家看一下我们的工具和比较有意思的事情。

  因为我们要落地场景,所以实质性要求很高,这是在工业中进行的测试,比如说降噪,一个物体可移动的很快,它可以转、颜色有改变,或者它是不是会掉下来,都有预测的。我们的TPG会进行图像压缩和解决方案。

什么豆豆兼职

  还有语音的前处理,我个人不是语音专家,但是我们实验室有很多语音方面的专家,我们音视频实验室分论坛,语音背景的同学可以过来跟语音专家进行深度交流。我们还有一些比较有意思的语音方面的demo,因为这边效果不太好,demo效果在分论坛会有演示,欢迎大家来看我们的音效。

火星情报局是原创节目吗

  我们还在探索跟AI相关的课题,AI的语音降噪和分离,包括AI的语音美化。我们不仅只美化样子,还要美化声音,这是全方位的美化。还有AI辅助的音视频的质量评估等等。

  这些是音视频实验室近期的成果和应用场景。这就是今天的分享,非常感谢大家。


返回网站首页

本文评论
iPhone的缔造者:07一代苹果“六虎”今何在?
  北京时间7月22日消息,如果你曾拥有过Mac、iPod、iPhone或者iPad,那么这张照片中的人至少部分参与了这些发明的创造。  这是苹果公司在2007年的领导团队,他们负责开发了部...
日期:07-17
科学家认为量子计算机_比尔-盖茨:我不太懂量子计算技术
佳尼特净水器官方商城华硕一体台式电脑  北京时间9月26日凌晨消息,微软创始人比尔·盖茨(Bill Gates)在与该公司CEO萨提亚·纳德拉(Satya Nadella)一同接受《华尔街日报》...
日期:07-16
彭迦信谈腾讯音乐人计划:未来三年  打造中国原创音乐新生态「腾讯音乐人发布歌曲」
  2017年7月24日,北京/腾讯——腾讯音乐娱乐集团在京举办“你的不凡,让世界听见”主题发布会,在会上,腾讯音乐娱乐集团公布了腾讯音乐人计划。腾讯音乐娱乐集团CEO彭迦信在发...
日期:07-16
360手机总裁李开新:N6燧石黑版预计下周面市
  今年双十二期间,360手机在北京召开新品发布会,带来了N6和N6 Lite两款新品。其中,N6采用5.93英寸全面屏设计,搭载骁龙630处理器和5000mAh大电池,成为市面上为数不多的具备“三...
日期:07-16
腾讯开放平台产品总监毛华详解QQ物联平台能力
  11月20日,2014中国智慧家庭高端论坛在深圳会展中心举办。腾讯不久前发布的社交化智能硬件平台QQ物联,令现场众多传统硬件厂商和开发者振奋不已。腾讯开放平台产品中心总监...
日期:07-14
智能门锁销售_宣布投身智能门锁行业后,刘江峰将于4月9日开启首次招商
  3月6日,智能硬件领域知名企业家刘江峰通过微博平台透露,其全新投入创立的智能家居服务平台——优点科技将于4月9日在北京召开全国招商大会。据悉,此次招商大会主要是为优点...
日期:07-16
华为云胡维琦:携手同行 做出海企业的靠谱伙伴「华为云副总裁胡维琦」
  5月27日,“华为云中企出海创新峰会2022”在深圳举行。华为云中国区副总裁胡维琦在会上表示,中国企业出海势在必行,但在面对诸多不确定性,“出海”企业需要有“靠谱伙伴”一...
日期:07-19
库克:999美元起价的iPhone X为何“物有所值”「库克谈iphone降价」
  (原标题:Tim Cook calls $999 iPhone X a ‘value price’ in new interview )魅族手机新款  9月20日消息,据外媒综合报道,自从上周苹果iPhone X发布会以来,苹果首席执行...
日期:07-16
原安波福副总裁韦峻青加入滴滴自动驾驶公司,任CTO_滴滴韦峻青简历
  9月16日消息 9月16日消息,滴滴确认安波福全球工程副总裁韦峻青加入自动驾驶公司任CTO,韦峻青向滴滴出行CTO兼自动驾驶公司CEO张博汇报,自动驾驶美国团队负责人贾兆寅和中国...
日期:07-17
刘军回应联想大调整:目标是更贴近用户「联想的刘军」
  1月8日消息,联想集团执行副总裁兼中国区总裁刘军昨晚发布内部邮件,宣布联想中国区进行组织架构调整,聚焦三大客户群——大客户、中小企业客户及消费客户。  随后在1月9日...
日期:07-22
戴威为什么创建ofo_对话ofo创始人戴威:我们不生产车 只坚持连接车
  共享单车作为共享经济领域的“弄潮儿”,深受广大市民青睐,如今骑ofo小黄车不只是为了方便短途出行,更成为一种新颖、时尚、便捷的出行方式。近日,央视《对话》栏目以中国“...
日期:07-16
李逸飞,抄底网页游戏的大玩家
  移动互联网不断与PC抢夺着用户的注意力,搜索、电商、社交、影视——游戏也不例外。网页游戏,在当今手游市场疯狂飙涨的时代,在一定程度上容易被人们遗忘。《刀塔传奇》为代...
日期:07-14
英特尔CEO:新Atom触摸屏电脑价格将低至200美元_intel atom最新处理器
  4月17日消息,据国外媒体报道,英特尔首席执行官保罗·欧德宁(Paul Otellini)今日在财报电话会议上表示,公司今年晚些时候即将发布的新Atom处理器,将大幅拉低Windows 8触摸屏...
日期:05-25
AMD Zen架构之父加盟特斯拉:全力研发AI芯片_特斯拉芯片设计师
  原标题:AMD Zen架构之父加盟特斯拉:全力研发AI芯片  Jim Keller可是无数DIY玩家崇拜的对象,他的经历可谓是十分传奇了,苹果、AMD、特斯拉等硅谷大企都有着他的身影,而且他...
日期:07-16
极客之夜丨迅雷陈磊:以 CES 为起点,玩客云要带共享计算和区块链走向国际
  去年 10 月 31 日,在「玩客云战略发布会」上,担任迅雷 CEO 大概 110 多天之后,陈磊首次公开出现在了公众面前。  2014 年加入迅雷负责云计算业务之前,陈磊在谷歌、微软、...
日期:07-16
马斯克与SEC和解:辞去特斯拉董事长职务_马斯克是不是特斯拉的老板
  9月30日消息 根据外媒华尔街日报的报道,马斯克将继续担任首席执行官,但必须辞去特斯拉董事长职务,由独立董事取代。百度研究院发布2021年十大科技趋势预测  ▲图自华尔街...
日期:07-22
李彦宏父女《朗读者》同框:没错了,女儿就是老爸精确到小神情级别的Copy
  6月22日,《朗读者》官方微博发布最新剧透,新一期节目以“父亲”为主题词。作为本期嘉宾之一,百度创始人、董事长兼CEO李彦宏携女儿Brenda一起来分享关于“父亲”的故事。深...
日期:07-22
拼多多山寨产品引争议 是拼多多还是假多多?_直击|黄峥:山寨问题比假货严重 拼多多做得不够好
  7月31日下午消息,拼多多因为“山寨”问题而陷入舆论漩涡。今日,拼多多在上海总部召开媒体沟通会,创始人、CEO黄峥现身并接受采访。英伟达RTX 3070小米电视不好吗如何用别人...
日期:07-22
同洲袁明:移动互联时代安全是关键
三星新款手机note20美团配送费一夜涨价   同洲董事长袁明出席2014深圳苏商论坛 买机票诈骗案  在移动互联网高度发展,智能手机使用高度普及的今天,民营企业如何改变传统思...
日期:07-14
奚国华:中移动需加强流量经营应对互联网竞争
   2月27日消息,网络社会的快速发展,正在推动整个通信行业的技术及业务模式的变革。中国移动董事长奚国华在“2013年世界移动通信大会”期间接受网易科技采访时表示,中国移...
日期:07-11