您的位置:首页 > 互联网

端到端识别、增量学习…思必驰DUI标注训练一体化平台的封神级操作

发布时间:2016-06-28 15:15:21  来源:互联网     背景:

  坊间总会流传些他们的段子

  格子衫、双肩包、沉默且不苟言笑

  当然,还有岌岌可危的发量(没有,不是我说的)

  那只能说,这些都是表象

  堪称新时代的中流砥柱

  每天家住回龙观,征战新中关

  浑身散发出高级又内敛的气质

  究竟是什么塑造的?

  (一切为了工作 挣钱)

  小驰捕捉到一位思必驰程序员小哥哥

  今天去看看

  他日常的那些“封神级”操作!

  Q:一句话形容你正在做的事情?

  A:人类之光…在宇宙中心呼唤AI…反正很Cool就对了

  Q:最近有什么新成果吗?

  A:你光顾着关注我们发际线,不关注我们的精神成果,扣鸡腿…

  最近发布了DUI标注训练一体化平台,具体干啥的,来补课!↓↓↓

  DUI标注训练一体化平台全场景应用,识别体验持续提升!

  https://mp.weixin.qq.com/s/GaVP0XvAgwxrrdFT3fuqRQ

  思必驰DUI标注训练一体化平台,让服务赋能走向能力赋能:

  https://mp.weixin.qq.com/s/voKIm5uPzSceYmiHdiJWeA

  Q:如果我中英文掺着说,语音识别TA能听懂吗?

  A:不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率,自然就能准确许多。

  Q:让场景识别率能持续提升,你们有什么“神技”傍身?

  A:我们融进了最新的「端到端识别技术」来提升识别准确率,通过大规模预训练模型技术提升语音识别后处理效果。结合「增量学习」、「主动学习」、「联邦学习」和「小样本迁移」等技术手段,提升用户体验。同时开放「端点检测模型自训练」、「标点断句自训练」等功能,让用户自己拥有自主权,来解决实际问题。

  Q:呃…

  A:好,说点你能听懂的

  高能,划重点!

  第一,关于端到端识别技术。

  过往严格意义上的端到端识别技术,如基于LAS的端到端系统,虽然可以较明显地提升通用语音识别的准确率,但受限于计算复杂、自定制语言模型技术不成熟等原因,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术,在实现通用识别准确率相对提升10%-15% 的同时,也提升了模型计算速度,更可以满足快速有效的语言模型自定制。

端到端识别、增量学习…思必驰DUI标注训练一体化平台的封神级操作

  第二,关于大规模预训练模型技术。

  要知道,语音识别系统中除了核心的语音识别(ASR)模型部分,语音识别的后处理模型也是十分重要的,它直接影响到识别结果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处理技术,能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型,结合多任务学习(Multi-Task Learning)和知识蒸馏(Knowledge Distillation)方法。在降低70%以上模型规模的条件下,提升了模型效果,运算效率大幅提升同时降低了内存开销。

  例如在智能会议场景中,通常转写结果是篇章段落,且多含有口语化的表达,通过我们的识别后处理功能,可以将会议转写结果整理成格式化,易读易懂的会议记录。

  第三,增量学习。

  受限于深度神经网络技术中的灾难性遗忘问题,采用深度学习方法的ASR建模在权衡“既要保障模型原有识别效果,又要提升新的目标场景识别效果”时,通常采用基于新旧数据混合训练的方法。弊端是,该方法增长了模型优化的周期,又会带来数据安全隐患。基于思必驰自研的KDF-IL增量学习方法,在语音识别优化时,可以仅用新增数据进行模型训练,缩短开发周期同时,也有效保障数据安全。 第四,小样本学习。

  自研的小样本迁移学习技术,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模型进行优化,相对传统模式调优,节省了83%的数据量。例如,在真实的航空质检场景中,通用的标点断句模型面对特殊的专业术语和断句方式,一定会水土不服。得益于小样本迁移学习技术,在使用少量的标注文本情况下,即可实现F值40%左右的绝对值提升,完成体验效果从不可用到可用的转变。 最后,咳咳….(这个氛围是不是该升华了)在功能层面,我们深知不同用户的使用场景复杂多样,单靠赋能用户自主训练ASR模型不能满足需求。

  我们!(升华来了)秉承以解决用户实际问题为核心的产品理念,开放端点检测模型自训练、标点断句自训练等功能,使得用户可以通过我们的产品,完成识别系统中几乎所有模块功能的自训练,最大程度优化用户体验。

  Q:啊,真不愧是“人类之光”。求问,没经验可以用吗?

  A:平台建立的出发点就是降低 AI 使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模型。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,”零“学习成本。

  Q:怎么合作呢?

  A:平台同时满足「模块化输出」+「支持 UI可视化界面 /API输出」这两点,可以根据业务需求灵活配置,选择使用一体化平台的全部功能,或者只使用其中几个模块的功能。

  Q:可以拓展使用吗?

  A:当然可以,「全场景覆盖」是平台的一大优点。适用于各类行业场景,如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形成规模化生产定制,满足多样化的业务需求。

  Q:怎么联系你们呢?

  如有合作意向,请发邮件

  Q: 好,不愧是气质不凡的你们!今天收获颇丰!

  A:总结下,就是我们在一个科技开放和包容的时代,和一群特别Cool的人,做了些特别Cool的产品和事情。如果你想更了解我们,欢迎随时交流。


返回网站首页

amd rx 6000

九号电动车2021发布会


百度地图更新采集员

凡客诚品的物流模式

iqooz3深度评测

桔子数科:疫情管控不可放松,企业风控亦是如此
一图盘点华为全场景智慧生活发布会

返回网站首页

本文评论
苹果15信号有救了!高通商用5G基带:全球支持Wi-Fi7商用方案_苹果13是集成5g基带吗
伴随着骁龙8 Gen2的发布,高通也将要正式开始商用X70 5G基带了,当然下一代的iPhone 15也会用它,所以不用担心信号差了?需要明确的是,第二代骁龙8的X70 5G基带芯片是首个集成AI处理...
日期:11-19
乔布斯退了  苹果还是那个苹果吗?(乔布斯什么时候退出苹果)
一个美国式的英雄,几经起伏,21岁与别人合伙创办公司,掀起了个人电脑的风潮,改变了一个时代;30岁最顶峰的时期被亲手创办的公司扫地出门,但12年后,又卷土重来,挽救其于危难中;他的到...
日期:07-22
十年远控品牌向日葵亮相海纳汇,助力物联网企业数字化
  2019年7月20日,海纳汇联盟年度全国巡展第六站在杭州成功举办。   海纳汇中国软件行业生态联盟是中国最具合作价值的软件行业生态联盟,是由千百家各行业软件厂商和渠道...
日期:06-04
移动网络质量领航方阵成立:今年将开展App网速测试等研究
  讯 8月30日下午消息,由中国信息通信研究院、工信部新闻宣传中心联合主办的“移动网络质量领航方阵成立大会”在北京召开。会上,“移动网络质量领航方阵”正式成立。  大...
日期:08-31
“不同世界里的人都在高攀” 苏宁侯恩龙呵呵消费降级
  “世界不再是平的,而是平行的。”   “不同世界里的人,都在高攀。”   “先补贴再回收,不是所有同行都能干。”   2月26日,苏宁易购总裁侯恩龙,在315全民焕新节发布会...
日期:11-05
小米13外观「小米13系列定档12月1日,双尺寸造型+四边等宽亮了」
中关村在线消息:今日小米官方宣布,小米13 系列 & MIUI 14 新品发布会将于12月1日晚七点正式举行,并且明确了小米13 和 小米13 Pro双尺寸的消息。从放出的海报中,我们可以看出一...
日期:11-29
gen8 集成显卡「硬件光追!骁龙8 Gen2堪比电脑显卡」
高通全新旗舰第二代骁龙8(骁龙8 Gen2)正式发布,骁龙8 Gen2采用台积电的4nm工艺和1+2+2+3架构,包括1个Cortex X3超级核心、2个Cortex A715核心、2个Cortex A710核心和3个Cortex...
日期:11-17
windows11 edge_微软 Win11/10 Edge Canary 浏览器 96 新增 PWA Hub 应用中心:全新设计
  10 月 12 日消息 据 MSPoweruser 报道,微软宣布为 Windows 11 和 Windows 10 上的 Edge 96 浏览器提供新的设计功能,目前只在 Edge 浏览器 Canary 频道中开启使用。   ...
日期:02-15
快快网络高防IP特点:弹性防护,DDoS无可乘之机_ddos高防IP
  随着互联网和企业发展的交汇融合,加速了企业数字化转型升级,然而企业在享受互联网发展的同时,面临的网络攻击手法也不断升级,DDoS攻击作为一种经典的攻击方法延续至今,其影...
日期:07-14
台积电超越英特尔「Intel奇迹上演:2年内EUV工艺超越量产多年的台积电、三星」
Intel以往是全球最先进芯片工艺的领导者,然而在14nm到10nm节点之间遇到了问题,导致台积电、三星追赶上来了,并且率先量产了EUV工艺,不过Intel也在努力反超,CEO制定的路线图意味着...
日期:09-22
花房集团香港上市「花房集团成功登陆港股 走上新征程、描绘娱乐元宇宙蓝图」
  12 月 12 日,花房集团正式登陆香港联合交易所,股票代码3611,其保荐人为海通国际和建银国际。过去三年,累计营收超百亿元,花房集团通过业绩的稳步增长,充分展现了自身的成长潜力...
日期:12-13
谷歌广告推广怎么做_谷歌推出了1亿美元推广活动 吸引中小企业注册广告服务
  12月30日早间消息,自12月中旬起,谷歌推出了一项总计1亿美元的市场推广活动,旨在吸引中小企业注册AdWords广告服务。   这一举动进一步显示了谷歌对本地性企业的重视。每...
日期:07-25
谷歌搜索“崩了”?全球数万人受影响 谷歌地图和Gmail也故障?_谷歌的问题
财联社8月9日讯(编辑 刘蕊)据网站故障实时监控平台DownDetector报告,北京时间周二上午,全球多地数万名用户报告谷歌搜索引擎出现故障。   据报道称,美东时间周一晚9点20分左右...
日期:08-10
运营商免费战升级 广东联通体验免费WLAN网络(广东联通畅享会员)
  据了解,中国联通在广东开展的WLAN免费友好体验活动主要是针对中国联通后付费手机用户。对于什么是后付费用户?广东联通客服(微博)给出的解释是:使用有效证件(如身份证),进行实...
日期:07-25
阿里跌6%蒸发2400亿「大厂投资的艰难一年:腾讯缩水六成,阿里仅出手十次」
图片来源@视觉中国文 | 新摘商业评论 ,作者 | 毕胥萍大厂降本增效的边界在不断扩张,今年以来,巨头对外投资数量呈断崖式下滑,腾讯投资出手80余次,相比去年同期210次大幅回落,字节...
日期:09-16
win10支持ie9_Windows Phone7.5发布在即 内置IE9功能丰富
       据国外媒体报道,微软公司即将在九月底发布Windows Phone 7芒果的更新,官方Windows Phone 7博客报道了更新版的芒果系统中内置Internet Explorer 9浏览器新功能...
日期:07-23
小蓝翼让妈妈睡一个安心好觉,从TCL智慧新风空调开始
  小时候的夏夜,妈妈总是温柔地摇着扇子送来凉爽舒适的柔风,伴我们酣然入睡。然而岁月荏苒,妈妈的好眠时光却在不断操劳中悄然流逝。在这个母亲节,不妨给妈妈编织一个甜美酣...
日期:10-24
中国工程院院士杜祥琬谈美“核聚变突破”:他们目的是研究核武器
凤凰网科技讯 12月15日消息,美国能源部宣布,在加利福尼亚州的劳伦斯利弗莫尔国家实验室(LLNL),研究人员首次在核聚变反应中产生“净能量增益”,即聚变反应产生的能量大于促发该反...
日期:12-15
一项研究认为古代火星可能充斥着生命_有研究指出,火星远古时期
根据一项模拟年轻火星条件的研究,在火星历史的早期,这颗红色星球很可能适合甲烷菌居住。根据亚利桑那大学的科学家领导的一项新的研究,如果火星上曾经有生命,那么在这个星球的幼...
日期:10-16
MIUI 14展开全新“剃刀计划” 砍掉臃肿系统固件「miui12.5剃刀专项」
中关村在线消息:11月29日下午,小米手机官方微博提前剧透MIUI 14:该版本将展开“剃刀计划”,努力打造“固件最小、占用内存最小、不可卸载应用最少”的超纯净系统,相比MIUI 13系统...
日期:12-02