您的位置:首页 > 互联网

在线语音识别准确率领先15%,百度输入法AI探索版带来语音输入新突破

发布时间:2017-06-13 09:33:03  来源:互联网     背景:

  当所有的“发声”都得到回应,越来越多的普通人拥有了深切感受AI的机会。去年1月,百度输入法用实力拉开了“AI·输入 全感官输入1.0”的序幕,今年1月,百度输入法再次召开以“AI·新输入 全感官输入2.0”为主题的发布会。短短一年之后,百度输入法就再次基于科技创新与功能创新,推出了一款主打全语音交互的AI输入法产品。

  据悉,当天发布的“百度输入法AI探索版”,是一款集合了多项AI能力、面向未来的全新输入产品。不仅在输入形态上,充分调动了语音、表情、动作等多方面感官,让“输入”变得便捷有趣;还在使用场景上,带来科幻电影般的新鲜体验。发布会现场,百度高级副总裁王海峰再次强调了输入法“AI落地的桥头堡”的效用,他指出,一方面,输入法是离用户最近的产品之一,另一方面,百度全方位的AI能力也在不断赋能输入法。通过AI技术的加持,用户通过文字、语音、表情、动作都能进行交互,还能实现一些更科幻的场景,高效便捷的同时也展现了未来智能蓝图。

  语音识别:四项重大语音技术突破打造最强AI输入法

  当用户开启百度输入法AI探索版后,点击语音按钮,除了可以说出你要记录的内容,让输入法帮你直接录入转文字,还可以呼唤“小度小度”语音助手,并说出相应指令。即可实现语音修改、发表情、发弹幕、发文件等一系列操作,满足与输入相关的周边需求,可以说,百度输入法AI探索版的核心亮点之一就是语音能力。

  百度输入法AI探索版

  百度输入法的语音能力,在过去一年中不仅有着世界领先的重大技术性突破,更有着功能性创新突破。首先,百度输入法洞察到年轻圈层的“中英文混合”表达方式,以及不同地区用户的“方言输入”需求,因此通过不断优化技术和训练新的识别模型,从而实现了“中英文混合识别”与“方言自动识别”两大功能突破。让用户可以自由地使用自己熟悉的表达方式。据悉,百度输入法是目前唯一实现了高精准中英文混合语音输入、唯一实现了方言免切换语音输入的输入法产品。

  此外,据国内产品负责人蔡玉婷现场介绍,百度输入法团队还针对网络不畅、无网络的情况,优化了输入法上嵌入式识别的Deep Peak2系统,大幅提升了离线语音识别准确率,让用户在地铁、电梯等地也可以不中断的使用语音输入,轻松搞定各种场景下的输入需求。目前,百度输入法的“离线语音”输入准确率已高于行业平均水平35%。

  而在技术层面上,百度语音技术部负责人高亮再次带来了语音识别技术的重大突破——“流式截断的多层注意力建模Streaming trancated multi-layer attention(SMLTA)”。传统的attention模型,无法做到在线语音交互的大规模实时服务,会引入较大的用户等待时间。而此次百度语音技术,在业界第一次创新性的提出的SMLAT技术,可实现层层递进的更精准的特征选择,使得语音识别的识别率超越传统的attention建模;同时,其计算速度和传统CTC技术持平,实现全CPU流量的大规模线上服务,这让百度输入法的“在线语音”相对准确率依然领先最优竞品15%。据悉,这项技术是全世界范围内,第一次基于attention技术的“在线语音识别服务”的大规模上线,标志着百度语音在线识别技术的世界领先,更是中文在线语音识别历史上的又一次突破!

  AR表情:秀场社区x丰富的表情创意

  如今用户的表达方式已不只局限在文字表达上,表情包成为网络社交中不可或缺的存在。2018年百度输入法发布会上亮相的“AR表情”功能受到了众多用户的喜爱,截止目前使用量突破1亿,20%的用户都使用并分享过AR表情。

  基于领先的人脸识别技术和 AR 技术,百度输入法今年又带来了更多AR表情的新玩法。“百度输入法 AI探索版”中不仅有能操控照片中人物或动物表情的“拍立活”功能;还有将人物置身于虚拟场景的“秀场”功能;并开辟了“表情秀”社区供用户分享自制的表情包作品,社区已经有多个明星、网红及民间高手入驻。

在线语音识别准确率领先15%,百度输入法AI探索版带来语音输入新突破

  在大会现场,凭借发际线红遍网络的表情达人“小吴”演示了AR表情的新功能“拍立活”。当他站在体验装置前,分别作出眨眼、惊讶和咧嘴笑等各种表情时,照片中的动物也被驱动着同步做出了相同表情。除了这样玩,“小吴”还在照片中叠加了“眉有办法”“锦鲤在此”“skr”等各种表情贴纸。AR表情将“小吴”超强的表现力生动再现于图片中,让现场观众连连鼓掌。

  动作识别:凌空手写 充满未来感的输入方式

  “百度输入法 AI探索版”中最具“未来感”的功能莫过于“凌空手写”,百度输入法技术负责人秦添也在发布会现场演示了这一功能。

在线语音识别准确率领先15%,百度输入法AI探索版带来语音输入新突破

  当他在空中手写下“凌空手写”四个字时,大屏幕上同步显示着一笔一划的输入轨迹,与轨迹转换成文字的过程。主持人张绍刚忍不住想尝试自己的名字,秦添又写出了“张绍刚”三个字,大屏幕再次显示着输入轨迹转换成字的过程。据百度输入法技术负责人秦添介绍,这项“凌空手写”来自全新的文字识别技术,不需要特殊的手写笔、深度摄像头或多目摄像头等硬件,最普通的RGB摄像头就可以完美支持。书写起来顺滑流畅,识别率也达到了大规模应用的要求。在“百度输入法 AI探索版”中,用户可以说“小度小度,打开凌空手写”来开启体验。

  “百度输入法 AI探索版”的语音输入、AR表情、手势识别刷新了公众对于“输入法”的认知,在AI技术的持续突破与赋能下,百度输入法还可以变得更聪明,先一步去探索全感官输入的2.0时代!


返回网站首页

购物网站首页布局

实时翻译讯飞翻译机 不错

开拓创新思维

小米4刷win10使用感受

华硕碉堡k31an

海尔无霜冰箱结霜

统信uos手机版

合同管家让您的合同管理不再困难
腾讯安全发布信息泄露报告:暗网成信息贩卖主要渠道

至2015年底,并网中国光伏发电装机总容量已达到


返回网站首页

本文评论
699 元,小米米家智能窗帘开启众筹:小爱语音控制 + 自动开合(小米智能窗帘控制系统)
  6 月 10 日消息 今日上午,小米米家智能窗帘开启众筹,零售价 799 元,众筹价 699 元。产品中包含电机、磁吸遥控器、3 米镁铝合金导轨和首次免费安装服务,但窗帘布需要消费者...
日期:07-14
微软免费实用工具集PowerToys 0.18.1 发布
  PowerToys 0.18.1 发布了,这是一个修复版本,主要解决了以下问题:   • FancyZones - Chrome 标签页回归   • PowerToys Run - 结果/搜索焦点问题   • PowerToys R...
日期:07-14
苹果手表Series7被曝过热后爆炸 苹果回应称将展开调查_苹果手表爆屏
10月9日 消息:据9to5Mac报道,一位 Apple Watch Series7用户反映称自己的手表在出现过热、冒烟后最终炸裂。目前此事件已经引起苹果公司的注意,该公司确认将调查该事件。该用户...
日期:10-12
比亚迪ipo过程「比亚迪半导体IPO发行注册程序中止」
10月1日消息,深交所信息披露显示,比亚迪半导体股份有限公司因IPO注册申请文件中记载的财务资料已过有效期,需要补充提交,根据《创业板首次公开发行股票注册管理办法(试行)》第二十...
日期:10-06
港股美团跌超11%,市值跌破1万亿港元「港股美股溢价」
  讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,腾讯方面回应称,不予置评。宙斯羊最...
日期:10-09
2022年5月23日科技工作者法律服务活动正式启动(2022年5月23日科技工作者法律服务活动正式启动新华网)
  弘扬法治精神,服务科技强国。2022年5月30日是第六个“全国科技工作者日”。5月23日至5月30日,中国科协学会服务中心将通过线上形式开展科技工作者法律服务活动。活动旨...
日期:09-28
雅虎拦截用户声讨华尔街邮件 辩称属疏忽大意
  据美国科技资讯网站CNET报道,雅虎周一就其电邮服务上周末拦截用户发送的声讨华尔街的电子邮件一事道歉。雅虎解释说,针对外部垃圾邮件的过滤机制拦截了这些电子邮件,但坚...
日期:07-23
你的手机越来越“懂”你? 这可不见得是件好事(这是真正懂你的手机)
来源:《工人日报》(2022年08月13日 03版)   朱玥   近几天,个别平台是否存在大数据杀熟的情况,正在被网上热议。事实上,大家有没有发现,自己日常生活越来越离不开的手机,似乎...
日期:08-13
在全面屏时代 瀑布屏或将成为下半年曲面屏的主流(曲面屏 瀑布屏 区别)
  最近,OPPO曝光了一款“瀑布屏”设计的概念机,所谓的“瀑布屏”,也就是两侧的屏幕弯曲程度非常大,按照OPPO公布的消息,这款概念机的弯曲角度已经达到了88°,近乎垂直。   ...
日期:12-23
识别区域达前代10倍!三星Galaxy S23 Ultra或将搭载超声波指纹解锁
熟悉iQOO 9 Pro和vivo X80 Pro等机型的使用户,应该对高通的3D Sonic Max超声波指纹解锁并不陌生。近日,有消息称,三星的Galaxy S23 Ultra很可能也将采用高通的第三代超声波指纹...
日期:11-26
《微软飞行模拟》迎来加大拿世界更新「微软飞行模拟器」
《微软飞行模拟》开发团队刚刚放出了又一个游戏世界更新预告,可知这回重点放在了提升世界第二大国 —— 加拿大 —— 的视效细节上。与之前的重大世界更新一样,“World Update...
日期:09-30
酷狗上线新 App“歌叽歌叽”:适合新手创作歌曲
  8月 16 日消息 据 Tech 星球,酷狗于近日上线了一款名为“歌叽歌叽”的 App,该 App 可用于歌曲创作。   “歌叽歌叽”是一款歌曲创作入门应用,适合新手学习歌曲创作。该...
日期:07-17
2021第二季度全球智能手机出货量前三「超高端智能手机占 2022 年第二季度智能手机总收入的一半」
10月9日消息:根据Strategy Analytics发布的数据,超高端智能手机批发价在600美元及以上,占2022年Q2智能手机总收入的一半,略低于前两个季度。挖矿得比特币新氧医美 金星除了100-...
日期:10-25
知乎“吾辈问答”浏览量近5000万 青少年保护问答引热议_知乎回答浏览量
近日,由知乎发起的“吾辈问答”行动自1月16日上线起已更新三期,内容浏览量近5000万。继前两期内容《马路边的答案》、《镜子里的答案》后,新上线的第三期内容聚焦青少年保护的...
日期:08-02
荣耀智慧屏怎么看电视台的频道,这个软件可以免费看电视台频道
  荣耀智慧屏凭借着超高的性价比,已经成为京东销量榜前十的常驻品牌了,加上陆续很多型号都支持鸿蒙2.0,销量只增不减。   但是很多朋友说不知道荣耀智慧屏怎么免费看直播...
日期:07-17
IDC公布中国HCM SaaS市场最新数据 北森连续5年领跑
  近日,国际权威咨询与服务机构IDC公布了《中国公有云人力资本管理应用(HCM)SaaS市场2020年下半年跟踪报告》。报告显示,2020年全年该市场规模达到4.7亿美金,同比增长37.5%,...
日期:01-26
拼多多申请“拼甄选”等商标_拼多多注册商标
10月12日 消息:企查查APP显示,近日,拼多多关联公司上海寻梦信息技术有限公司申请注册多个“拼甄选”“拼臻选”“多多小圈”“井下圈”商标,国际分类为设计研究、社会法律等,当...
日期:10-24
科技助力教育普惠 作业帮2022年的教育公益扶贫实践
  2020年11月24日,教育部规划中心赴甘肃省西和县开展教育资源对接落实工作会议,作业帮、青岛市教育局及6+1所帮扶高校等地方教育部门、院校、教育企业出席会议。   为助...
日期:07-10
热钱卷进手打柠檬茶,一斤香水柠檬从5元涨到30元
  文|韦雯;编辑|彭孝秋  来源:36氪  越来越多的人快“喝不起”柠檬茶了。  即使在大街小巷都遍布手打柠檬茶店的广东也不例外。事实上,想在广东喝一杯正宗的手打柠檬茶,...
日期:08-30
绝世好屏来袭!iQOO 11将全系全球首发2K 144Hz E6全感屏_一代iqoo屏幕
据iQOO手机官方日前官宣,iQOO全新的数字系列旗舰——iQOO11系列将于12月2日下午14:00正式发布,将首批搭载高通第二代骁龙8移动平台,目前已在官网等合作电商平台上架开启预约。...
日期:12-02