您的位置:首页 > 互联网

唇语能听懂所有的话「小心!AI能看懂你的唇语,悄悄话不再安全!」

发布时间:2024-09-12 14:51:17  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:叨乐,授权转载发布。

小心悄悄话被AI听见!(嘘)

最近国外一款可以读唇语的AI软件火了!

具体效果如下:

红毯上布莱克·莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但AI可以。

乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。

看完后网友们开始纷纷评论,大开脑洞:

求“联名”型网友:快把它和Siri结合一下吧!这样我就不用像小傻子一样对着电脑大喊了!

测评型网友:我想用它试试“座机画质”的视频!

担心安全型网友:我有点害怕,我想戴口罩了。(呜呜)

实测 Readtheirlips 效果如何

量子位整理了一些视频,为大家亲测了一下Readtheirlips的使用效果。

先试了一下奥特曼在斯坦福的访谈视频,把生成的文本和原始对话对照了一下,内容完美契合~

贤济联盟互联网经济发展的意义是什么

dnf卡牌怎么附魔

而面对小表情比较多的老马,Readtheirlips的发挥依旧稳定。

倍速播放中0.5倍0.75倍1.0倍1.5倍2.0倍超清流畅

不过以上两个视频都是人物全程正脸对着镜头的。

换成了说话时爱比划的小扎,Readtheirlips直接显示错误。(视频中人物不是全程正脸)

而主角换成卡帕西之后,因为他说话太快,生成的文本出现了识别错误的情况。(左侧为Readtheirlips生成,右侧为文字处理软件生成)

最后,我们尝试着上传了一个16分钟的视频,Readtheirlips直接显示错误,无法识别内容。

总结一下:

Readtheirlips识别视频的时间在一分钟左右。

就像他们标明的那样如果人物的正脸不能正对镜头,那么模型就很难给出正确答案。

ipad os17尝鲜体验

而面对语速过快的视频内容,Readtheirlips只能识别出其中的一些内容。

对此,团队成员回应道:

是的,我们还没有研究到这里,但是会很快解决这个问题!

而关于上传视频的时长限制,他们这么说:

现在只支持3分钟以内的视频,但是以后我们会一点一点往上提升的!

AI如何“听”悄悄话

看完亲测视频,咱们也来唠一下Readtheirlips的工作原理。

看看它是怎么读取人类唇语的:

首先,研究团队用大量的标注数据(已知的嘴唇运动动作及其对应的文本内容)来对模型进行训练。

在此基础上,用户要上传一段视频,这段视频要包含说话者的面部特写,尤其是嘴部动作。

然后模型会对视频进行嘴部运动的分析:先是通过面部检测识别嘴唇的位置,然后再提取嘴唇的几何特征,(形状、开合程度、运动轨迹等),最后分析嘴唇在说话过程中的动态变化。(速度、方向和形状变化)

用唇语说爱情是什么歌

之后,模型会将提取的嘴唇特征与训练数据中的特征进行匹配,来识别出视频中人物所说的内容。

将识别出的单词或短语组合成完整的句子,进行一下上下文理解,确保语法和语义的正确性。

最终将识别出的内容输出为文本形式。

开发团队

Readtheirlips的开发团队Symphonic Labs是一家初创公司。

华为p60会不会出来

领英上显示它今年4月份才刚刚成立,截至目前,公司人数不到10人。

他们之前还研发过一款通过阅读唇语即可完成实时文本转录的软件Symphonic

两款软件的试玩链接都已附上,感兴趣的朋友们可以去尝试一下~

Readtheirlips 试玩链接:

https://www.readtheirlips.com/

Symphonic 试玩链接:

用唇语说话

https://symphoniclabs.com/

参考链接:

https://x.com/crsamra/status/1833494380357013879

— 完 —


返回网站首页

本文评论
广汽埃安plus报价「广汽 AI 大模型平台亮相:聚合多种模型,埃安昊铂 GT 轿跑首发」
IT之家 8 月 8 日消息,广汽今日正式推出 AI 大模型技术的最新研发成果 —— 广汽 AI 大模型平台,该平台号称是“汽车行业首创的大模型平台技术”,将在近期搭载于智能轿跑昊铂 G...
日期:08-09
Redmi Note 11R上架:搭载联发科天玑700,被称5G普及者「Redmi Note 10 Pro 5G 天玑1100」
小米是目前安卓智能手机品牌当中,比较受消费者所青睐的一个。而小米也在不断推出新机,提升自家产品在市场上的竞争力。9月29日,Redmi官宣,将于9月30日正式发售新机Redmi Note 11...
日期:10-06
马上消费:探索助力乡村振兴新路径 创新服务模式下沉信贷服务_持续提升金融服务乡村振兴
  6月17日,央行发布了“以信用为犁 耕耘美丽乡村”,提出引导金融机构创新服务模式,下沉信贷服务。   从中国的实践来看,各类金融机构都采取了“下沉”战略,“三农”金融规模...
日期:12-26
比亚迪秦内饰介绍「将于北京车展正式亮相 比亚迪秦L内饰座舱首次曝光」
【】4月19日消息,在光影图、外观渲染图相继曝光之后,比亚迪王朝全新中级轿车秦L的内饰官图也正式公布,融合现代科技和新国潮美学的“山水画境座舱”让人耳目一新。据了解,秦L将...
日期:04-20
滴滴:端午首日下载滴滴App注册用户超40万_滴滴司机注册下载
凤凰网科技讯 6月23日消息,2023年端午小长假,出行热度持续高涨。6月21日出行晚高峰时段,滴滴每分钟的打车呼叫量突破了10万单,每秒平均1700人同时叫车。假期出游和异地欢聚需求...
日期:06-24
are you ok小米手机壳上架Are you OK手型版气门芯帽 小米官方“整活”
来源:中关村在线中关村在线消息:9月2日,小米发布一款Are you OK手型版气门芯帽,其采用PVC材质、黄铜内芯,汽车,摩托车,电动自行车,自行车均可使用,售价29.9元。小米创始人、董事长兼C...
日期:09-02
美三大股指收涨 拼多多再创新高「美股周五:三大股指连跌三周,英伟达再跌逾2%,拼多多5天涨25%」
美国时间周五,美股收盘主要股指全线下跌,三大股指本周均下跌3%以上,且连续第三周下跌。此前美国公布了8月非农就业数据,并未改变美联储将在9月底大幅加息的预期。道琼斯指数收于...
日期:10-04
机器人工程难就业「机器人工程技术人员缺口达500万人 门槛高难度大供给不易」
  本报记者;贾;丽  近年来,机器人产业蓬勃发展,市场规模持续快速增长。据《中国机器人产业发展报告(2022年)》显示,预计2022年全球机器人市场规模将达到513亿美元,中国机器人...
日期:10-01
爱奇艺正式起诉「爱奇艺诉快手获赔218万 因后者侵权播放琅琊榜老九门」
10月31日 消息:天眼查App显示,近日,北京爱奇艺科技有限公司与北京快手科技有限公司、北京达佳互联信息技术有限公司侵害作品信息网络传播权纠纷两则文书公开。小米手机2月25日...
日期:11-01
美国比特币收税_美国国税局终于对比特币ATM机下手了
《美国国税局终于对比特币ATM机下手了》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:美国国税...
日期:08-01
IDC发布《中国智慧城市数字孪生技术评估,2023》报告「数字孪生 城市大脑」
通信世界网消息(CWW)当前数字经济发展上升为国家战略,数据量的爆发增长和数据价值化的普及应用将推动数字经济迈向新的发展阶段,作为数字经济时代的核心技术应用之一,数字孪生技...
日期:08-07
直播剥橘子「抖音2500万粉丝博主崩溃!大爷剥橘子给B太试吃前在抠脚」
快科技5月29日消息,日前,抖音2522万粉丝测评博主B太发布他去福州拍摄的鬼秤打假视频。他在市场内买了海鲜、特产水果等都没有少秤,但在一卖榴莲的货车上还是遇到了少秤的情况。...
日期:05-29
马斯克:将在2023年第三季度举行Cybertruck交付活动
4月20日消息,据外媒报道,当地时间周三,特斯拉首席执行官埃隆·马斯克在第一季度财报电话会议上表示,将在2023年第三季度举行Cybertruck电动皮卡交付活动。马斯克没有给出确切的...
日期:04-20
iphonese4售价曝光iPhone SE 4售价可能上涨10% 苹果_苹果se的价格是多少
来源:中关村在线苹果6降价据传,苹果即将发布新一代的 iPhone SE。这款新机型将会是该系列中的重大更新版本。相比目前市场上的其他 iPhone 产品线,新一代 iPhone SE 以较低的价...
日期:05-21
平安付消保反诈课堂丨规避“无故扣款”的认知误区_被平安付扣款了怎么办
(原标题:平安付消保反诈课堂丨规避“无故扣款”的认知误区) 李先生因生意需要资金周转,通过“某利贷”APP 平台申请到10万元贷...
日期:02-07
英伟达承认「谁能先“甩”了英伟达?」
OpenAI也在骑驴找马,想要尽快摆脱对英伟达的依赖。据路透社,至少从去年开始,OpenAI就已经讨论了各种方案,希望能解决芯片又贵又短缺的问题。其中,自研芯片是方案之一,目前这个方案...
日期:10-09
适马35mm 1.4评测「全球限量200支!适马推出35mm F1.4 DG DN Classic镜头」
快科技7月14日消息,今天,适马官方发文,正式公布了35mm F1.4 DG DN Classic镜头,并宣布该镜头全球限量200支。根据官方介绍,该镜头将复古电影镜头技术用于民用相机镜头上,仅为中国...
日期:07-15
解决隐私信息泄露难题:微软宣布BingChat推出企业版
对于人工智能聊天机器人,不少大型企业都是抱着一种又爱又恨”的心态,爱的是它对办公效率的显著提升;而恨的,则是其存在的泄露公司信息的风险。这也使得苹果等企业纷纷开始投入生...
日期:07-19
小学生边输液边写作业「央视网:边输液边做题 理解但不支持 家长过度焦虑了」
近日,一张孩子们在医院边输液边做作业的照片引发社会热议。这一现象反映了社会对教育和学业的过度重视,以及医疗资源的匮乏。央视网对此表示理解但不支持,强调了对学业和医疗资...
日期:11-24
QQ2011beta3新增朋友:社区细分关系功能化
距腾讯公布的Q+平台开放的时间越来越近,腾讯于近日推出QQ2011Beta3体验版,对于此次QQ2011Beta3体验板中“校友聊天”和“好友推荐”这二种功能的增加,使腾讯朋友融进了QQ。有...
日期:07-30