您的位置:首页 > 互联网

撕掉虚拟人营业脸,DreamTalk开源释机会

发布时间:2024-01-10 19:50:49  来源:互联网     背景:

声明:本文来自微信公众号“元宇宙日爆”(ID:MBNews),作者:木沐,授权转载发布。

搭上AI大模型的春风,元宇宙概念期出圈的虚拟数字人又火了一把。结合人工智能自然语言大模型,用3D动画、动态捕捉、中之人等技术动起来、说起来的虚拟人,现在拥有“大脑”了。

AI化后,原本就能以文字、声音输出内容的虚拟人,在与外界交互时更显智能,输出的内容也在丰富度、专业性上提升了一个档次。更重要的是,AI提高了虚拟人在制作层面的生产力。

2023年,各种添加了人工智能元素的虚拟人被广泛用于内容播报、直播等场景中,成为电商、短视频博主们的新宠。

然而,不足始终存在。拟真类的虚拟人在表情、声音、动作上仍然能被识别到机器感,自然度、真实感远不能与人类的肉身媲美。一些开发者试图用AI大模型来弥补虚拟数字人的这个短板,DreamTalk就是解决方案之一。

这个基于扩散模型的框架由阿里巴巴、清华大学和华中科大共同研发,从“头”开始,不仅能让虚拟头像开口说话、唱歌,还能模仿表情变化、同步嘴形。

最近,DreamTalk开源了,这个框架有望为虚拟人注入“情绪”。

为虚拟人丰富声情言表

DreamTalk的绝活儿是仅凭一张头像图片,就可以让脸动起来,加上语音的输入,说起来也不成问题,而且还能对上嘴型和神态,然后生成一段头部说话的视频。

拟人从“学习”开始。基于大模型框架,DreamTalk可以从输入的语音和肖像中学习并推断出表达风格,生成有个性的表达视频。即使使用同一音源,头像也能够表现出生气、开心、难过、鄙视等不同的情绪神态,并以相应的面部表情来表达。

DreamTalk支持多种人物表情

DreamTalk这类模拟人类表情的解决方案再次为虚拟人制作环节增加了一个工具,毕竟,情绪是当前虚拟人最匮乏的表现力。

喜上眉梢、横眉怒目、涕泗横流、笑逐颜开,人类的喜怒哀乐等情绪总是第一时间表达在脸上,再辅以语言呈现态度。而总想模拟人类的各种虚拟人人均一副“营业脸”,表情包里要么是“微笑”,要么是“扮酷”,情绪不能再多了,机器人语音虽然有各种腔调,但还是能让人识别出机器感。

今年初,小冰公司启动了“GPT克隆人计划”,将AI和虚拟人做了结合。由此而来的AI克隆人网红“半藏森林”上线后引起关注,但其僵硬的表情也让很多人吐槽体验不佳。

近期,小冰的克隆人上线了淘宝旗舰店,面部僵化的问题依然存在,有买家评论吐槽:“视频通话假的要死,跟博主半毛钱关系没有。”

中国传媒大学发布的调查显示,对不同类型的虚拟数字人,大众对其外形、人设、技术能力、服务能力有着明显的期待差异:60%以上的用户最关注虚拟偶像的外形和作品,66%的用户关注虚拟主播的主持风格,50%的用户认为虚拟员工最重要的是技术服务以及跨界合作能力。

随着虚拟人以直播等方式走进与人类交互的场景时,需求正在朝着虚拟人的个性化发展衍生,尤其是当AI大模型出现后,解决虚拟人情绪甚至情感的方案将成为一个独立的赛道。

DreamTalk的开发方之一阿里巴巴此前就申请了“对话内容生成、虚拟对话、对话内容的数据处理方法”的专利。摘要显示,该申请通过构建情感关联图,可以深度理解引发对话情感的具体关键词,从而通过情感关键词预测目标关键词,有效地在对话回复内容中展现同理心,进而实现共情对话,提高对话内容生成的准确性。

进入2024年,市场对虚拟人的需求不再只是能说会动了,还得把“情绪价值”拉满。

AI给完大脑给情绪

能通过声音、图像适配情绪的DreamTalk类AI方案有望让虚拟人的“表情包”丰富起来,也会给虚拟人制作带来了便捷工具。

在技术上,虚拟人有机会借助AI拟态工具摆脱真人驱动的限制。

在“算法驱动型”虚拟人之前,虚拟人应用的实现往往依靠真人驱动,这就是我们常说的“中之人”,即借助真人通过动作捕捉设备进行形体、眼神、动作等的捕捉,然后才能进行驱动和渲染。一般而言,它的生产周期更长,成本也比较高。

花脸AI创始人刘威曾表示,只有实现虚拟人的快速生成,解决低成本大量复制、高频次内容产出两大问题,同时摆脱中之人的束缚,虚拟人才能有普遍的商业价值。

而“算法驱动型”的虚拟人,可以自驱动学习模特说话时的唇动、表情、语音,以及姿态和动作等等,不仅无需真人参与,还可以实现更快速的渲染,降低制作成本。所以,这种技术方法更适用于虚拟人的规模化制作。

在用户体验上,智能化的情感生成将有效提高虚拟人交互能力的提升。

目前已出现较多陪伴型虚拟人应用,其中一款名为Talkie的虚拟陪伴APP在在海外已有百万日活。从去年8月开始,这款应用的下载量一直在高位徘徊,并长期霸占着美国Google Play娱乐应用下载榜前十的位置。除了美国之外,在新西兰、英国、加拿大、澳大利亚这些发达市场,Talkie同样取得了不错的成绩。

Talkie虚拟人主打“陪聊”

华为mate50pro耐用度测试

但包含Talkie在内,目前的绝大多数主打陪伴场景的虚拟人应用,在情感互动层面表现单一。以Talkie为例,里面的所有虚拟角色均以静态图片的形式出现在聊天背景中,互动的方式只有语言,主打一个“陪聊”。

随着AI技术的突破发展,Talkie这类应用绝不是虚拟陪伴产品的最终形态,它们将作为一种过渡形式,而解决数字人情绪表达的方案有望为虚拟人注入“灵魂”,成为虚拟人产品革命性的机会。


返回网站首页

本文评论
东芝同意接受由JIP牵头的财团以2万亿日元收购_东芝集团出售
3月24日消息,据外媒报道,周四,半导体制造商东芝表示,它已同意接受由日本私募股权公司“日本产业合作伙伴”(Japan Industrial Partners,简称JIP)牵头的财团提出的收购要约,这笔交易...
日期:03-24
港股新东方在线股价重回20港元上方_新东方港股跌了多少
vivo Exynos 1080小米mixfold对比华为x2恒大汽车更名中国奢侈品零售 查看最新行情 倒卖消费券电商钓鱼单现在还有家电以旧换新活动吗   讯 7月28日上午...
日期:07-31
华为30岁以下员工仅28%,35岁并非职场天花板_华为不要35岁以上的员工
  ■;观察家  把35岁作为职业发展顶点来规划职场发展,是不少年轻人的一种错误认知。  近日,华为发布《2021可持续发展报告》显示,华为的19.5万名员工中,30岁至50岁占比多...
日期:09-08
超级高铁埃隆马斯克「马斯克超级高铁概念公司破产 被称为美国高铁红极一时」
据知情人士透露,由于无法利用超级高铁(Hyperloop)技术改造交通运输系统,超级高铁创业公司Hyperloop One将停止运营。Hyperloop One曾经受到过很多关注,因为它是在埃隆·马斯克(El...
日期:12-22
谷歌计划向印度最高法院上诉:撤销1.6亿美元反垄断罚款_270亿美元罚单! Google垄断案未来数月内出结果
  讯 北京时间1月5日晚间消息,据报道,两位知情人士今日称,谷歌计划在未来数日内向印度最高法院提起上诉,试图推翻印度“竞争委员会”(CCI)之前对谷歌做出的1.6亿美元的反垄断罚...
日期:01-06
专利制霸!华为2022年专利许可收入达到5.6亿美元,研发投资排行第4位
华为在深圳召开的2023创新和知识产权论坛上,华为副总裁兼知识产权部部长樊志勇透露,华为2022年的专利许可收入达到5.6亿美元(约40.15亿元人民币)。他还表示,截至目前,华为已经签署...
日期:07-15
马上消费金融和京东金条_京东金条助力金融再发展,为消费打造更多的支付选择
  突入其来的新冠疫情让大众深刻的意识到了线上购物的方便快捷,网上买菜、网上看病、网上买药、网上点餐、网上购物逐渐增加了消费者对线上购物的依赖。如今各大网购平台...
日期:07-15
oppo k1多少像素「2000档最强影像手机!OPPO K11关键参数敲定:骁龙782G加持」
快科技7月18日消息,OPPO K11获得入网许可,该机将于7月25日登场。据悉,OPPO K11主打影像,是2000档位影像表现最好的手机。官方介绍,OPPO K11继承OPPO旗舰影像能力,就是要为5亿大众...
日期:07-18
Zoom裁员1300人:创始人放弃奖金 公司市值已蒸发超千亿美元_zoom市值蒸发58亿
雷递网 乐天2月8日视频会议应用开发商Zoom Video日前宣布裁员1300名员工,约占全球员工总数的15%。Zoom创始人、CEO袁征日前表示,公司人数在疫情期间增长过快,现在需要调整以适...
日期:02-09
抖音回应去年电商交易总额达1.41万亿元:不实消息_抖音电商销售额超过京东
1 月 10 日讯:据澎湃新闻报道,针对“抖音去年电商交易总额达1. 41 万亿元”的报道,抖音电商相关负责人表示,此为不实消息。能源智慧转型华为wlink平台...
日期:01-10
2022年华为mate60pro「华为Mate 60酷安热度第一:iPhone 15黯然失色」
快科技7月28日消息,华为Mate 60登顶酷安热度榜第一名,力压三星万元旗舰Galaxy S23 Ultra和苹果iPhone 15。随着发布时间的临近,华为Mate 60系列热度越来越高,相关细节陆续揭秘。...
日期:07-29
语音微博解救单身大行动(语音微博解救单身大行动是什么)
     每当节日来临的时候总是别样的不开心!没有人陪着过节啊有木有!单身久了就喜欢呆沙发上发呆啊,就喜欢一个人宅家里听歌看电视啊。传说单身久了,就习惯单身了!这样下...
日期:07-24
要卖的得赶快出手了!苹果发布iOS 17后iPhone 8/X机型将贬值40%以上「17年苹果8手机价格」
苹果上周发布了 iOS 17 开发者预览版 Beta 1 更新,不过三款机型 – iPhone 8,iPhone 8 Plus 和 iPhone X并未获得升级。据二手回收商 SellCell 公布的最新报告显示:iPhone 6S和...
日期:06-15
台风天火车停半路 为何停水停电停厕所?官方解答来了「台风天火车会不会停运」
快科技8月16日消息,想必很多人都曾经疑惑过,刮台风,火车停半路上,怎么还停水停电停厕所呢?”对此,中国铁路官微给出了官方的解答,终于揭秘了。据介绍,大家平时在列车上使用的水,是在...
日期:08-16
男子背140斤冰柜峨眉山顶卖水 网友感慨:6块一瓶真不贵「峨眉山冻死人」
众所周知,景区没有索道的山顶,售卖的食物和水都要人工背上来。而下面这位大树,直接背着冰柜上山,也让不少网友直呼震撼、动容。网友上传的视频显示,8月11日,四川乐山,一位大叔背着1...
日期:08-11
中兴通讯:向算力公司转型,做数字经济的筑路者_中兴通讯潜力如何
通信世界网消息(CWW)数字经济正成为当下稳增长促转型的重要引擎,据国家互联网信息办公室近期发布的《数字中国发展报告(2022年)》,2022年我国数字经济规模达50.2万亿元,占GDP比重...
日期:09-13
网购业现状:大多在苦苦挣扎盈利只是少数_网购的兴起
  近两年来,第五大道、唯品会、走秀网、魅力惠、佳品网、尚品网、聚尚网……这些电商市场细分出来的奢侈品折扣网站纷纷崛起,在一线城市已呈白热化。短时间内,谁能“圈”走...
日期:07-30
信通院栗蔚:聚焦开源合规痛点,推动我国开源生态健康发展_栗蔚 简历
2023/5/30 14:53 信通院栗蔚:聚焦开源合规痛点,推动我国开源生态健康发展  水易 ...
日期:06-03
谷歌聊天机器人遇难题:运行成本是正常搜索10倍 一年增加几十亿
谷歌最近推出了智能聊天机器人Bard,准备死磕竞争对手ChatGPT,不过Bard的表现并不理想,还使公司背负高昂的运营成本。最近,谷歌母公司Alphabet的董事长约翰亨尼斯在采访中表示,大...
日期:02-25
iPhone 16 Pro或将搭载骁龙X75基带_pro16cpu
10月13日 消息:海通国际证券技术分析师Jeff Pu透露,苹果公司的下一代iPhone16Pro和iPhone16Pro Max将配备高通公司最新的骁龙X75基带,此举将使其提供更快更省电的5G网络连接。...
日期:10-13