您的位置:首页 > 互联网

AI刘强东007带货,背后大模型也就10亿参数,京东:我家数字人平均水平

发布时间:2024-04-25 14:28:10  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:衡宇 ,授权转载发布。

京东创始人刘强东啊,他昨天又加班了。

准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。

这次东哥干的是图书采销工作。

与上两次直播不同,这一回直播间不仅有了数字人助理,还有多机位切换等展现方式。与此同时,和留言区及屏幕前观众的互动方式也有所增强。

量子位就此事询问了京东云言犀算法总监,得到答案是:

每一场想侧重表示的不一样。技术的手段比较丰富,很难一场里面都推出来。

不得不说,京东这回拿自家的京东云言犀数字人挤牙膏,还挺有自己的节奏(doge)。

一周时间里,四场刘强东数字人连播,可谓出师大捷——

据公开的“战报”,其首秀不到1小时,直播间观看量超2000万,带货GMV超5000万。

难怪网上冲浪的时候,有人评价道,AI东哥真的是“数字人带货的天花板”了。

而且京东自己放话,这就是京东云言犀数字人的平均技术水平,且成本不到真人直播的1/10。

“自己的狗粮自己先吃”

刘强东AI数字人“采销东哥”上播第一天起,就有许多质疑。

质疑一,真的是数字人吗?真的不是让刘强东提前坐那儿,录好视频然后再播吗?

且看采销东哥的表现:

形象和真人刘强东几乎一毛一样,寸头、西装、左手腕带表,肉眼难辨真伪。

ipad10怎么升级到11

口音能较好贴合唇部动作,语速快、连音多,一般语句吐字较轻,一些重点会重音表强调,寻求认同时用“啊”来衔接;耳朵尖的朋友可能还能听出他的宿迁口音。

动作姿态不算僵硬,能有头部、手部的动态动作,且动起来后整个人也受光均匀。

但随着直播场数的增加,这种疑惑声渐渐下去了。

可能大家都觉得,是在没什么可能让刘强东忙中拨冗,每天坐在那儿提前录播吧。

质疑二,如果真的是数字人刘强东,那大伙儿看到的效果,会不会是面对自家一号位做的“特供版”?

换言之,其他公司如果同样想用京东云言犀数字人来做主播,是不是根本达不到这个效果?

就这个问题,京东云言犀负责人是站出来给了解释的:“刘总数字人技术,代表了我们现在的通用技术。”

大白话就是说,用了京东云言犀数字人,所有的大V/CEO主播都能有同样的这个效果,至少在120秒之内“惟妙惟肖”。

如果不信,可以亲自验证——前段时间京东618招商,给所有品牌商家免费开放了数字人基础版使用30天权益,都能用上。

京东云言犀负责人笑着表示,去年京东云就已经基于言犀大模型升级了数字人技术。

用句软件公司的梗,“Eat your own dog food”,自己的狗粮自己先吃,最开始团队内部先给京东云言犀负责人做了个AI数字人出来,但回头看和现在刘强东的数字人没法比。

2022年开始,京东云言犀数字人就已经开始商业化,目前有4000多家品牌使用。

去年双十一后,京东云言犀团队开始制作采销AI数字人,首先是在大时尚事业部测试,包括公众接受程度,停留时长,用户转换率,交互程度等。

团队心想,既然要追求刺激,那就把“Eat your own dog food”贯彻到底,干脆给公司老大也搞一个吧!

刘强东AI数字人“采销东哥”就这么诞生了。

10亿参数数字人大模型轻量上阵

采销东哥身后,是京东云言犀大模型团队,及其大模型做小后打造的10亿参数数字人大模型。

总的技术来看,言犀2年多前就选择了端到端的方式,即建模——驱动——渲染的一体化。以至于Sora出来后,团队惊喜发现端到端的技术方向是可取、可喜的。

不过,虽然和Sora是同一条路子,但最后应用的场景不太一样,言犀大模型数字人的赛道更聚焦,专注人物生成(原因是团队评估人物视频生成商业价值和社会影响力可能都更大)。

而关于端到端的路线,这里展开说两句。

现在基本分为两大类,一类是完全端到端,中间不对任何环节进行显示的建模,完全是隐性的,都在一个空间里面做;另一类是对简单基本素材的人脸建3万多个点Mesh模型,再去控制人物的表情、唇型,然后做纹理的渲染。

京东云言犀说得很明白,2种方案会根据场景需求做不同使用。

京东云言犀负责人表示,其间比较得意的是人物大姿态的动作。

“早期真人数字人,动作幅度比较小。基本上脸部不会怎么动,因为一旦头动了,可能就剩半个嘴唇了。”他透露,在大姿态方面做了较多技术投入,才有了现在AI刘强东的活动自如。

此外,身为主播,语音表达无疑也十分重要。

既要复现真人主播的语音、语调,又要学习真人说话的习惯,如语速、语调、重音、倒吸气。

特斯拉股价突破2000美元

就拿刘强东本人来说,他讲话很少有辅助词,也较少清晰读出连接词,如“跟着”的“着”字经常被一笔带过。

因为出生江苏宿迁,他的话语里还是会“露馅”,冒出宿迁口音来。比如“时间”中的“sh”会有更重的鼻音;后鼻音有时会被吞掉,变成前鼻音。

就,还挺有特色的。

原本呢,京东云言犀技术团队的计划是用刘强东2017年的一段演讲音频作学习素材,但测试发现,演讲时刘强东的语气太过正式了,和直播带货有点画风不搭。

团队无奈把刘强东“抓”到镜头前,录了30分钟的音视频,让他闲聊自己的经历什么的。

rtx40显存

用这段音频为底提取出声学特征,就能通过已经被喂了5万小时语音数据训练的言犀语音大模型合成出人工语音。

不过据量子位了解,京东云言犀大模型团队的最新战绩,是使用6秒素材复现具体某个人的声音。

团队成员还分享了其他一些关于AI数字人背后的事:

训练过程中,主赛道锚定人物向,因此不管是从数据的采集、清洗和各方面都做了精细化聚焦。

推理实现方面,除了模型代码压缩、量化等常规操作,还对INT4和INT8进行了精度调改。

团队下一步计划,是把语音、视频生成两块综合到一起。

当然,另一部分挑战是尝试用非常小样本或零样本学习的方式就能抓住真人本尊的特点,继而生成惟妙惟肖的数字人。

“采销东哥是京东数字人平均水平”

京东云言犀负责人表示,其实京东内部对数字人有一个分级。

第一级的数字人效果,可以做真人的补充工作,处于向真人看齐阶段。

第二级数字人可以媲美真人,真人不在,也可以承担重要场合、重要时间的主播工作。

并且播出后,会有人分不清主播是真是假——从这个角度来说,图灵测试应该算是通过了。

不过,虽然在形象、表情、语音、动作复刻尚佳,但是本尊的深度思想,大模型数字人还没有办法1:1同步。

到了第三阶段,本尊和数字人之间不是替代关系,更像是真人有了个数字分身,能够真正深度抓住本尊的思想、文化、知识背景、一些理念。

b站fgo主播有哪些

而且,京东自家直播间有一个120s战斗。

简单说就是直播时,如果用户在120s之内都不觉得眼前的数字人让自己别扭,就会跨过恐怖谷效应,接受这个数字人,看他的展示、听他的解说。

而且看到120s,因为对主播产生了信任,往往很大概率会下单。

“目前来看,数字人直播带货有很大机会会成为一个大的爆点。”京东云言犀负责人解释道,“主要是内容层次达到了新的水准,大家的接受度和信任度已经过了关键点了。”

说回“采销东哥”,他现在几乎能很完美地被生成120s以上的形象,并且足以以假乱真。

也就是说,“采销东哥”现在处于京东数字人分级里的第二阶段,这也是京东云言犀数字人的平均水平。

团队还提到,其实目前AI大模型数字人大规模商用,技术已经不是难点了。

难点是什么呢?是主播个人的形象要跟整体调性相匹配,在选品、互动方面还需要下很多功夫。

One More Thing

聊着聊着,一个有趣的问题被抛出来。

问,未来在京东直播间,有没有可能诞生一个类似于董宇辉的AI数字人超级主播?

京东云言犀负责人和算法总监相视一笑,说:

(这件事)技术上是有可能的,但在伦理和感情上不一定能成立。

比如很多丈母娘喜欢董宇辉,是因为这个人有很实在的特质,很文雅,有知识。

我不知道在伦理上到底之后会怎么解决……

—联系作者—


返回网站首页

本文评论
三星galaxy s24ultraai技术AI激活想象力 三星Galaxy S24系列引领手机AI时代 Galaxy
来源:中关村在线生成式AI技术不断带来突破想象力的AI应用,让很多用户都十分期待AI的创新成果能够尽快在智能手机上实现落地。近日,三星正式推出了Galaxy S24系列旗舰新机,不仅实...
日期:01-23
百度发布超导量子计算机“乾始”、量子软硬一体解决方案“量羲”_网易科技
8月25日消息,今日,百度发布超导量子计算机“干始”,以及量子软硬一体解决方案“量羲”。据悉,“量羲”集量子硬件、量子软件、量子应用于一体,提供移动端、PC端、云端等在内的全...
日期:08-25
正面硬刚骁龙!天玑9300规格出炉:史无前例的全大核架构_天玑900处理器相当于骁龙的多少处理器
快科技6月7日消息,联发科此前已经透露,天玑9300将会在年底正式发布,这一代将会是史无前例的大迭代。尤其是在架构上,天玑9300将采用4 4的全大核架构,舍弃了以往的能效小核心,让性...
日期:06-07
蔚来获阿布扎比主权基金11亿美元投资,李斌:就谈了三周「阿布扎比未来能源公司」
6月20日消息,蔚来创始人、董事长、CEO李斌宣布,蔚来今天已与阿联酋阿布扎比政府旗下投资机构CYVN Holdings签订股份认购协议。CYVN将通过定向增发和老股转让的方式向蔚来进行...
日期:06-20
滴滴出行补贴「滴滴派发补偿券 网友:无法领取 官方这样回应」
11月29日,滴滴就先前发生的系统故障向所有用户发放10元打车立减券以表达歉意,但一些用户反映未收到。对此,滴滴出行App在线客服回应称:“目前参与人数较多,建议您耐心等待。”三...
日期:11-29
苹果11可以改刘海吗「iPhone 15全系曝光:取消刘海 接口改用Type-C」
iPhone 15全系曝光了,外媒绘制了iPhone 15全系的真机渲染图,从图片中得知,iPhone 15全系取消了刘海屏幕,并且全系标配灵动岛,iPhone 15系列仍然有四款,共有15、15 Plus、15 Pro和1...
日期:10-24
海信E8GminiLED电视评测「如果做出媲美OLED的MiniLED电视!海信电视65U8H评测」
一、前言:集海信最新显示技术于一身的U8H9月20日,海信带来了全新的U8H系列,定位于海信ULED电视的高端旗舰,号称画面素质可以提供媲美OLED电视。而我们也收到了海信电视65U8H,让我...
日期:10-14
单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具
声明:本文来自于微信公众号 量子位 (ID:QbitAI),衡宇 萧箫 发自 凹非寺 ,授权转载发布。ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。正持续进击的Text-to-3...
日期:05-09
iQOO 12首发电竞芯片Q1:率先实现游戏内超分插帧并发_iqoocpu
快科技11月2日消息,iQOO宣布iQOO 12首发搭载自研电竞芯片Q1,率先实现行业内首个游戏内的超分和插帧并发。win 10节能模式据悉,自研电竞芯片Q1针对DAU前500的游戏进行逐个分析,对...
日期:11-03
长安4S卖车女主播被尾翼夹手惊声尖叫 公司回应:突发事件、有点浮夸
快科技6月5日消息,近日,一长安汽车4S店的女主播在直播时被UNI-V尾翼夹手连声尖叫一事引发关注,并引起网友热议。怪兽充电ipo视频中,该女主播的不知怎么右手就被电动尾翼给夹住了...
日期:06-06
华为商务旗舰Mate X3来了:售价或超1.3万 石墨烯散热天花板
最近,有传闻称华为内部或考虑拆分消费者业务、放弃手机业务,华为方面回应,该消息为假消息,并表示仍将加大手机业务的投入,坚持建设高端品,将在本月继续发布最新最强旗舰手机。结合...
日期:03-09
为内容创作者做好产品-携手苹果共同发展 群访贝尔金Chris
来源:中关村在线4月10日下午,贝尔金自动追踪云台新品体验会正式举行,作为拥有苹果官方认证的国际品牌,本次贝尔金带来全球首款苹果DockKit配件“贝尔金自动跟踪&充电云台”,助力...
日期:04-12
iphone15pro概念机「库克来成都了!iPhone 15 Pro Max首摄出炉」
库克晚间抵达成都,并在其微博上分享了使用iPhone 15 Pro Max拍摄的安顺廊桥照片。他还参观了成都的Apple Store,与众多粉丝进行了互动。然而,值得注意的是,根据最新的数据显示,今...
日期:10-17
成本下滑净利润也下滑 阅文原地踏步(成本下降时利润一定是增加的)
来源:北京商报   2017年11月上市的阅文习惯半年发布一次财报,在至今披露的5份半年报中,只有2022年8月15日发布的2022年上半年财报出现了营收同比减少。根据财报,阅文2022年上...
日期:08-17
小米POCO C50新机发布时间曝光:1月3日印度发布
12月28日消息,有外媒曝光了小米新机POCO C50的发布时间:1月3日。此前曾有消息表示这款手机将会于11月在印度发布,但是小米推迟了发布时间。小米POCO C50是小米在印度市场发布的...
日期:12-28
诺基亚直板手机「诺基亚直板手机排行」
作为一家享誉全球的通讯设备品牌,诺基亚一直以来以其高品质和可靠性深得用户的喜爱。其中,便是备受追捧的一类产品。下面,我们来介绍一下的相关信息。首先,具备极高的质量水平。...
日期:05-31
女生应聘被问是否单身 网友:这是招员工还是找女朋友_面试问女生有对象吗
据九派新闻报道,广东东莞的任女士应聘行政岗,HR问任女士是否单身,令其觉得感到奇怪,于是便举报该公司,随后被曝光引发网友热议。对此,老板陈女士称,要求单身无构成骚扰,为了确保招进...
日期:02-09
锐龙7000御用平台 微星4款X670主板开卖:顶配8999元「锐龙7 5800x核显」
AMD昨晚发布了锐龙7000处理器,这一代不仅升级了5nm Zen4架构,还带来了全新的AM5平台及600系芯片组,今晚高端的X670系列也上市了,微星推出了4款X670系列主板,其中最豪华的MEG X670...
日期:09-29
AI FOR ALL 努比亚“三机齐发” 迈向全民AI时代_努比亚n2
通信世界网消息(CWW)AI技术的崛起,成为智能手机迈向更高层次的新拐点。4月9日,努比亚召开“AI FOR ALL”2024春季新品发布会,推出三款不同档位、融合先进AI技术和全新体验的新品...
日期:04-09
护眼效果不错,家长监管更安心!小天才护眼平板试用测评(小天才护眼平板家长端)
  寒假,一个家长痛苦、孩子撒欢的时期,我只要一想到每天回家总能看见孩子在看电视、玩手机就觉得心烦不已。   不仅要担心孩子看电视没有节制,一玩就是一个假期,还要担心他...
日期:09-25