您的位置:首页 > 互联网

Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开

发布时间:2023-12-10 11:09:51  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子,授权转载发布。

Pika1.0正式上线后,拿到内测资格的网友们已经玩疯了!

有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。

以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika1.0,实在是太给人惊喜了!

更令人震惊的是,作者表示,这是100%用文本到视频生成的。

还记得半个月前,这家有斯坦福AI Lab博士创办的初创公司Pika,发布的第一个产品瞬间成为顶流。

不仅能够生成3D动画、动漫、卡通和电影,甚至可以实现风格转换、幕布扩展等重磅能力。

如今,许多网友到手体验后,纷纷觉得太哇塞了。

与此同时,Pika官方账号公布了自家的最新研究。这是Pika1.0发布产品以来,这家公司首次对外披露技术细节。

最新研究中,提出了一种DreamPropeller方法,能够将文本到3D的生成速度提升4.7倍。

网友实测,皆为经典

接下来,先来一起看看,广大网友们的创意。

比起Runway的Gen-2,Pika1.0在让人物动起来时的一致性非常稳定。

电影级效果,堪称动漫界的宫崎骏

Pika1.0非常擅长动漫风格的动物,看看这些不同场景中的老鹰就知道了。

看得出,宫崎骏画风非常浓郁。

还有这种漫威风格的小人模型,让他们动起来真的像是复仇者联盟。‍

还有形单影只的白天鹅,在波光粼粼的湖中嬉戏,再游到岸边,好像在找回家的路。

就连美版机器人总动员动画的科幻风,呈现的也是淋漓尽致。

一朵含苞待放的花朵。‍

如下这个例子是Pika自己做的丛林中兔子士兵的电影级效果,并给出了提示(拿到内测资格的网友可试)

1. Cinematic, extreme close-up of a bunny soldier in a jungle,3D rendering

2. Cinematic, back-view long shot of a bunny soldier exploring a giant carrot in the jungle,3D rendering‍

疯狂动物城、狮子王、熊大熊二混版动画。

网友做了一个电影预告片,就连名字都想好了金刚哥斯拉:新帝国。

爱因斯坦和他的实验。

真人变身,泰坦尼克号被恶搞

还有一位自称AI级导演做出的真人演示效果,简直绝绝子。

戴上帽子,穿上羽绒服,服饰的搭配与人的身体契合度,毫无违和感。

还可以把周边的物体变成松柏,还能把自己变成北极熊,简直可爱到爆。

还有泰坦尼克号重制版,女主Rose直接变成熊猫,和男主Jack在一起牵手的画风,你细品...

‍‍再来看个真人变身的效果,还有二次元小姐姐。

AI魔法棒,一键替换

用AI修改区域,能够把所有背景,甚至包括主体的衣服能够换成一致的圣诞的风格。

还有网友尝试了这一替换功能,把海边的啤酒,瞬间变成了可乐。

具体实现效果,Chase Lean给出了一个教程,只需要3步过程。

首先需要生成一个视频,先让Midjourney生成一张海边Corona啤酒的图片,然后将其做成视频。

第二步:单击编辑,然后单击修改区域。

第三步,告诉Pika你想用什么来代替它,比如可口可乐。

画布扩展,超凡脑洞

图像画布扩展能力,其实我们也见到了许多像MidjourneyAI图像生成工具已经实现了。

而Pika1.0不仅能开出脑洞,还能让画面动起来。

就看这雅典帕特农神庙,外画出的景色更加凸显这座建筑的壮观。

还有橄榄树、游览古建筑都能暗藏各种惊喜。

你可以录一段视频,Pika能够直接想象出背景。

下面这个网友使用文本提示创建了第一个视频,然后扩展画布几次,获得了第二个视频。

初始提示是:A beautiful princess, standing on the castle wall,3d animation

还有网友做出了,演唱会级的音乐视频,不过不得不承认,还有些不足的地方。

,时长01:28

Pika1.0背后技术

看到这么多惊艳的效果,或许许多人更想了解一些关于Pika1.0生成的技术细节。

这不,官方刚刚公布了一篇论文,是由斯坦福大学和Pika Labs联手共创。

以往,通过分数蒸馏,比如DreamFusion、ProlificDreamer等模型,进行文本到3D的生成质量虽高,但运行时间可能长达10个小时。

最新论文中,研究人员提出了一种基于分数蒸馏的加速方法——DreamPropeller,能够将现有方法的速度提高4.7倍。

论文地址:https://arxiv.org/pdf/2311.17082.pdf

DreamPropeller整体架构如下图所示。

天津几家苹果直营店

在每次迭代(k次)的开始,初始化一个由3D形状(用绿色表示)组成的窗口,然后,这些形状被分发到p个GPU上进行并行计算,在GPU上并行计算形状的SDS/VSD梯度。

然后根据公式 (九) 中的规则收集这些梯度,并使用这些梯度对形状进行更新。

窗口向前滑动,直到该时间步的误差不小于阈值e,阈值e根据窗口的平均/中值误差进行自适应更新。

另外,在VSD的情况下,研究人员会在所有GPU上保留LoRA扩散的独立副本,这些副本会独立更新,无需额外通信。

如下是应用DreamPropeller的代表性示例。

最新框架以并行计算换取速度,在保持生成质量的前提下,应用于DreamGaussian和ProlificDreamer时,速度提高了4倍以上。

在DreamPropeller完成时,基线版本的外观和几何效果明显较差。

如下是与其他模型的可视化比较。使用DreamPropeller的方法能以更短的运行时间实现同样高质量的生成。

对DreamFusion图库中的30个提示进行量化评估。运行时间以秒为单位。最新研究的方法达到了具有竞争力的质量,同时速度提高了4倍以上。

下一个视频生成顶流

对于Pika1.0的诞生,让全网热血沸腾,而它或许成为下一个视频生成的顶流。

有人统计了Discord上最大的人工智能产品,以及它们在平台范围内的规模。

如下是按邀请页面流量排序的十大人工智能应用程序,Midjourney位列第一,Pika排在第二。

在排名前十的应用程序中,有4个是图片生成应用程序,3个是语音/歌曲生成应用程序,2个是视频生成应用程序。

按流量计算,图片占了前10名流量的74%,其次是视频8%,语音/音乐6%。


返回网站首页

本文评论
湖北移动荣获工信部“各场景移动网络质量卓越运营商奖”等多项奖项
通信世界网消息(CWW)近日,在第二届移动网络高质量发展论坛上,工信部发布了2022年全国重点场所移动网络质量评测结果,湖北移动喜获“各场景移动网络质量卓越运营商”称号。湖北移...
日期:06-10
iOS 17.2第二个测试版发布 iPhone15 Pro支持录制空间视频_苹果15.1系统录屏在哪里
苹果在11月10日向 iPhone 和 iPad 用户发布了 iOS / iPadOS17.2开发者测试版 Beta2版本。苹果 iOS / iPadOS17.2Beta2版本主要新增了一项功能,让 iPhone15Pro 和 iPhone15Pro...
日期:11-10
研究使用AI成像技术筛查狗狗皮下和皮下肿块_狗狗皮下肿瘤症状
恒大汽车正式发布恒驰车苹果13价格暴跌京东自营代理入驻腾讯理财 基金...
日期:11-01
eBay第四季净利5.59亿美元同比下滑59%_ebay近年来业绩
  eBay今天发布了2010财年第四季度及全年财报。   报告显示,eBay第四季度净营收为24.95亿美元,同比增长5%;净利润为5.59亿美元,同比下滑59%。 荣耀magic x折叠屏手机苏宁易...
日期:07-26
英诺天使基金合伙人王晟:风投“船票之战”剑指大模型「英诺天使基金联系电话」
作者|闫妍出品|网易科技《潮头》栏目中国VC圈正经历着久违的兴奋与焦虑。ChatGPT的出圈,让AIGC概念“一夜爆红”,人们兴奋于人工智能应用从烧钱到赚钱的历史转机,中国创投圈时隔...
日期:03-14
迈入2亿像素时代!小米12T官宣10月4日发布_小米11的一亿像素
前段时间,小米发布了Redmi K50系列的“宇宙终极大作”Redmi K50至尊版。而在近日,小米又官宣了将于10月4日举行全球发布会,带来小米12T、小米12T Pro至少两款新品。小米12T系列...
日期:10-01
第三方软件摆乌龙 律师:撤销交易属合法
  ■新快报记者 张潇  是否遭黑客攻击尚在调查中,买家卖家均获补偿  9月1日,淘宝网上出现了大量标价为1元或1折的产品,引发抢购热潮。随后,淘宝方面发布价格异常公告,称...
日期:07-22
微软Edge集成AI设计工具Designer 从侧边栏即可访问「edge icon」
本文概要:1. 微软的人工智能设计工具Microsoft Designer现已在Edge浏览器中广泛上线,用户可以通过浏览器侧边栏访问。2. 通过该集成,用户可以便捷地在Edge中创建各类设计作品,...
日期:08-23
开源社区github「OurBMC开源社区正式成立!」
7 月 12 日,OurBMC 社区成立大会暨理事会第 一次会议在北京成功举行,中国首 个 BMC 根社区—— OurBMC 社区正式成立。BMC 是嵌入在计算机主板上的专用微控制器,以其多功能、易...
日期:07-14
2月28日京东电脑数码“女神节”万千佳品邀你来扮靓!白条最高24期免息!
  在颜值即是正义的年代,有品位才是懂得生活的体现。眼看着春天就要来临,作为“颜值控”的你,除了妆容要够靓,高颜值装备更是必不可少!3月3日,京东电脑数码颜值季闪亮来袭,活动...
日期:08-18
中国移动高同庆:开拓频谱创新空间,激发移动信息潜能「高同庆升任中国移动总裁」
通信世界网消息(CWW)9月14至15日,2023中国无线电大会在山东青岛召开,中国移动副总经理高同庆出席论坛并在大会主论坛作题为“开拓频谱创新空间,激发移动信息潜能”的主旨演讲。高...
日期:09-14
xbox series s价格什么时候稳定「微软:目前Xbox Series X/S游戏机机无涨价计划」
IT之家 8 月 26 日消息,索尼已宣布在全球范围内提高其 PlayStation 5 游戏机价格,其中国行涨价 400 元 —— 但美国地区除外。在欧洲,该游戏机价格大幅上涨 50 欧元(约 341.5 元...
日期:09-27
苹果将在法国临时关闭...「电磁辐射超标,法国要求iPhone12手机暂停销售」
法国国家频率管理局12日发布公告称,检测结果显示苹果iPhone12手机的电磁波辐射值超出欧盟标准,已要求苹果公司自当日起从法国市场暂时下架这款手机。新华社资料图公告称,法国国...
日期:09-15
国家电投智慧能源携手腾讯云,共同促进能源智慧化、绿色化发展
(原标题:国家电投智慧能源携手腾讯云,共同促进能源智慧化、绿色化发展) 9月22日,在国家电投“天枢一号”系列产品发布会上,腾讯云...
日期:09-25
比Model 3便宜一半!特斯拉廉价新车太强了:2024年夏季量产「特斯拉新车2022」
快科技6月9日讯,新能源汽车的赛道显然越发拥挤,作为第一集团领跑者的特斯拉,除了继续深挖辅助驾驶和降本方面优势,也在筹备新车型。此前,特斯拉已经公布了搭配53kWh电池组、比Mod...
日期:06-10
小学生边输液边写作业「央视网:边输液边做题 理解但不支持 家长过度焦虑了」
近日,一张孩子们在医院边输液边做作业的照片引发社会热议。这一现象反映了社会对教育和学业的过度重视,以及医疗资源的匮乏。央视网对此表示理解但不支持,强调了对学业和医疗资...
日期:11-24
民营经济再遇通信业历史机遇  虚拟运营商或将“扩军”_虚拟运营商牌照的民营企业名单
通信世界网消息(CWW)当提到民营经济与通信业结合的成功案例,大家第一时间想到的就是虚拟运营商。的确,作为国家鼓励和引导民间资本进入电信行业的“破冰”试点,虚拟运营商十年来...
日期:10-24
OPPO K11正式发布:首销价1799元起 配备索尼IMX890主摄「opp0k11参数」
7月25日 消息:今日下午,OPPO K11手机正式发布,旨在为用户提供卓越的影像和流畅的性能体验。OPPO K11手机的主摄像头采用了索尼IMX890传感器和OIS光学防抖技术,前置1600万,后置50...
日期:07-25
中国移动引领5g「中国移动发布5G-Advanced双链融合产业创新示范基地」
通信世界网消息(CWW)9月15日,在中国2023无线电大会“5G与下一代移动通信技术发展”论坛上,中国移动正式发布“5G-Advanced双链融合产业创新示范基地”,并举行示范基地授牌仪式。...
日期:09-15
微软称两个新的Exchange零日漏洞已受到主动攻击 但没有立即修复_Microsoft Exchange漏洞
微软已经证实,两个未打补丁的Exchange服务器零日漏洞正被网络犯罪分子在现实世界攻击中利用。越南网络安全公司GTSC在2022年8月首次发现了这些缺陷,是其对客户网络安全事件的...
日期:10-01