您的位置:首页 > 互联网

文本和图片之后,AIGC的下个前沿将是视频生成「先文本后图像」

发布时间:2023-03-24 07:22:35  来源:互联网     背景:

3月21日消息,生成式人工智能(AIGC)在文本和图片生成方面已经取得了显著进展。几个月来,Dall-E、ChatGPT以及Stable Diffusion等服务创作了各种各样的文字和图片内容。现在,初创公司Runway AI正进入AIGC的下一个前沿领域——AI生成视频。

当地时间周一,总部位于纽约的Runway宣布推出名为Gen 2的系统,该系统可以根据少量用户提示生成简短视频。用户可以输入他们想要看到的视频描述,例如“一只猫行走在雨中”,Runway的系统将据此生成大约3秒钟的视频片段。此外,用户也可以上传图片作为系统参考或提示。

Runway是专注于制作AI电影和剪辑工具的公司,该公司宣布,现在并非所有人都能体验Gen 2,但用户可以提交申请。人们可以在Discord频道上注册并等待,该公司计划每周都增加更多测试用户。

不过,这次有限的发布代表了实验室外文本转视频生成的最成功案例。谷歌和Meta去年都展示了他们自己的文本转视频努力,利用AI生成了泰迪熊洗碗和在湖上泛舟等视频,但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。

自2018年以来,Runway始终致力于研发AI工具,并于去年年底筹集了5000万美元资金。这家初创公司帮助创建了原始版本的Stable Diffusion,这是一种文本转图像AI模型,自推出以后大受欢迎,并由Stability AI公司进一步开发。

Runway联合创始人兼首席执行官克里斯·瓦伦苏拉(Cris Valenzuela)上周对Gen 2进行了现场演示,比如生成“无人机拍摄的沙漠景观”。在几分钟内,Gen 2生成了只有几秒钟长的视频,尽管画面显得有点扭曲,但不可否认的是,视频非常像是无人机在沙漠上拍摄的片段。地平线上可以看到蓝天和白云,视频画面右下角的太阳刚刚升起(也可能是落下),其光线突出了下面的棕色沙丘。

iphone 14plus首发时间

Gen 2还根据提示生成了其他几个视频:一段眼球的特写视频看起来很清晰,非常像人类眼睛;但一段徒步旅行者穿过丛林的视频显示,它在生成逼真的腿部和行走动作方面可能仍然存在问题。瓦伦苏拉说,这个模型还没有完全“弄清楚”如何准确地描述物体的运动。

文本与图像

虽然更长的提示可能会帮助生成更详细的图像,比如Dall-E或Stable Diffusion,但瓦伦苏拉说,Gen 2越简单越好。他认为Gen 2为艺术家、设计师和电影制作人提供了新的工具,可以帮助他们完成创作过程,并让这些工具的价格比过去更实惠,也更容易获得。

马桶遇火会不会爆炸

Gen 2建立在Runway现有的、名为Gen 1的AI模型基础之上,Runway于2月份开始在Discord上测试该模型。瓦伦苏拉表示,Gen 1目前拥有数千名用户。这种AI模型要求用户上传一段视频作为输入源,然后利用这段视频(以及文本提示或图片)来生成新的、无声的3秒视频。例如,你可以上传一张猫追逐玩具的照片,并附上文字“可爱的钩编风格”,Gen 1就会生成一段钩编猫追逐玩具的视频。

苹果12没有配备手机充电器和耳机吗?

用Gen 2 AI模型生成的视频也是无声的,但瓦伦苏拉称,该公司正在研究音频生成技术,希望最终能创造出一种既能产生图像又能产生声音的系统。

apple watch估价

Gen 2的首次亮相表明,初创公司在AIGC领域取得的进展非常快。AIGC可以吸收用户输入并生成文本或图像等新内容,其中Stable Diffusion、Open的图像生成模型Dall-E和聊天机器人ChatGPT等系统,近几个月来已经公开发布并受到欢迎。

但与此同时,它们的扩散也引发了法律和伦理方面的担忧。数字取证专家、加州大学伯克利分校教授哈尼·法里德(Hany Farid)看了几段由Gen 2生成的视频,称它们看起来“非常酷”,但他补充说,用这种技术制作的视频迟早将被滥用。他断言:“有些人会试图用这种技术做坏事。”

Runway正在使用AI和人类控制相结合的方式来防止用户使用Gen 2生成包含色情、暴力内容或侵犯版权的视频,但这种方法并非总是有效。

与AI行业的其他领域一样,文本转视频技术正在快速发展。虽然Gen 2目前的图像质量看起来有点模糊、不太稳定,很容易让人发现破绽,但瓦伦苏拉预计它会很快改善。他说:“这套系统还处于早期阶段。随着时间的推移,它会变得越来越好。”(小小)


返回网站首页

本文评论
华为张宇昕:5G创新,华为云助力互联网产业协同共进(华为云技术创新部)
  6月17日,以“智能互联,创领未来”为主题的2020互联网5G创新峰会,于广东华为松山湖欧洲小镇正式召开。会上,华为云与诸多伙伴共同探讨了5G时代的互联网发展现状,并发布了三大...
日期:07-14
吉利帝豪 L 雷神 Hi-X 发布(吉利汽车帝豪系列)
  吉利帝豪 L 雷神 Hi・X 今日正式亮相,这是吉利第二款混动车型,也是吉利搭载 1.5TD-3DHT 雷神智擎系统的首款轿车,官方公布其满油情况下最大续航为 1300km,0-100km / h 加速...
日期:07-09
被传“甩了”美团,腾讯真要做“渣男”?(美团小哥泼渣男)
文丨普子胥出品|网易科技《态℃》栏目“神仙打架,小鬼遭殃。”戏谑的评论,出自昨天的一则消息之下:美团股价午后持续走低,跌幅现扩大至10%。此前有市场消息称,腾讯计划出售美团的...
日期:08-19
保时捷车主「12.4万保时捷首单用户发声:已获道歉 可能会买下」
前不久,保时捷官网12.4万元就能买帕纳梅拉的话题引起热议,官方称这是价格输入错误,在链接产生598个预订单后被官方下架。此事起因是银川保时捷中心在微信小程序商城上架了一台...
日期:02-09
硬核抗疫 擎朗智能等多家高科技企业齐聚广州
  端午刚过,一片粽香中,广州却仍在疫情的阴影之下,自5月21日广州疫情发生以来,病例数已超百例。而应用现代科技手段防疫抗疫、解决人们的实际需要,也成为众多科技创新企业关注...
日期:04-24
淘宝直播9月开展20万场村播 带动400万订单量「淘宝直播商家数量」
9月28日消息,由阿里公益和淘宝直播共同主办的为期一周的阿里巴巴“热土丰收节”公益直播盛典近日落下帷幕,超过1万名乡村主播参与此次活动,他们让汶川的西梅、大荔的冬枣、周至...
日期:09-29
网易云音乐有车载版嘛「网易云音乐会员不再支持车机版 车上听歌要加钱」
近日,有网易云音乐会员吐槽,软件不再支持车机版权益,听歌需升级会员,连续包月多花13元。对此,客服回应:此举系业务发展需要,用户若不升级也可以连接蓝牙正常放歌。笔者查阅发现,网易...
日期:03-15
nand闪存上市公司_研究机构预计全球 NAND 闪存销售额今年增至 560 亿美元,同比大增 27%
  8 月 4 日消息,据国外媒体报道,研究机构预计,销售额在去年大幅下滑的 NAND 闪存,在今年将大幅增长,同比增长率将达到 27.2%,销售额将达到 560.07 亿美元。   从研究机构的...
日期:07-15
开学装备升级换代 学生平板电脑成黑马_学生平板换系统
  元宵节已过,各中小学的学子们陆续告别寒假生活,重新迈进校园。各路商家当然不会错过这个时机,推出款式新颖、功能齐全的学习用品,“开学经济”异常红火。记者从各大电器卖...
日期:07-26
Nreal达成10万台AR眼镜量产 四季度出货量超7万台
中关村在线消息:今日,Nreal第10万台AR眼镜下线,是全球首个消费级AR硬件突破10万台量产.2022年,伴随着中国、日本、美国市场的发售,Nreal的出货量在第四季度超过7万台,预示消费级AR...
日期:12-30
哈啰出行回应公司更名为哈啰普惠:该主体相应业务未做调整「哈啰出行所属公司」
10 月 14 日讯:针对“哈啰出行公司更名为哈啰普惠”一事,哈啰出行方面回应称,该主体相应业务未做调整,相关业务均在稳步推进。redmi路由器ax6组网iPhone14挖孔屏谷歌研发人员索...
日期:10-17
中科院路航:隐私计算时代即将带来,需要全同态加密处理器
  讯 12月16日下午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕。中科院计算所副教授、硕士生导师路航发言指出,人和计算系统的关系正在不断...
日期:12-16
快手发视频违规行为有哪些「快手打击违规健康科普内容 共处置相关视频超26万个」
10 月 9 日消息,日前,快手发布关于打击违规健康科普内容的处罚公告(第八期),公告称为营造积极、健康、正能量的社区环境,向用户传递科学严谨、真实可信的健康科普内容,快手平台持续...
日期:10-16
老人墓中藏13万现金全部霉变 专业能手全力抢救:官方科普纸钞如何保管
人民币是国家的法定货币,是国家名片。每个公民都有爱护人民币,维护人民币形象的义务。令人可惜的是,九派新闻报道了浙江宁波一位老人,因担心钱被偷,将13万多现金藏于墓中,没想到一...
日期:03-16
治理“大祸车”,心中要有“AI”
  近年来,经过酒驾入刑、限超令等法规的严格限制,交通安全事故在总量上已经形成了连续下降的趋势。但作为事故重灾区,货运领域面对的安全管理压力却越来越大,货运已经成为交...
日期:07-16
mit十大突破技术2020_MIT2021全球十大突破性技术榜单揭晓 作业帮凭“远程技术”入选
  2021年2月24日,《麻省理工科技评论》2021年“全球十大突破性技术”( TR10)在杭州全球同步首发。作为“远程技术”的主要研究者,全球用户规模最大的在线教育公司作业帮...
日期:07-16
酷睿i5游戏本_Intel大手笔:买酷睿i5处理器、免费送4款游戏+2款专业软件
  可能是为了刺激销量,Intel一项名为“Accelerate Your Game”的处理器同捆活动日前曝光。   活动显示,在9月30日前购买9代酷睿i5及以上级别处理器,将免费获赠大量软件产...
日期:04-19
apple music都有版权吗_苹果云音乐服务面临音乐出版商版权障碍
新浪科技讯 北京时间5月21日凌晨消息,苹果已经与3家大型唱片公司达成协议,后者将授权一项新的云音乐服务。此外,苹果还正在与全球最大唱片公司环球音乐集团进行相关谈判。 但...
日期:07-28
电子签约普及再提速,国务院加快电子印章统一认定使用(推进电子印章)
  政企数字化改革是近年来的热门议题。近期,国务院发布政策文件,各地政府部门先后跟进,推动电子印章、电子证照、电子劳动合同加速普及。   国务院加快电子印章统一认定使...
日期:07-17
新氧科技第二季度营收3.09亿元 同比下滑31.6%「新氧科技市值」
  讯 北京时间8月16日晚间消息,医美O2O平台新氧科技(Nasdaq: SY)今日发布了截至6月30日的2022年第二季度财报。财报显示,新氧科技第二季度总营收为3.091亿元(约合4610万美元),与...
日期:09-26