您的位置:首页 > 互联网

腾讯AI实验室联合悉尼大学引入了GPT4Video 提升LLM的视频生成能力

发布时间:2023-12-07 13:41:04  来源:互联网     背景:

要点:

1、GPT4Video是一个统一的多模型框架,使得大型语言模型具备视频理解和生成的能力。

2、GPT4Video提出了一种简单而有效的微调方法,以提高视频生成的安全性。

wifi最大的优势

3、研究团队发布了数据集,以促进未来在多模态LLMs领域的研究。

华硕碉堡S300TA

12月7日 消息:最近在多模态大型语言模型(MLLMs)领域取得了显著进展,但在多模态内容生成方面仍存在明显的空白。为了填补这一空白,腾讯AI实验室和悉尼大学的合作引入了GPT4Video,这是一个统一的多模型框架,使得大型语言模型具备了视频理解和生成的独特能力。

GPT4Video的主要贡献可以总结如下:引入了GPT4Video,这是一个丰富LLMs能力的多功能框架,既可以进行视频理解,又可以进行生成;提出了一种简单而有效的微调方法,旨在提高视频生成的安全性,为常用的RLHF方法提供了一种吸引人的替代方案;发布了数据集,以促进未来在多模态LLMs领域的研究。

GPT4Video是对现有多模态大型语言模型(MLLMs)的局限性的回应,尽管这些模型擅长处理多模态输入,但在生成多模态输出方面存在不足。GPT4Video的架构包括三个重要组件:视频理解模块,利用视频特征提取器和视频摘要器在LLM的词嵌入空间中对视频信息进行编码和对齐。

LLM的基本结构,包括词嵌入器、多头自注意力机制和前馈神经网络,用于处理文本信息;视频生成模块,利用视频特征提取器和视频解码器从LLM的词嵌入空间中生成视频;安全微调方法,通过引入安全性目标和生成器的控制策略,提高视频生成的安全性。

GPT4Video的引入填补了多模态内容生成领域的空白,并且提供了一种统一的多模型框架,使得大型语言模型具备了视频理解和生成的能力。该研究还提出了一种简单而有效的微调方法,并发布了数据集,为未来的多模态LLMs研究提供了便利。


返回网站首页

本文评论
训练其自动驾驶车队 特斯拉已经开始生产Dojo超级计算机
特斯拉表示,已经开始生产其道场(Dojo)超级计算机,以训练其自动驾驶车队。在 2023 年第二季度的财报中,该公司概述了“解决大规模车辆自主性所需的四大技术支柱:极大的真实世界数据...
日期:09-20
华为Mate 40立减2000元 支持5G 提前开启双十一大促
华为Mate 50已经开售了一个多月,实在是太火爆了,到现在依然是一货难求,从现在的市场来看华为Mate 40系列依然值得入手,这也是目前华为旗下为数不多的拥有麒麟芯+5G的配置,同样有...
日期:10-16
红杉中国创始人沈南鹏以每股186.52港元的均价出售美团210万股(红杉资本沈南鹏持股)
为什么余额宝收益越来越多apple music都有版权吗 查看最新行情   据港交所7月27日披露文件,7月25日,红杉中国创始人沈南鹏以每股186.52港元的均价出售美...
日期:07-31
英创力上市了吗「英创力电子IPO被终止:年营收10亿 深创投与红土是股东」
雷递网 雷建平 8月4日报道四川英创力电子科技股份有限公司(简称:“英创力电子”)日前在深交所创业板的IPO被终止。英创力电子曾计划募资4.5亿元,其中,4亿元用于5G 通讯/智能物联...
日期:09-22
iPhone、Mac又升值:苹果以旧换新突然涨价「mac以旧换新划算吗」
为了让更多的苹果用户能够使用最新的设备,苹果中国官网最近对Apple Trade In换购计划进行了调整。在该计划中,折抵换购iPhone、iPad、Mac等产品的金额都有所上涨,可以说是升值...
日期:07-06
4399游戏盒完美体验《地下城与勇士》_4399游戏盒大全试玩
  要说现在最火的格斗游戏,那非《地下城与勇士》(DNF)莫属,游戏画面如图01。这款2D横版格斗网络游戏,很好的结合了“快打旋风”相类似的格斗系统,同时它又是一款网络游戏;对...
日期:07-27
五部门:到2025年我国元宇宙产业综合实力达到世界先进水平
通信世界网消息(CWW)为加速凝聚业界共识,集聚资源推动关键技术创新,构筑协同发展产业生态,形成推动元宇宙产业发展合力,9月8日,工业和信息化部、教育部、文化和旅游部、国务院国资...
日期:09-09
智能炒菜机,妥妥的智商税?「抽油烟机智商税」
声明:本文来自于微信公众号 鞭牛士(ID:bianews8),作者:林小白,授权转载发布。“即使你不会做饭,只要做饭前,选好自己喜欢的菜品,按照机器指示放入食材、调料,盖上锅盖,然后就可以静等...
日期:12-03
b站的视频作品背后有无数优秀的创作者被称为「B站推出49部国创作品新内容,今年国创作品收入预计超20亿」
10月30日消息,10月29日,哔哩哔哩(以下简称“B站”)宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划,拟邀请世界各地优秀的动画创作者,开拓多元的合作模式,丰富《三体...
日期:10-31
卖出的巴黎水装满10个游泳池! 京东11.11海囤全球完美收官
  今年的京东11.11注定不凡,不但有“超级百亿补贴千亿优惠”的重磅福利释出,更是为消费者准备了超强产品扩容。作为主打集结全球正品好物的跨境平台,京东海囤全球集结了全球...
日期:12-07
老板回应拒绝录用有文身员工 认为纹身可能影响整个厂的风气_纹身被拒绝录用法律
最近,一位广东东莞的电子公司老板因为发现待入职员工身上有文身而拒绝录用,引发网友争议。5月18日,这位老板告诉极目新闻记者:“有文身的员工可能会影响整个公司的风气,如果他们...
日期:05-18
华为云亮相第六届数字中国建设峰会 助力政企高效提质、应用创新
4 月 26 日,第六届数字中国建设峰会在福州拉开帷幕,以“加快数字中国建设,推进中国式现代化”为主题,展示数字中国建设最 新成果,分享发展经验。峰会期间,华为联合中国软件行业协...
日期:04-27
淘宝联盟推广者规模增长至2400多万人 双11补贴加码至15亿「淘宝联盟推广点击率」
10月10日 消息:2022淘宝联盟全新战略发布会顺利召开。阿里妈妈淘宝联盟总经理承渊表示,今年双11期间,针对淘宝客资金周有压力、投入效益难把控等经营痛点,淘宝联盟在此次大会上...
日期:10-11
《芭比》登顶2023年度全球票房榜 是中国第一《满江红》的两倍「芭比2021年新电影」
9月4日,据猫眼专业版全球票房数据显示,《芭比》累计票房突破13.81亿美元,超《超级马力欧兄弟大电影》票房成绩,登顶2023年全球票房榜。《芭比》也成为华纳史上全球票房冠军,超越...
日期:09-04
titus风口「风口上的ChatGPT,且看怎么落地?」
声明:本文来自于微信公众号锌刻度(ID:znkedu),作者:陈邓新,授权转载发布。当下,“AI风暴”愈刮愈烈。ChatGPT成为互联网最大的“风口”,微软借此市值重返“两万亿美元俱乐部”,谷歌也...
日期:02-15
360董事长当“客服” 周鸿祎上微博对话用户_360创始人周鸿祎合伙人
  6月9日下午消息,360公司董事长周鸿祎今日登陆腾讯微博,2个多小时连续解答上百条用户对360产品提出的意见,直接在微博上当起了“客服”。此前,周鸿祎用微博曝光金山公司“笔...
日期:07-29
微软专为网络安全专家推出AI聊天机器人_微软的聊天机器人叫微软助手吗
3月29日消息,在宣布为Office应用提供AI支持的Copilot(副驾驶)助手后,微软现在将注意力转向网络安全。美国当地时间周二,微软推出了一款专版聊天机器人,旨在帮助网络安全专家了解关...
日期:10-04
有史以来最轻薄的折叠屏手机!荣耀V Purse今晚发布:出门不用带包了
快科技9月19日消息,荣耀官方前几天发布消息称荣耀V Purse将在今晚19时30分正式发布。就在今天上午,荣耀在官微上公布了此次发布会的直播平台。本次直播将通过三大平台进行,分别...
日期:09-19
荣耀CMO郭锐:从UI到OS是让设备更无缝地服务
凤凰网科技讯(作者/贾楠)荣耀于日前在深圳举办了其首届开发者大会,并正式推出了MagicOS 7.0。除了命名上的变化外,荣耀还同时推出了诸如Magic Ring信任环机制,以及Magic Live智慧...
日期:11-26
360总裁周鸿祎音响「AI前哨 | 周鸿祎:360智脑在部分中文理解表现优于GPT」
凤凰网科技讯 《AI前哨》6月13日消息,360集团举办360智脑大模型应用发布会。360集团创始人周鸿祎表示,国内(大模型)现在你追我赶,不断地互相激励,缩小和全球领先技术的差距。原来...
日期:06-13