您的位置:首页 > 互联网

DeepMind研究人员发现,深度学习模型在图像和音频压缩方面表现出色

发布时间:2023-09-26 17:58:53  来源:互联网     背景:

文章概要:

1. DeepMind研究人员发现,深度学习模型在文本领域之外,出人意料地在图像和音频数据的压缩方面表现出色。

2. 研究发现,虽然主要训练于文本数据,但这些大型语言模型(LLMs)在图像和音频数据的压缩方面表现出令人瞩目的性能,甚至超过了专门的压缩算法。

3. 将LLMs从压缩的角度看待为数据压缩器,为评估模型性能和规模提供了新的洞察,对模型的大小和性能之间的关系提供了重要见解。

9月26日 消息:近日,Google旗下的人工智能子公司DeepMind发布的一项研究表明,大型语言模型(LLMs)除了在文本数据处理方面表现出色之外,还具备出色的图像和音频数据压缩能力。这一发现为重新审视LLMs的潜力提供了新的角度。

oppo手机4G

研究的核心观点是将LLMs视为强大的数据压缩器,而非仅仅是文本生成模型。研究作者提出“通过压缩的角度来看待预测问题”,这为我们理解这些模型的能力带来了全新的视角。

心电图apple watch中国

在研究中,DeepMind的研究人员对LLMs进行了一些微小的修改,使其能够执行算术编码,这是一种无损压缩算法。值得注意的是,LLMs的训练过程是基于对文本序列的极大概率和交叉熵的最小化,这使得它们能够生成概率分布,与数据压缩之间存在一对一的等价关系。这种无损压缩算法,如gzip,可以从压缩的数据完美重构原始数据,确保不丢失任何信息。

研究人员对LLMs在文本、图像和音频数据上的压缩能力进行了评估。不出所料,LLMs在文本压缩方面表现出色。例如,Chinchilla模型(拥有700亿参数)将数据压缩到原始大小的8.3%,远远超过gzip和LZMA2,它们分别只能实现32.3%和23%的压缩率。

一加oneplus watch智能手表评测

然而,更引人注目的发现是,尽管LLMs主要在文本数据上进行训练,但它们在图像和音频数据的压缩方面也取得了显著的成功,超过了领域专用的压缩算法,如PNG和FLAC。

尽管取得了令人鼓舞的结果,但与现有的压缩模型相比,LLMs在实际数据压缩中并不实用。这是因为LLMs的体积较大,运行速度较慢。例如,研究人员发现,gzip可以在CPU上在不到一分钟内将1GB的文本数据压缩,而具有320万参数的LLM需要一个小时才能完成相同数量数据的压缩。

大众卖掉布加迪

研究还发现,LLMs的规模对其性能有重要影响。虽然一直以来,人们普遍认为越大的LLMs性能越好,但研究人员发现,对于较小的数据集,更大的模型并不一定更好。这表明LLMs的性能与数据集的大小有关,压缩率可以作为评估模型对数据集信息学习的指标。


返回网站首页

本文评论
阿凡达2全球票房预测「年度必看神作!《阿凡达2》全球票房破9亿美元:内地破7.3亿」
最新数据显示,截至12月27日上午,《阿凡达2:水之道》的全球票房已经突破9亿美元,其中在内地院线的累计票房已经突破7.3亿元。iphone 11 pro max涨价口碑方面,豆瓣8.1分,IMDb 8.0分,...
日期:12-27
Dingo:一个可简单集成函数的ChatGPT微框架
要点:esim取代实体卡Dingo是一个可以简单集成Python函数到ChatGPT的微框架,只需要一行代码。Dingo可以自动生成函数的文档注释,简化集成过程。Dingo可以打包部署成兼容OpenAI...
日期:08-28
一加散热有重大突破:温度比友商低14度「一加7t散热」
快科技7月27日消息,一加正式推出航天级天工散热系统,这是手机散热历史上的重大突破。iqoo搭载天玑820在航天级天工散热系统上,一加将散热材料、VC面积全部拉满的同时,还首次将航...
日期:07-27
中关村开始清理盗版光盘 泛滥局面短期难改变_盗版光盘会坏碟机吗
  近日,盗版光盘泛滥的中关村开始重点清理盗版。但记者在采访时发现,盗版并没有因为清理而绝迹,而是从地上转到了地下。有关专家指出,盗版有其特定的历史 渊源与生态环境,短期...
日期:07-29
人工智能发展趋势研判与规范引导思路「浅谈人工智能的研究与发展」
通信世界网消息(CWW)ChatGPT等人工智能语言模型的出现虽然尚未对人们的生产方式带来根本性变革,但有可能改变人们与计算机的互动方式,推动从用户创作到人工智能创作的转型,发展潜...
日期:06-21
chia挖矿伤硬盘吗「矿卡凉了 Chia硬盘挖矿死灰复燃 大容量机械盘又涨价」
说到数字货币挖矿,除了参与其中的爱好者之外,大部分玩家对此深恶痛绝,显卡挖矿几次三番搞乱了游戏卡市场,去年彻底凉了,然而币圈阴魂不散,硬盘挖矿的Chia币今年以来价格大涨,再一次...
日期:01-29
小米5g百元机「红米百元机重出江湖?放言为普及5G手机而来」
9月29日消息,Redmi红米手机宣布,Redmi千元小金刚再添猛将,Note 11R为普及5G手机疾速而来。雷克萨斯es什么时候涨价的pico创始人周宏伟ipad mini6更换电池价格简单说,小米推出了N...
日期:10-01
10月厂商销量榜:比亚迪 南北大众彻底追不上_比亚迪十月汽车销量
10月份,乘联会发布了国内10月份汽车厂商销量销量情况。华为公开柔性屏专利数据显示,10月份国内狭义乘用车市场零售销量达184.2万辆,同比增长7.5%,环比下降4.2%;1-10月份累计销量1...
日期:11-17
脉脉高聘:互联网中高端人才存量断层领先,新能源汽车吸引力稳定增长
脉脉高聘:互联网中高端人才存量断层领先,新能源汽车吸引力稳定增长 通信产业网|2023-07-07 15:52:38作者:通文来源:通信产业网【通信产业网讯】近日,脉脉高聘发布的《2023新经济...
日期:07-07
tcl科技布局_5G+8K成新风口,TCL用AI×IoT战略在5G时代抢占先机
  我国5G商用刚刚过去了一年时间,5G在我们生活中的应用已经不再停留在手机上的网络测速,包括游戏、无人驾驶、高清视频、医疗、工业、制造等领域都已经逐步看到了5G的身影,...
日期:07-14
飞利浦水健康携净水新品重磅亮相AWE2023_飞利浦净水器百度百科
2023 年度中国家电及消费电子博览会(AWE2023)于 4 月 27 日在上海新国际博览中心正式开幕。其中,飞利浦水健康携全屋高阶净水G5 系列、厨下净水器U22Pro、冰热矿净四合一台式净...
日期:05-05
Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】外媒爆料,Meta正在加急研发全新开源大模型,对标GPT-4,参数量比Llama2还要大上数倍。Meta...
日期:09-12
封神 上映「8月总票房已突破10亿!《封神》第一:口碑已经成了」
快科技8月5日消息,据灯塔专业版数据,截至8月5日9时35分,8月总票房(含预售)已突破10亿。其中,《封神》以大比分的优势领先。i74600m处理器跑分根据官方消息,目前该片总票房已经超过1...
日期:08-05
比尔盖茨有新女友了 对方是甲骨文公司联席首席CEO遗孀
2月10日 消息:比尔·盖茨与传闻中的女友被拍到出现在澳大利亚,他们在墨尔本看了澳网男单决赛。据悉,这位女士叫保拉·赫德,是马克·赫德的遗孀,他曾担任甲骨文联席首席执行官,于2...
日期:02-13
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
IT之家 7 月 9 日消息,近年来,人工智能(AI)在创作艺术品方面展现了惊人的能力。只要在一个文本框里输入一句话,AI 就能根据指令生成一幅美丽的图像。这种技术的魅力在于它能用人...
日期:07-10
科大讯飞受邀参加“2023·5G应用创新大会” 激发5G通信应用智慧创新_2020年科大讯飞又出新产品
通信世界网消息(CWW)7月19日,由中国通信企业协会、工业和信息化部新闻宣传中心、中国信息通信研究院、中国电子信息产业发展研究院、中国工业互联网研究院主办的2023 5G应用创...
日期:07-21
丰田与自动驾驶公司 Pony.ai 合作在中国量产机器人出租车「丰田深耕自动驾驶 或将与uber进行合作」
8月7日 消息:据国外媒体报道,自动驾驶公司 Pony.ai 和丰田表示,他们正在合作,目标是生产大量的 “无人驾驶机器人出租车”。两家公司计划在今年某个时候开始合作,广汽丰田汽车公...
日期:08-07
知乎大模型「知海图AI」上线!产品官宣即内测,为4亿用户摘取「热榜摘要」
声明:本文来自于微信公众号 量子位 (ID:QbitAI),杨净 发自 凹非寺 ,授权转载发布。又一家国内企业大模型产品发布。不是别的,而是已拥有4亿用户的最大中文问答社区知乎。而且官宣...
日期:04-14
禾赛科技预计将于2月9日正式登陆纳斯达克「禾赛 上市」
凤凰网科技讯 2月8日消息,据IPO Boutique消息,禾赛科技预计将于2月9日(周四)正式登陆纳斯达克。上海禾赛科技股份有限公司总部位于中国上海市,是一家激光雷达技术公司,成立于2014...
日期:02-10
苹果 Apple Watch 新专利曝光:可通过电池震动来提供触觉反馈_Apple Watch触控失灵
  1月29日消息 据外媒 appleinsider 报道,苹果正在研究如何使 Apple Watch 的电池移动,以便向佩戴者提供触觉反馈。   苹果最新公布了一份 “带有移动电池元件的触觉设...
日期:07-10