您的位置:首页 > 互联网

​清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持 83% 性能

发布时间:2024-03-04 23:28:17  来源:互联网     背景:

划重点:

⭐ 清华大学和哈尔滨工业大学联合发布论文,将大模型压缩到1bit,保持83% 性能;

⭐ OneBit 方法首次尝试1bit 量化,突破了2bit 的限制;

百度网盘关闭上传自动

⭐ 新方法结合1bit 层结构、基于 SVID 的参数初始化和量化感知训练。

比亚迪性价比高的纯电动汽车

3月4日 消息:近期,清华大学和哈尔滨工业大学联合发布了一篇论文,成功将大模型压缩到1bit,仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去,2bit 以下的量化一直是研究人员难以逾越的障碍,而这次的1bit 量化尝试,引起了国内外学术界的广泛关注。

这项研究提出的 OneBit 方法,首次尝试将预训练大模型压缩到真正的1bit。通过全新的1bit 层结构、基于 SVID 的参数初始化和量化感知训练,成功将大模型参数压缩到1bit 表示。该方法不仅保留了模型的高精度和高秩,还能够在极大幅度压缩模型参数的同时,保证模型至少83% 的性能。

OneBit 方法的核心在于将权重矩阵压缩到1bit,并引入两个 FP16格式的值向量以弥补精度损失。通过新的参数初始化方法 SVID 和知识迁移,成功将高精度预训练模型的能力转移到1bit 量化模型上。实验结果表明,OneBit 方法相较于其他2bit 量化方法,在验证集困惑度和 Zero-shot 准确度上表现更为优秀。

rtx3080显存超频

该研究的意义在于,成功突破了2bit 量化的障碍,为在 PC 和智能手机上部署大模型提供了新的可能性。未来,随着技术的不断进步,将有望实现将大型语言模型等大模型压缩到极低位宽,并实现在移动设备上高效运行的愿景。

论文地址:https://arxiv.org/pdf/2402.11295.pdf


返回网站首页

本文评论
腾讯接管2年后,阅文会做IP生意了吗?
声明:本文来自微信公众号“节点财经”(ID:jiedian2018),作者:四海,,授权转载发布。“不说了,说多了都是泪”。网文爱好者小易在今年6月得知QQ阅读会员涨价的消息时,心里无限感慨。涨...
日期:12-27
visual studio2017更新2019_微软 Visual Studio 2019 16.6 Preview 2 发布,附更新内容
  微软方面宣布了 Visual Studio 2019 16.6 Preview 2 版本的发布,该版本附带了一些新功能,以供用户立即试用。具体更新内容如下:   Version Control:开发团队正在改进 Git...
日期:11-21
小米全屋智能「小米全屋智能家居定制」
是小米科技推出的一项智能家居解决方案,旨在让用户能够更加智能化地管理家庭设备,提高家居生活的舒适度和便捷性。该解决方案包括智能家居设备、智能控制系统、智能家居软件等...
日期:05-28
净利大涨168%,唯品会活得很滋润「唯品会盈利了吗」
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。唯品会连续10年盈利你可以质疑唯品会日益收窄的规模,但无法否认它赚钱的能力——这已经是唯品会连...
日期:11-25
合合信息摘得全球顶级AI竞赛冠军(合合ai开放平台)
  近日,全球顶级AI竞赛——ICDAR文档分析与识别竞赛官方揭晓2019年比赛成绩。上海合合信息科技发展有限公司(以下简称“合合信息”)摘得表格检测任务的冠军;同时,联合华南...
日期:04-10
投资赚了12000倍 腾讯大股东暂停减持:已套现超千亿_腾讯大股东减持价格
就像软银投资阿里一样,南非Naspers公司投资腾讯也是一个经典的案例,20多年前的3200万美元一度价值超3000多亿美元,盈利12000多倍,去年到今年该公司多次减持腾讯股票,套现已经超过...
日期:11-03
100元吃遍东北早市当事人道歉:拍视频初衷是想让大家感受北方的早餐有多实惠
10月18日消息,网红博主张天琪发布的100元吃遍东北早市”视频引发争议。娄艺潇直播带货的东西很便宜有网友指出,视频中的美食价格并非如网红所说,还有一些网友表示,他们在东北早...
日期:10-19
12306推出适老化无障碍功能_12306 网站适老化及无障碍改造相关功能今日正式上线运行
  9 月 1 日消息 据中国铁路公众号消息,9 月 1 日,铁路 12306 网站进行的适老化及无障碍改造相关功能正式上线运行,为老年人及障碍人士线上购买火车票提供更多便利,12306 手...
日期:07-17
诺西并购摩托案二度推迟 商务部继续延期审查
  诺基亚西门子通信对摩托罗拉无线部门并购一案已然陷入“明日复明日”的状态。   日前诺西发表声明称,“我们预期该交易(并购摩托)无法在之前宣布的时间内,即2011年一季...
日期:07-26
新工具“Glaze”正在保护人类艺术家作品免受AI风险
8月18日 消息:芝加哥大学的科学家们近日宣布他们发明了一项创新工具"Glaze",旨在为人类艺术家们提供保护,确保他们的作品不受生成型人工智能的风险。这一工具的核心理念是通过...
日期:08-18
网易AI算法、恰似chats手机端应用软件获批登记
8月21日 消息:天眼查App显示,8月15日,网易(杭州)网络有限公司“网易数帆人工智能算法软件”“恰似chats手机端应用软件”获得登记批准,版本号均为V1.0。psvr2头戴阿里巴巴副总裁...
日期:08-21
苏宁超市双十一12小时战报:订单量同比增长168%_苏宁历年双十一数据
  随着11月11日的到来,双十一大促正式进入最后的爆发。11日,苏宁超市公布了双十一当天的12小时战报。数据显示,11月11日0点-12点,苏宁订单量同比增长168%,1499元的飞天茅台酒...
日期:07-03
骁龙8155仅排第5 安兔兔车机版Beta 1首批性能榜出炉
快科技8月24日消息,安兔兔车机版已经发布了近一个月时间,在车机版开启公测的这近一个月时间里,安兔兔在后台收录了大量的跑分成绩,涵盖了数十款车机。其中,有的车机自带应用安装...
日期:08-24
倪金德卸任网易味央CEO,原新希望副总裁韩继涛接任
  8月24日,澎湃新闻记者独家获悉,网易味央原CEO倪金德已于5月24日卸任CEO职位,并将于近期正式离职。wps图片提取文字怎么操作realme book显卡  原新希望副总裁韩继涛正式接...
日期:08-27
安全狗高危预警:Windows RDP远程漏洞可致蓝屏 POC目前已公开
  2019年5月14日,微软发布了远程桌面服务远程代码执行漏洞(CVE-2019-0708)安全公告后,全球安全圈都持续密切关注,这一漏洞的存在将允许黑客通过开放的远程桌面服务直接入...
日期:10-04
火车卧铺上有帘子吗「火车卧铺自带床帘引争议!12306回应来了:不禁止」
快科技8月27日消息,近日,有网友在社交平台分享乘坐火车卧铺自带床帘”的攻略,引起了广泛讨论。有观点认为,自己购买了下铺铺位,自带床帘可以让环境更加私密,也更具安全感。而也有...
日期:08-27
专家称:AI 将在五年内每年替代 5% 的技术岗位
本文概要:1.人工智能(AI)将在接下来的4-5年内每年替代高达5% 的技术岗位,但同时会创造更多涉及决策和战略的高级职位。2. AI 伦理和可持续性实践方面的角色也将需求增加。3. 企...
日期:08-18
度小满开源千亿参数金融大模型“轩辕”__度小满金融的独立之旅
5月26日消息,近日,度小满正式开源千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金...
日期:05-26
Redmi无线充电新机曝光 或为K60系列「redmi k30充电头」
中关村在线消息:10月8日上午,有数码博主曝光了一款Redmi新机的配置信息:系列两款机型将分别支持67W、120W有线充电,并均配备30W无线充电,大概率为即将推出的K60系列。抖音名称与...
日期:10-11
请定好闹钟,金星伴月天文奇观来啦,千万不要错过!
不要错过奇妙的黎明前金星与月亮的结合2023年12月9日:黎明前将出现金星与新月成对出现的壮丽景观。在这必看的晨景中,还可以欣赏到天光。图片说明:2023年11月9日,日出前金星与新...
日期:12-07