您的位置:首页 > 互联网

Headless语言模型:通过捆绑嵌入提高模型的训练速度

发布时间:2023-09-20 19:23:31  来源:互联网     背景:

要点:

1. 提出了一种新的预训练方法,称为无预测头语言模型,它移除了对词汇空间概率分布的预测需求,而是关注用对比方式重构表示。

2. 该方法只需要改变目标函数,可以直接应用于经典语言模型预训练目标。

美股又创新高

3. 在单语和多语编码器以及单语解码器中实验表明,Headless语言模型预训练相比经典方法在给定运算量下表现更好,计算效率更高。

9月20日 消息:研究人员发现了一种改进语言模型性能的方法——Headless语言模型,即将输入嵌入与模型的其他嵌入捆绑在一起,并使用对比损失。通常情况下,语言模型的输入和输出嵌入层是分开的,但这种新方法通过捆绑它们,提高了模型的训练速度和准确性。这一创新有望在大规模语言处理任务中取得广泛应用。

Headless语言模型通过移除语言模型预测词汇空间概率分布的需求,改为学习重构输入嵌入的对比方式,提供了一种创新预训练方法。作者提出了一种对比权重绑定损失,可以直接作为经典语言模型的目标函数替代,因此可以轻松集成到已有代码库中。

华为mate50pro5g版什么芯片

论文地址:https://arxiv.org/pdf/2309.08351.pdf

在英文和多语言单向编码器以及英文解码器模型的中等规模预训练实验中发现,在类似运算量下,Headless语言模型相比经典方法有显著提升,下游表现更好,数据效率更高,计算效率也更高。

例如,Headless语言模型在GLUE基准测试上的结果比对应的经典模型高1.6分,在LAMBADA数据集上的准确率提高了2.7分。

讯飞翻译笔s11

此外,训练Headless语言模型可以节省高达20倍的运算量。总的来说,这项工作为以对比学习取代交叉熵作为自监督预训练目标开辟了道路,为语言表示学习提供了一种高效可行的替代方案。


返回网站首页

本文评论
师来师往高效打通教育人才入职通路,教育领域专注优势凸显
  2021年由于疫情进入常态化的防控阶段,我国国民经济呈持续恢复态势。国家统计局公布的数据显示,2021年一季度国内生产总值249310亿元,比2020年四季度环比增长0.6%,比2019年...
日期:05-03
百度联想_百度联想词是之前搜索过的吗
是指在用户在百度搜索框中输入关键字时,百度会自动提供关于该关键字的可能搜索结果。这个功能的主要目的是帮助用户更快、更准确地找到他们需要的信息。是百度搜索功能中的重...
日期:05-29
国内已超越GPS 定位精度优于1米 我国已有45颗北斗卫星在轨:还要再发1-3颗备份
我国自主建设的第三代北斗卫星导航卫星系统已经投入使用3年了,高德之前公布的数据显示截至今年1月,高德地图调用的北斗卫星日定位量超3000亿次,已经超越了GPS卫星成为主力。据2...
日期:04-26
美团被腾讯控股了么?_被传“甩了”美团,腾讯真要做“渣男”?
文丨普子胥出品|网易科技《态℃》栏目“神仙打架,小鬼遭殃。”比特币牛熊市戏谑的评论,出自昨天的一则消息之下:美团股价午后持续走低,跌幅现扩大至10%。此前有市场消息称,腾讯计...
日期:08-19
视频号直播升级商家激励计划 多种方式引流直播间可获流量券「视频号直播间推流」
11月2日 消息:日前,视频号发布通知称,微信视频号直播团队于2022年10月31日起升级商家激励计划(以下简称“本计划”)。据悉,升级后,商家引导视频号外自有粉丝进入视频号直播间,在本...
日期:11-09
不用牙膏也能清洁牙齿?贝医生随身冲牙器1天卖出三百万!_洗牙器需要牙膏吗
  每天早起晚睡使用牙膏牙刷清洁口腔,几乎成为所有人的生活习惯。试想一下,若不用牙膏甚至牙刷,也能清洁牙齿和口腔吗?答案当然是可以!   最近在小米众筹上线的贝医生随身...
日期:06-03
独立开发变现周刊(第85期):一个会员服务的SaaS,月收入2万美金
声明:本文来自于微信公众号 凯凯而谈(ID:web-bear),作者:凯凯刘,授权转载发布。1、Obsidian Canvas:一个无限的空间来构建你的想法你可以在画布上放置文本、笔记、图像、pdf文件...
日期:12-23
周鸿祎宣布 360 上线 AI 商店:将集成全球人工智能工具「360创始人周鸿祎个人简介」
5月15日消息:在央视财经频道日前播出的《对话》节目中,360 集团创始人周鸿祎表示,这次人工智能是真的,不是假的,它不是像过去做的人工「智障」,是「弱」人工智能,或者是垂类的人工...
日期:05-15
2021海信品牌价值蝉联轻工领域前十_海信品牌价值排行榜2020
  5月9日,第五个中国品牌日来临之际,新华社、中国品牌建设促进会、中国资产评估协会、国务院国资委新闻中心等单位联合发布了2021中国品牌价值榜,海信品牌价值蝉联轻工领域...
日期:12-19
以太坊 8 年挖矿时代结束:V 神、中国矿业,与英伟达「以太坊挖矿产出」
最后的以太坊矿工,与中国「挖矿」简史。来源:律动 BlockBeats原作者:Jack原标题:以太坊 8 年挖矿时代结束:V 神、中国矿业,与英伟达编者按:2022 年 9 月 15 日 14 点 42 分,成立 8...
日期:09-19
联想刘军:释放联想中国主力智能解决方案服务商新势能
联想刘军:释放联想中国主力智能解决方案服务商新势能 通信产业网|2023-06-28 18:04:13作者:通文来源:通信产业网6月28日,2023上海世界移动通信大会(2023 MWC上海)盛大开幕。作为中...
日期:06-28
新一代夏日手游神器 黑鲨冰封制冷背夹2 磁吸版上市开售
  随着智能手机性能的不断变强,手机游戏的质量也在不断向上突破,现在我们已经可以在手机上玩到很多画面非常出众的游戏作品。但随着性能不断提升,想要长时间稳定运行游戏...
日期:04-16
iPhone 13减产「苹果减产300万部新iPhone  因iPhone 14机型需求疲软」
11月7日 消息:据知情人士透露,苹果新iPhone产量预计将削减300万部。该公司及其供应商现在的生产目标是8700万台或更少,此前的目标是9000万台。减产的原因主要是对iPhone14和14...
日期:11-08
铱云供应链重磅发布,驱动企业数字化转型(上海铱云信息技术有限公司)
  随着消费者的需求越来越高,市场竞争越来越激烈,企业的发展需要更智能、高效的供应链作支撑。致力于帮助传统企业数智化改造的铱云科技,基于对多个行业供应链变革趋势的深...
日期:04-25
首发12999元起!RTX 4090公版显卡国行10月15日正式开售_rtx3090显卡发售时间
今天,NVIDIA正式官宣,RTX 4090显卡将于10月15日在国内线下现货首发。梅耶尔 雅虎据悉,此次NVIDIA将联合沈阳京东MALL、与华硕、七彩虹和微星赛达厂商一同,开售RTX 4090显卡。届...
日期:10-12
反人类的验证码,早应该被干掉
360和金山打架   人类苦验证码久矣。   文 |;张成晨   来源:爱范儿   “我不是机器人”,本应是不言自明的事情。   但在计算机承认你是人类之前,你可能会被要求点击...
日期:08-16
起重船沉没致25人死亡事故细节:未按要求撤离、谎报在船人数,涉两家上市公司
转自:红星新闻红星资本局消息,近日,国家海事局公布《阳江“7·2”“福景001”起重船风灾事故调查报告》。《调查报告》显示,这是一起台风导致无动力起重船走锚,触碰风机桩后断裂...
日期:06-11
亚马逊宣布下月举办新会员促销活动 首次一年举办两场大促「亚马逊的促销活动」
  讯 北京时间10月27日早间消息,据报道,亚马逊将于下月举办另一场类似Prime Day会员日的促销活动。这是亚马逊首次在一年内举办两场此类活动。  亚马逊周一表示,下场活动将...
日期:10-05
他山石人工智能专家邀约服务获得行业关注,积极响应工信部文件要求
  为推动国内人工智能产业建设、发展,工信部印发关于加快人工智能建设通知。他山石因旗下工智能专家邀约服务,高度契合政府战略规划需求而广受行业关注。   7月15日,工信...
日期:07-17
华为mate 50系列发布最新升级,性能大幅提升「华为mate 50系列最新款」
华为发布mate 50系列鸿蒙os 3.0.0.302升级,性能大幅提升。mate 50系列的cpu频率从2.8ghz+2.58ghz+1.8ghz提高到3.19ghz+2.75ghz+1.8ghz,cpu性能得到了显著的提高。该更新提高...
日期:05-07