您的位置:首页 > 互联网

Meta研究人员提出轻量级微调方法RA-DIT 以增强语言模型知识检索能力

发布时间:2023-10-08 21:47:07  来源:互联网     背景:

文章概要:

五菱创业车

1. RA-DIT通过两阶段调优提升语言模型利用检索信息的能力和检索器提供相关结果的能力。

2. RA-DIT在知识密集的零样本和少样本学习基准测试中优于现有检索增强模型。

3. RA-DIT65B在需要利用知识的任务中表现显著提升,展现调优带来的效果。

10月8日 消息:最近,Meta的研究人员提出了一种名为检索增强双指令调优(RA-DIT)的新型人工智能方法,用于提升语言模型的知识检索能力。该方法试图解决大型语言模型在捕获较为冷门知识时的局限性以及大规模预训练的高计算成本问题。

RA-DIT是一个轻量级的两阶段微调方法,旨在为任何语言模型赋予高效的检索能力。它通过两种不同的微调方式,每种方式都能带来可观的性能提升。首先,它会优化语言模型利用检索到的信息的能力。其次,它会优化检索器提供的内容相关性,使其能够提供更符合语言模型偏好的相关结果。通过同时提升语言模型使用检索信息的效果和检索器提供内容的相关性,RA-DIT能有效地增强语言模型的知识检索能力。

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员采用了在大规模数据集上进行过预训练的LLAMA语言模型,并使用初始化为DRAGON模型的双编码器检索架构。此外,他们还提到了使用并行上下文检索增强,以更有效地计算语言模型的预测。

Wi-Fi 6技术

实验结果显示,RA-DIT65B在知识密集的零样本和少样本学习任务中设置了新的基准,大幅超过现有的上下文检索增强语言模型。这证明了轻量级指令调优在提高检索增强语言模型性能方面的效果,特别是在需要访问大量外部知识源的场景中。在需要利用知识和语境感知的任务中,RA-DIT65B的表现有了大幅提升。此外,与基础LLAMA模型相比,RA-DIT在8个常识推理评估数据集中表现更好。

RA-DIT为预训练语言模型带来了检索能力的提升。它在知识密集的零样本和少样本评估中取得了最先进的结果,超过了未调优的上下文检索增强语言模型,与大规模预训练的方法展现出竞争力。RA-DIT显著改善了对知识利用和语境感知的要求较高的任务的表现。该研究证明了轻量级指令调优对检索增强语言模型的有效性,特别是在涉及大规模外部知识源的场景中。

论文网址:https://arxiv.org/abs/2310.01352


返回网站首页

本文评论
小米千元神机开售 二代骁龙4 价格1099元起「小米骁龙处理器性能排行图」
小米商城正式开售新款Redmi Note 12R,起售价为1099元。维珍轨道launcherone尽管Redmi Note 12R是一款入门级的5G手机,但它给消费者带来了很多同级产品中少见的特点。首先,Redmi...
日期:07-02
3万元!大疆Mavic 3T无人机发布:配热成像 45分续航
9月27日晚,大疆发布DJI Mavic 3行业系列,号称重新定义小型行业无人机,售价19999元起!DJI Mavic 3行业系列包括Mavic 3E、Mavic 3T两款机型。夏普智能家居其中Mavic 3E配备机械快...
日期:09-28
什么是侧载ios「Gurman:苹果 iOS 17 将支持应用侧载以符合欧盟法规」
4月18日消息:据彭博社 Mark Gurman 报道,苹果在 iOS 17 中将首次允许 iPhone 用户下载其官方 App Store 以外的应用程序。这也就是所谓的侧载,这一变化将允许客户在不需要使用...
日期:04-18
华为畅享10plus参数配置详情「华为畅享10」
是一款中高端智能手机,于2019年12月在中国大陆市场上发布。其最大的特点是搭载了独立于手机主处理器之外的AI智能处理器,能够在更高的速度和效率下进行AI计算。此外,还配备了一...
日期:05-30
英特尔亮相“WAVE SUMMIT+”深度学习开发者秋季峰会 详解Intel处理器在百度飞桨中的应用
  11月5日,“WAVE SUMMIT+”2019深度学习开发者秋季峰会在北京召开。本次峰会上,百度飞桨(PaddlePaddle)全新发布和重要升级21个产品方向,包括面向产业应用场景的四大端到端...
日期:05-22
传音手机凭什么在非洲市场称王案例思考「折叠屏,「非洲之王」传音的止跌良药?」
图源:传音社交平台2月底,全球通信行业巨头再聚首,来到巴塞罗那,对外展示最前沿的通信技术和产品。从当初的追赶者,到现在的领跑者,中国品牌已然成为这场盛会的主角。当荣耀“接棒...
日期:03-07
Flyme 9体验全面升级,你不知道的还有这些惊喜_魅族更新flyme9
  前段时间,魅族官方微博宣布,3月1-3月3日三天惊喜不断,不仅有《这十八年》微电影上映,Flyme 9和新机的发布会也接踵而至。而3月2日,正是新系统Flyme 9的发布日期。作为业内领...
日期:07-16
伯克利研究人员推出AI智能体Dynalang:可接收复杂指令_美国伯克利人工智能实验室
8月8日 消息:加州大学伯克利分校研究人员推出了一种名为 Dynalang 的智能体,这是一种通过在线体验获取世界语言和视觉模型的智能体,并利用该模型来理解人类行为。由于世界建模...
日期:08-08
小米13 Ultra全球版通过蓝牙SIG认证
小米即将在全球市场推出其旗舰手机小米 13 Ultra,发布会定于6月12日举行,之后该手机将于6月21日开始销售。现已通过蓝牙 SIG 认证的小米 13 Ultra 全球版手机型号为 2304FPN6D...
日期:06-08
小米自研系统MIOS爆料
“MIUI究极进化……MIOS”。8月22日消息,小米在工信部备案了新网址mios.cn(但网站还没开,现在访问是403状态)。同日,闲聊站爆料这是小米全端自研系统,兼容AOSP。省流就是可以在多...
日期:08-23
五一旅游闹心 115元买4.6斤水果少一斤后续:情况属实 顶格处罚_购买水果重量不够算欺诈吗
五一旅游遇到商家缺斤短两就非常影响体验了,沸点视频报道称,有游客在长沙花费115元买了4.6斤水果,结果少了一斤,现在官方调查结果也出来了,情况属实。ssd降价趋势网信天心在微信...
日期:04-30
广州公安:逐步推行谁购票谁观看 规范演出行业秩序
根据人民网“领导留言板”7月25日的报道,广州市公安局针对网友提出的演唱会实名制购票的意见,回应说,正在制订相关售票方案,逐步实施购票者必须观演的规定。这名网友在5月31日给...
日期:07-26
果集科技创始人胡东:2023年社媒电商下品牌的破圈之路
更多精彩内容,请关注 《2022网易未来大会》专题报道 胡东:2023年社媒电商下品牌的破圈之路 (来源:网易科技) 12月19日-23日,2022网易未来大会...
日期:12-23
苹果手机14pro max官网价格「iPhone 14 Pro Max成苹果618最热门手机、领券立减1700元」
6月7日消息,根据“京东手机竞速排行榜”的信息,此次618大促期间热门的三款手机分别为iPhone 14 Pro Max、iPhone 14 Pro、OPPO K9x,虽然价格昂贵,但是仍阻挡不了用户购买的热情...
日期:06-06
26%员工担心使用AI工具会被认为是“偷懒摸鱼”
文章概要:1.26%的受访员工担心使用AI会被认为懒惰,20%的员工承认使用AI会感到像骗子。2.92%的受访员工担心AI被不道德地使用。容声冰箱will评测3. 仅30%的美国知识工作者和20...
日期:09-01
美团数据显示:海南三亚入港机票订单量单日增长340%,住宿预订量增长近300%_
12月5日,海南省海口市、三亚市等多地宣布对省外来(返)人员不再实施分类管控。美团数据显示,消息发布后,海南机票、酒店、景点门票等搜索和预订量均呈明显上扬曲线。截至6日20时,三...
日期:12-12
传苹果已自研OLED驱动芯片 业内人士:假消息「oled驱动芯片市场规模」
集微网消息 3月13日,有消息指出,苹果目前已经开始自研驱动芯片,首先会推出OLED驱动芯片,预计将于2024年量产。但是供应链消息人士向集微网透露,这是假消息。小新 pro 16 2021 锐...
日期:03-14
马斯克专访:我是个受虐狂 生500个孩子可能有点奇怪_马斯克崩溃痛哭
凤凰网科技讯 北京时间10月8日消息,特斯拉公司经历了艰难的一周,它的第三季度汽车交付量没有达到外界预期,其CEO埃隆马斯克(Elon Musk)还在“惹事生非”,不但与推特打官司还在发...
日期:10-11
双11家电销量「苏宁易购:双11以来门店家电订单量环比增长146%」
10 月 28 日消息,苏宁易购数据显示,自双 11 开启以来,全国门店客流环比增长185%,门店家电订单量环比增长146%,其中洗烘一体机、节能热水器等暖冬升级类家电增幅较大,环比超135%。...
日期:10-28
男子下班后常用微信办公 告公司要加班费引争议:官方判了 网友点赞
下班后用微信办公,到底该不该有加班费呢,这个问题也是让网友争议。近日,武汉洪山法院宣判的一则案例在网络上引发热议。王先生入职后,长期在下班后使用微信办公,有时需要开会到凌...
日期:09-25