您的位置:首页 > 互联网

小红书提出创新框架:充分利用负样本提升大语言模型推理能力_小红书新玩法

发布时间:2024-01-26 08:19:47  来源:互联网     背景:

要点:

  • 小红书搜索算法团队在AAAI2024上提出了一种创新框架,利用负样本知识来提升大语言模型(LLMs)的推理能力。

  • 他们设计了一个模型专业化框架,包括负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,全面利用负样本在知识蒸馏中的关键作用。

  • 该框架通过在训练和推理过程中充分利用负样本,使得小模型能够更好地处理复杂的数学推理问题,避免大模型的黑盒属性和庞大参数量的限制。

iPhone touch ID

1月24日 消息:在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本,而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,他们构建了一个全方位利用负样本的模型专业化框架。

小红书打造爆款

安卓系统开放源代码

论文地址:https://arxiv.org/pdf/2312.12832.pdf

首先,他们提出了负向协助训练(NAT)方法,通过设计dual-LoRA结构,从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识,以构建更全面的推理能力。其次,他们设计了负向校准增强(NCE),利用负知识来帮助自我增强过程,通过KL散度来度量正、负推理链路之间的不一致性,以选择性地学习和增强嵌入的知识。

除了训练阶段,他们还在推理过程中利用负向信息,提出了动态自洽性(ASC)方法,通过排序模型在正、负样本上进行训练,为正确答案的推理链路分配更高的权重。整体来说,这一框架通过充分挖掘负样本的宝贵信息,使得小模型能够更有效地进行复杂的算术推理,从而在实际应用中更广泛地部署大语言模型的推理能力。

小红书的创新

这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。


返回网站首页

本文评论
石头科技也造车?或将在下半年推出「石头科技2020新品」
【网易科技1月16日消息】科技公司造车的风潮正在持续蔓延。近日,据36氪报道,有知情人士透露,扫地机器人公司石头科技创始人兼CEO昌敬的创业项目洛珂智能,将在今年三季度实现落地...
日期:01-16
中国联通5g产品「联通研究院发布《中国联通5G随行网络增强架构白皮书》」
通信世界网消息(CWW)随着5G网络的发展,以及5G网络与垂直行业的深度融合,业务部署情况以及用户的业务使用习惯都发生了很大变化,传统的网络路由设计以及容灾方式已经无法满足用户...
日期:06-27
华为Watch GT 3系列微信手表版上线:支持语音、文字回复_华为手表新款watch3微信语音
9月29日消息,今日,@华为终端 官方宣布,华为Watch GT 3系列智能手表正式上线微信手表版。用户可通过蓝牙连接,不必拿出手机,抬手就能查看微信上的语音和图文信息、语音和视频通话...
日期:10-02
腾讯多媒体实验室夏珍:视频画质增强的现状、应用、未来
  全真互联时代,音视频技术内核不断更新迭代,LiveVideoStackCon 2022 北京站邀请到腾讯多媒体实验室视频技术研发负责人——夏珍,与大家分享画质增强技术的一些前沿探索和应...
日期:04-24
FCC批准SpaceX开展星链卫星直连手机实验_spacex 星链卫星发射
12月15日消息,美国时间周四,美国联邦通信委员会(FCC)发布通知,批准了SpaceX用星链卫星进行直连手机业务的实验。这意味着SpaceX可以利用星链卫星,通过无线电波直接连接地面普通手...
日期:12-15
阿里专利可测评并指导大模型优化_阿里巴巴专利技术
通信世界网消息(CWW)日前,阿里巴巴(中国)有限公司申请的“基于大模型的数据处理方法及服务器”专利公布。iPhone 13 Pro Max配色摘要显示,该申请通过获取人机交互的指令集和指令集...
日期:07-05
Redmi Note 11T Pro新版本今天开始预约:8+256GB售价2099元「Redmi Note 11/Pro」
9月28日消息,今天Redmi Note 11T Pro新版本:8+256GB的开始预约,售价2099元。这款手机搭载的是LCD屏幕,是目前为数不多的LCD屏,一直想买LCD屏手机的小伙伴可以预约,9月30日晚上8点...
日期:10-01
苹果头显成功引起兴趣 帕胖:外置电池是正确方向「苹果外接电池使用说明」
在6月29日的一次公开活动中,Oculus的联合创始人帕尔默·拉基(昵称帕胖)公开赞扬了苹果的Vision Pro 头显。帕胖在接受一档播客节目采访时表示,他当初在领导Oculus时,就一直主张像...
日期:06-30
苹果市值10年后再超微软 成全球最大技术公司_微软和苹果的市值
  5月27日消息,据国外媒体报道,根据本周三的市值,苹果已经超过而来微软成为全球最大的技术公司。这是90年代濒临破产的苹果在复兴中达到的一个最新的里程碑。   苹果股票...
日期:07-29
郭明錤预测ipad「苹果分析师郭明錤谈华为归来:迫使苹果走出舒适圈 积极创新」
快科技9月9日消息,苹果分析师郭明錤在社交平台上表示,华为回归对消费者来说是一件好事,这将迫使苹果走出舒适圈并积极创新。他还称,如果没有禁令,华为应该早在2023年就率先使用堆...
日期:09-10
AI前哨|ChatGPT“最强大脑”:黄仁勋的芯片是如何打动马斯克的?
凤凰网科技讯 《AI前哨》北京时间6月15日消息,ChatGPT的火爆出圈离不开英伟达的人工智能(AI)芯片,而英伟达的成功则离不开黄仁勋对AI的豪赌。早在十多年前,黄仁勋就赌定英伟达...
日期:06-16
日本上空现神秘发光环状云 气象专家称并非地震云_日本上空出现巨大飞行物
1月9日,日本富山县黑部市上空出现了一朵形状奇特的云彩,酷似飞碟并散发出光芒,引发当地民众对于“地震云”的担忧。然而,气象专家对此进行了解释和辟谣。据网友辨识,这朵云彩实为...
日期:01-12
苹果生成式 AI「Apple GPT」或明年推出 首先应用于 Siri 和 AppleCare_iso生成器
7月24日消息:苹果公司正参与生成式人工智能的竞争。上周,Mark Gurman 报道了苹果公司的一项重大进展:目前,苹果公司正在全力研发大型语言模型(LLM),并计划最早于明年推出一款生成...
日期:07-24
微软计划在年终展示新一款Windows 8平板电脑的用户界面
  北京时间3月1日消息,周一有消息指出,微软计划在年终展示新一款Windows 8平板电脑的用户界面,其中将包括许多新设计。有报道称这一产品的测试版将在6月底,也就是微软的财年...
日期:07-26
aistarter助手「Tabnine推出AI助手Tabnine Chat 加快代码交付速度」
8月17日 消息:Tabnine 推出了 Tabnine Chat,这是一款企业级的以代码为中心的聊天应用程序,可以让开发人员使用自然语言与 Tabnine 的 AI 模型进行交互。该应用程序可以无缝集...
日期:08-17
利用旅游赚钱新模式「网友发掘最新旅游方式 靠Midjourney V6“游”遍中国」
1月4日 消息:日前,知名博主“快刀青衣”利用Midjourney V6生成了9个国内著名景点的效果图。这些景点包括少林寺、天坛、长城、桂林山水、九寨沟、兵马俑等等。Midjourney官方...
日期:01-04
腾讯地图PC端将于11月11日停止服务:手机App正常运营
腾讯有一项业务终止了!腾讯地图今日在网页版弹窗公告称,PC端将于11月11日停止服务。不过并不是地图服务直接被砍,手机App还在正常运营中,官方也在公告中推荐下载腾讯地图App。另...
日期:10-13
华为mate50最新官方消息「3999元起  华为Mate50E今日开启预售」
中关村在线消息:10月8日上午10:08,主打“创新本色,领势而上”的华为Mate50E即将正式开启预约,10月14日正式开售。华为官方也随手机一同为用户提供了碎屏服务宝、延长服务宝两项...
日期:10-15
华米科技携儿童手表重磅来袭,快乐鸭儿童手表给孩子带来快乐_华为儿童手表新品
  在电子产品越发先进、种类越发多样的今天,使用电子设备已经不仅仅是成人的特权了,小孩子也能戴上专属的儿童手表,尽管儿童手表的娱乐性不如成人智能手表强,然而经过2G、3G...
日期:07-09