您的位置:首页 > 互联网

利用合成数据微调ChatGPT超越GPT-4摘要性能 降低63%成本和提升11倍速度

发布时间:2023-10-12 01:14:07  来源:互联网     背景:

文章概要:

- 利用链式密度提示微调ChatGPT在新闻摘要任务上超过GPT-4零样本表现,接近GPT-4链式提示。

i36300多少钱

- 通过ScoreStringEvalChain和改进的PairwiseStringEvalChain等自动评估链实现人类水平的量化评估。

- 微调ChatGPT比GPT-4零样本快11倍且便宜63%,比GPT-4链式提示快33倍且便宜84%。

10月11日 消息:近日,Elicit公司机器学习工程师Charlie George在LangChain博客上发表文章介绍了他们使用合成数据微调ChatGPT在新闻摘要任务上超越GPT-4的研究成果。

文章提到,尽管GPT-4被公认为世界上最强大的语言模型,但其调用限制、高成本和高延迟也限制了其实际应用。为解决这一问题,一些开发者转而使用ChatGPT等小模型,但小模型的表现通常不如GPT-4。文章介绍了微调的思路,即调整模型参数以更好地适应具体任务,但收集人类标注数据昂贵且耗时,而传统评估指标如困惑度也无法准确反映用户体验。

为解决数据问题,采用了一种合成数据生成方法,即使用GPT-4通过链式密度(CoD)提示逐步改进其生成的摘要。然后,使用LangSmith平台收集这些改进后的摘要作为训练数据,微调ChatGPT。

在评估方面,文章认为传统的BLEU和ROUGE指标往往不能准确捕捉现代语言模型的细微差异。相比之下,人工评估虽可靠但耗时耗力。最佳方案是开发自动化评估系统,但也需要人工验证其有效性。研究者已经开发了与真人高度一致的自动化评估链ScoreStringEvalChain和PairwiseStringEvalChain。

说明:经过微调的 ChatGPT 超越了 GPT-4零样本,并接近带有 CoD 的 GPT-4

说明:经过微调的 ChatGPT 比 GPT-4零样本快11倍以上,比带 CoD 的 GPT-4快33倍

鞭炮怎么画简单又漂亮

经过微调的 ChatGPT 比 GPT-4零样本便宜63%,比带 CoD 的 GPT-4便宜84%

结果显示,相比GPT-4零样本,微调后的ChatGPT在新闻摘要任务上的表现优于前者,几乎达到GPT-4链式提示的水平,但其速度提高11倍,成本降低63%。与零样本GPT-4相比,微调ChatGPT在双样本评估中获胜率达96%。

分析称,合成数据微调展现了增强语言模型能力的巨大潜力。LangChain提供了创建复杂链条和迁移到小模型的完美工具。自动化评估为快速可靠地评估实际表现提供了有效手段。这为新一代AI应用大规模部署提供了路径。


返回网站首页

本文评论
“数学废柴”也能考进前三!作业帮初中数学给你196个逆袭大招
  “数学废柴”的转身   山东青岛的初二学生周博,过去一年多,数学一直比较差。   “班上的同学总说我在数学上是个废柴。”周博说自己的情况从初一后变得糟糕。他回...
日期:09-02
忆恒创源估值「喜讯频传!忆恒创源获FiberHome2022核心合作伙伴奖」
作为是国内领先的企业级SSD产品及技术服务提供商,北京忆恒创源科技股份有限公司(以下简称“忆恒创源(Memblaze)”)高度重视对研发人才的吸引、培养与留用,确保研发团队稳定,为持续...
日期:04-06
苹果A17 Pro命名思考, 明年iPhone 16要用残血版A17!_苹果a14残血版
苹果在9月13日凌晨发布了全新的iPhone 15系列,其中Pro系列的升级备受瞩目! 全球首款消费级3nm工艺的芯片,还有业内少见的四重反射潜望式镜头、钛金属边框以及光线追踪的加入等...
日期:10-06
共27款游戏获批,国家新闻出版署发布2023年进口网络游戏审批信息_2020年进口网络游戏审批
【】3月20日消息,据国家新闻出版署网站消息,2023年进口网络游戏审批信息公布,共27款游戏获批。安卓手机所有品牌名单显示,网易《劲舞团:全民派对》、腾讯《庄园合合》、B站《闪耀...
日期:10-06
贾跃亭在ff还有股份吗「贾跃亭FF交付三辆后又没钱了!因产量问题再次申请融资」
快科技9月28日消息,近日,法拉第蔚来新任CEO Matthias Aydt上任后,在致全体股东的一封信中表示:在过去一年的时间里,法拉第在FF91的开发上取得了显著的进展。目前,法拉第已经做好了...
日期:09-28
不输ChatGPT 国产AI大模型开测:为中文优化、支持国产CPU训练_十佳国产模型
ChatGPT今天升级了GPT-4模型,AI能力更加强大,国内在这方面也在迅速追赶,有国歌国产版ChatGPT问世了,现在清华大学教授唐杰宣布由该校AI成果转化的ChatGLM开始内测。据介绍,对话机...
日期:03-15
4090Ti没了!消息称英伟达准备新版RTX 4070/4060:GPU缩水 不到2千?
快科技7月28日消息,有消息人士透露,英伟达还在准备新版的RTX 4070和RTX 4060,不过GPU的核心有所调整,那么售价进一步走低的话,你会购买吗?按照爆料人kopite7kimi的说法,英伟达会用...
日期:07-28
小红书的买手电商能走通吗?
声明:本文来自于微信公众号奇偶派(jioupai),作者:范文,授权转载发布。继抖音、京东之后,小红书也宣布了平台的双11计划。9月26日,小红书举办2023小红书双十一电商伙伴动员会,公布了今...
日期:10-11
乐视回应被贾跃亭起诉:乌龙事件_乐视网是贾跃亭的吗
最近,贾跃亭起诉乐视”话题冲上了热搜,引发网友热议,有网友表示大水冲了龙王庙,自家人不认自家了?”youtube视频流量阿里巴巴在家办公乐视今日对此事件进行澄清,称贾跃亭先生起诉...
日期:11-08
阿里达摩院开源开放域文本理解大模型SeqGPT_阿里达摩院ai算法
8月30日 消息:阿里达摩院宣布,自研开放域文本理解大模型登陆魔搭社区。SeqGPT是一个不限领域的文本理解大模型。无需训练,即可完成实体识别、文本分类、阅读理解等多种任务。...
日期:08-30
蔚来秦力洪:9 月 15 日发布新EC6,9 月 21 日发布 NIO Phone
IT之家 9 月 5 日消息,第二届“蔚来商业资源合作伙伴大会”于 9 月 4 日在巢湖之滨的合肥洲际酒店举行。hdd和机械硬盘微粒贷需要注意什么此次蔚来汽车邀请了 500 多家商业合...
日期:09-05
今天七夕节 你知道鹊桥相会要多少只喜鹊吗?专业解答:33亿亿只
快科技8月22日消息,今天是农历七月初七,也就是我国传统的的情人节七夕节。也被称为乞巧节、女儿节等,发源于甘肃省西和县一带,最早的七夕乞巧民俗出现于汉代,经过唐宋时期的发展,...
日期:08-22
中国最好高中联合!全国高中C9联盟成立 向清华北大输送人才_c9联盟是哪些高校口诀
近日,由国内9所顶尖高中发起,在浙江省宁波市成立了新时代中国卓越高中发展共同体。三星s23详细参数配置苹果计划将iPhone产量提升30%共同体是由浙江省镇海中学、河北衡水中学...
日期:03-15
车价要涨「汽车该涨价吗?行业利润艰难:同比下降30%」
快科技8月28日消息,乘联会秘书长崔东树撰文称,2023年7月,汽车行业利润率5.0%,总利润407亿元,同比下降30%。2023年1-7月的汽车行业收入53148亿元,同比增12%;成本46378亿元,增12%;利润2...
日期:08-28
淘宝网已开始对违规乞讨的店铺进行清理了_淘宝网已开始对违规乞讨的店铺进行清理
  “要钱有理,致富无罪”,一家名为阿潮专业网络乞讨旗舰店大张旗鼓地在淘宝网上行乞。   以往人们对乞丐的印象大多是衣衫褴褛地跪在大街上,不过,像阿潮专业网络乞讨旗舰店...
日期:07-27
高德地图上线北斗卫星定位查询系统「高德地图 北斗导航」
11月17日消息,近日,高德地图上线了北斗卫星定位查询系统,用户在定位导航时可查看当前所调用的北斗卫星数量,以及具体编号、方位角、高度角、频点、信号强度相关详细信息。除此之...
日期:11-28
笔记本排行_evo认证笔记本排行
笔记本电脑已成为人们日常生活不可或缺的电子设备之一。面对众多品牌和型号,选择一款功能强大、性能稳定的笔记本电脑成为了许多人的共同问题。本文将收集相关信息,整理出排行...
日期:06-03
三星 Galaxy S23 FE 手机现身跑分平台,搭载 Exynos 2200 处理器
IT之家 7 月 7 日消息,一款型号为“SM-S711B”的新机今日现身 Geekbench 6 OpenCL 跑分平台,成绩为 8986 分,预计为即将推出的三星 Galaxy S23 FE 手机。正如此前曝光的消息一...
日期:07-08
免税版iPhone 14 Plus售价6790元 便宜200元_iphone13免税价格
中关村在线消息:iPhone 14 Plus已经正式发布,首销当日即破发,被评价为最不保值的苹果机型。海南免税店起售价为6790元,256GB售价7665元、512GB售价9410元。对比官方售价,便宜200...
日期:10-12
【爆料】小米日本官宣:12 月 8 日将举行新品发布会_小米官宣造
小米将于 12 月 8 日在日本举行新品发布会,小米日本官方推特描述「说是新品,但年年都一样没意思」。不过小米日本此次发布会上推出的新品并非小米 13 系列,而是 Redmi Note11T...
日期:12-06