您的位置:首页 > 互联网

微软研究人员用儿童故事进行训练:微型语言模型进入成熟期

发布时间:2023-10-09 19:19:57  来源:互联网     背景:

10月9日消息:学习英语并不容易,许多学生都深有体会。但当学生是一台计算机时,有一种方法表现出奇地出色:只需将大量来自互联网的文本输入到一个名为神经网络的巨大数学模型中。

这就是生成式大语言模型(如 OpenAI 的 ChatGPT)的工作原理,这些模型能够在各种主题上进行连贯(尽管不总是真实)的对话,令研究人员和公众在过去的一年中感到惊讶。

但这种方法也有其缺点。首先,将大量文本档案转化为最先进的语言模型所需的训练过程既昂贵又耗时。其次,即使是训练大型语言模型的人们也很难理解它们的内部工作原理;这反过来又使得难以预测它们可能出现的许多问题。

面对这些困难,一些研究人员选择对较小的数据集上的较小模型进行训练,然后研究它们的行为。布朗大学的语言模型研究员 Ellie Pavlick 表示:这就像测序果蝇基因组与测序人类基因组一样。

曝iphone15ultra将采用钛金属外壳

腾讯视频荣耀七夕活动

现在,在最近发布在科学预印本服务 arxiv.org 上的一篇论文中,两名微软研究人员介绍了一种训练微小语言模型的新方法:用儿童故事来训练它们。

机器学习研究人员已经接受了这一教训。驱动 ChatGPT 界面的大型语言模型 GPT-3.5 拥有近 2000 亿个参数,它是在包含数千亿个词汇的数据集上训练的。(OpenAI 尚未公布其继任者 GPT-4 的相应数据。)训练如此大型的模型通常需要至少 1000 个并行运行数周的专用处理器(称为 GPU)。只有少数公司能够调集必要的资源,更不用说训练和比较不同模型了。

这两名研究人员展示了,与今天的最先进系统相比,比这些系统小数千倍的语言模型在这种方式下能够迅速学会讲述一致和符合语法的故事。他们的研究结果暗示了可能有助于训练更大型模型并理解其行为的新研究方向。


返回网站首页

本文评论
企业家专访 | 第29期· 致力构建“安全即服务”新标准(安全服务创新)
  为助力园区企业品牌宣传、打造企业创新生态,中关村东升科技园推出原创栏目《企业家专访》。以“聚焦成长+赋能品牌”为主题,深入了解企业成长历程、角色定位、企业文化等...
日期:06-25
突然!USB 3.0/USB 4被正式取消:命名完全变了_usb命名为何如此混乱
但凡接触过电子产品的朋友,恐怕最熟悉的接口就是USB了。在USB 3.0时代,USB接口的命名开始出现前所未有的混乱,起初是USB 3.0、USB 3.1到USB 3.2这样的演进,后来又被集体更改为US...
日期:10-02
上线开放世界不到5个月,腾讯头部产品出了一个让我意外的玩法「腾讯开放平台官网」
声明:本文来自于微信公众号 游戏葡萄(ID:youxiputao),作者:王丹,授权转载发布。今年3月,腾讯头部大DAU产品《和平精英》终于也开始进军开放世界,在游戏中“内置”了一个名为绿洲世...
日期:08-28
研究发现:苹果App Store中,75%的AI应用程序会共享用户数据「appstore id共享」
6月29日 消息:根据Home Security Heroes 发布的一项新研究,苹果应用商店中四分之三的AI应用程序与第三方共享用户数据。英特尔sapphire京东全民炸年兽活动太火爆其中最严重的...
日期:06-29
Pixel 8系列可能会跟随高端智能手机价格上涨的趋势而涨价「pixel 4 价格」
智能手机行业正在经历一些下滑趋势,因为我们看到出货量放缓,零部件普遍变得比以前更加昂贵。 这导致许多公司提高了高端手机的价格,而且即将推出的 Pixel 8 系列似乎也将加入这...
日期:07-12
五年研发投入超2200亿元,腾讯重回增长曲线
5月17日 消息:2023年一季度,腾讯实现收入1499.86亿元,同比增长11%,数实经济、广告、游戏三大核心业务发力带动公司重回增长曲线。同时腾讯研发开支继续保持高位,本季达到151.81...
日期:05-17
商家被薅羊毛可以投诉吗「一夜损失1000万!又一大商家被薅羊毛」
近期,天猫平台上的361°童装旗舰店,在短短半小时内被薅了二十多万单,商家一夜之间亏损上千万元。7月28日凌晨,由于价格设置失误,361°童装旗舰店,原本三四百的男童运动鞋,可以用几...
日期:08-27
1元可购买5万颗补天石!一男子被判赔偿江南百景图20万_江南百景图买补天石会封号吗
5月26日 消息:据人民法院报报道,《江南百景图》是上海某游戏公司开发的一款古风模拟经营类手游,玩家需要购买特定道具才能体验完整游戏进程。官方渠道上,1元钱可购买10颗“补天...
日期:05-26
11.83亿元_极兔100%完成收购顺丰旗下丰网公司
7月4日消息,据工商资料显示,近日深圳市丰网信息技术有限公司发生工商变更。顺丰旗下深圳市丰网控股有限公司退出股东,新增极兔速递旗下深圳极兔供应链有限公司为股东并全资持股...
日期:09-22
百度PaddlePaddle开源视频分类模型Attention Cluster  曾夺挑战赛冠军(paddlepaddle模型库)
  百度PaddlePaddle   百度深度学习框架 PaddlePaddle 最近开源了用于视频分类的 Attention Cluster 模型。由于拥有卓越的分类能力,它曾助力百度计算机视觉团队夺取了...
日期:06-28
科旭威尔科易星®,多维智能优势,引领会议拍摄新变革
对于政企而言,会议拍摄必不可少,其要求拍摄画质清晰,能够准确记录会议内容,保证每一个参会人员尽可能参与到会议中。而传统会议拍摄依靠人工,很难实现政企多维度的拍摄需求,科旭威...
日期:06-09
“通算一体 云智共融” 中国移动无线通算融合技术研讨会召开_中国移动智能融合终端怎么设置wifi
7月14日,中国移动研究院在贵阳召开以“通算一体,云智共融”为主题的无线通算融合技术研讨会在贵阳召开。来自中国工程院、清华大学、上海大学、华为、中兴、亚信科技、新华三...
日期:07-18
第一网文《斗破苍穹》要拍电影:张涵予饰演萧炎之父「斗破苍穹 萧炎演员」
快科技5月10日消息,电影《斗破苍穹》亮相爱奇艺世界大会,改编自天蚕土豆同名小说。官方文案写道:顶级制作班底、实力派戏骨的强势加盟,一段颠覆乾坤的异世热血之旅即将开启!海报...
日期:05-11
特斯拉与蔚来销量「特斯拉慌了!蔚来CEO李斌再放豪言:明年销量超过雷克萨斯」
12月25日消息,在昨晚的NIO DAY 2022上,蔚来正式发布了新款智能旗舰SUV蔚来ES8和轿跑SUV蔚来EC7,同时还带来了第三代换电站以及500kW的充电桩。今日蔚来CEO李斌在接受采访时表示...
日期:12-25
遥望科技与小冰公司战略合作,推动AI在直播行业持续开发和广泛应用
2023年5月15日,为推动人工智能技术在直播电商行业的持续开发和广泛应用,杭州遥望网络科技有限公司(下称:遥望科技)与北京红棉小冰科技有限公司(下称:小冰公司)签订关于《直播电商人...
日期:05-15
京东物流:“全额保”24小时理赔打款及时率达到99%_京东快递保价理赔
10月28日 消息:近日,京东物流官方表示,“全额保”上线一月以来,24小时理赔打款及时率达到99%,最快一单打款时长仅为13分钟。特斯拉美国德州超级工厂进展9月29日,京东快递全新保价...
日期:10-29
特斯拉超级工厂建设「韩国拟吸引特斯拉建超级工厂 已提交17个潜在选址信息」
12月27日消息:据韩国经济新闻报道,上个月特斯拉CEO马斯克表示,韩国是「特斯拉在亚洲建立另一座生产基地的最佳候选地之一」。自那以来,韩国所有主要地方政府都已准备好成为特斯...
日期:12-27
资产提升超1亿!复盘某银行如何通过5人5月时间运营2万个私域客户
声明:本文来自于微信公众号 LZX的学习笔记(ID:LZX_PM),作者:刘志兴,授权转载发布。自19年以来,私域概念的兴起,越来越多的企业开始关注私域流量;在这个过程当中,随着互联网渠道成本的...
日期:03-24
联发科今年10月实现营收70.4亿元 同比增长38.3%_联发科2019年营收
11月11日消息,联发科日前公布了10月份营收情况。联发科10月实现营收新台币304.39亿元(约合人民币70.4亿元),同比增长38.3%。由于10月工作天数减少,联发科营收较上月下滑19.61%,不...
日期:08-07
168元,苹果中国商城上架贝尔金线:长达30倍耐用_贝尔金 iphone12
苹果中国商城近日上架了一款来自贝尔金的BOOST ↑ Charge Pro Flex USB-A转USB-C连接线,长度为1米,售价为168元,预估发货日期为8-10周。这款连接线具有耐久性和灵活的充电体验,...
日期:10-05