您的位置:首页 > 互联网

秒懂生成式AI—大语言模型是如何生成内容的?

发布时间:2023-09-21 10:09:09  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?

要想了解这个,我们就不得不先跳出大语言模型的领域,来到机器翻译这里。传统的机器翻译方式,还是采用RNN 循环神经网络。

循环神经网络(RNN)是一种递归神经网络,以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接。

释义来源:文心一言

就“我画一幅画”这句话而言,它会先将其拆分为“我”、“画”、“一幅”、“画”四个词,然后递进式一个词一个词对这句话进行理解翻译,像是:

然后输出:I have drawn a picture.

这种方式简单直接,但因为 RNN 自身的线性结构导致其无法对海量文本进行并行处理,运行缓慢,另外还会有“读到后面忘了前面”,使 RNN 在处理长序列时会出现梯度消失或爆炸的状况。

直到2017年,Google Brain 和 Groogle Research 合作发布了一篇名为《Attention Is All You Need》的论文,该论文为机器翻译处理提供了一个崭新的方式,同时起了一个与《变形金刚》相同的名字——Transformer。

Transformer 是一种神经网络,它通过跟踪序列数据中的关系来学习上下文并因此学习含义。该模型在2017年由 Google 提出,是迄今为止发明的最新和最强大的模型类别之一。

释义来源:文心一言

老人手机5G

Transformer 能对海量文本进行并行处理,因为它使用的是一种特殊的机制,称为自注意力(self-attention)机制。就像我们在进行长阅读时,大脑会依靠注意力选择重点词进行关联,从而“略读”后对文章更好的理解,该机制的作用就是赋予AI这项能力。

self-attention 是一种注意力机制,它通过对输入序列进行线性变换,得到一个注意力权重分布,然后根据这个分布加权输入序列中的每个元素,得到最终的输出。

释义来源:文心一言

同样还是“请注意垃圾分类”这句话,同样是被分成“我”、“画”、“一幅”、“画”四个词,在 Transformer 中它们会经历输入、编码器(encoder)、解码器(decoder)、输出四个阶段。

具体来看,当句子拆解后输入到编码器(encoder)中,编码器会先对每个词的生成一个初始表征,可简单理解为对每个词的初始判断,比如“画”是名词,也可以是动词。

然后,利用自注意力(self-attention)机制计算词与词之间的关联程度,可以理解为进行打分,比方第一个“画”与“我”的关联程度高就给打6分,第二个“画”与“一幅”的关联也高打8分,“我”与“一幅”没什么关联就打-2分。

接着,根据打分对先前生成的初始表征进行加工,第一个“画”与“我”的关联程度高,那就可以降低表征中对名词词性的判断,提升动词词性的判断;第二个“画”与“一幅”的关联程度高,那就可以降低表征中对动词词性的判断,提升名词词性的判断。

最后,将加工过的表征输入到解码器(decoder),解码器(decoder)再根据对每个词的了解结合上下文,再输出翻译。在这期间,每个词与词之间都可以同时进行,大大提高了处理速率。

可这样的 Transformer 和大语言模型有什么关系呢?

大语言模型本就是指使用大量文本数据训练的深度学习模型,而 Transformer 正好能为大量文本数据训练提供足够的动力。另外,在加工过的表征输入到解码器(decoder)后,能依靠这些表征推断下一个词出现的概率,然后从左到右逐字生成内容,在这个过程中还会不断结合先前已生成的这个词共同推断。

verizon版手机在中国能用吗

比如根据“一幅”、“画”这两个词推断出下一个词是“风格”的概率最大,再兼顾“一幅”、“画”与“风格”推断下下个词是“水墨”,以此类推再下下下个词,下下下下个词,这才有了我们看到的大语言模型的内容生成。

这也是为什么大家普遍认为,大语言模型的诞生起点,就是 Transformer。

那么,Transformer 中最关键的自注意力(self-attention)机制是如何知道“打多少分”的呢?

mate30pro戴口罩人脸识别

这是一套比较复杂的计算公式:

作简单理解的话,可以想想数学课本上关于向量的知识,当两个向量 a 和 b 同向,a.b=lallb|;当 a 和 b 垂直,a.b=0;当 a 和 b 反向,a.b=-lallbl。

如果把这里的 a、b 两个向量,看作是“我”、“画”、“一幅”、“画”四个词当中的两个在空间中的投射,那 a 乘 b 的数值就是打分。

  • 这个数值越大,两个向量的方向越趋于一致,就代表着两个词的关联程度大;

  • 数值是0,那就是两个向量垂直,同理词之间就没有关联;

  • 数值是负数,那两个向量就是相反,两个词不但没关联,还差距过大。

苹果手机闪电接口

只是这是简单理解,在现实中还需要一套纷繁复杂的计算过程,并且还需要多次的重复,才能获取到更加准确的信息,确定每个词符合上下文语境的含义。

以上就是大语言模型的工作原理了,强大 Transformer 的实用性还不止于在自然语言处理领域,包括图像分类、物体检测和语音识别等计算机视觉和语音处理任务也都有它的身影,可以说 Transformer 就是是今年大模型井喷式爆发的关键。

当然,Transformer 再强也只是对输入的处理过程,要想生成式 AI 生成的内容更符合我们的需求,一个好的输入是重要前提,所以下一期我们就来聊聊什么是好的输入,Prompt 又是什么?


返回网站首页

本文评论
蔚来10月交付量5055台创纪录  新车型EC6交付883台(蔚来ec6月供)
11月2日,TechWeb从蔚来官方获悉,蔚来10月共交付新车5055台,创品牌单月交付数新高,同比翻番,并自今年3月以来连续第8个月实现同比增长。这是蔚来月度交付数首次突破5000台,也是中国...
日期:08-02
新疆沙漠公路旅游攻略「新疆移动成功开通沙漠公路超远覆盖5G基站」
2023/5/30 10:10 新疆移动成功开通沙漠公路超远覆盖5G基站 人民邮电报  陈姚 林正 近日,在位于新疆巴音郭勒蒙古自治州轮台县的塔克拉玛干沙漠,中国移动新疆公司开通了首...
日期:05-30
htc 最新手机「See U Soon!HTC预热U系列智能手机」
今天,HTC宣布开始预热U系列新智能手机。5年前,HTC将部分移动业务出售给谷歌,后者用于建立Pixel产品线。尽管去年推出了Desire 22 Pro元宇宙手机,但未得到市场认可。现在,HTC再次...
日期:05-07
“网络安全大神“郑文彬(MJ)现身安全峰会 新创公司赛博昆仑已获红杉种子、真格基金投资
  由前360集团首席技术官郑文彬(MJ)创立的安全公司“赛博昆仑”,近日迎来行业首秀。   7月30日,在第七届MOSEC移动安全技术峰会(以下简称MOSEC)上,北京赛博昆仑科技有限...
日期:12-13
MIUI 14即将登场 产品经理:目标是重回「miui总监」
今日消息,小米产品经理魏思琪与网友互动时表示,MIUI 14目标时重回巅峰。此前MIUI负责人金凡称MIUI 14目标之一是要做最精简轻巧的旗舰手机系统 。不难看出,这次MIUI 14将会对系...
日期:11-27
苹果14会涨价吗「iPhone 14 Plus人气低迷:爆料称苹果砍去近40%订单」
DigiTimes 援引多个供应链和渠道商的消息称:由于在推出后不到两周的销量很是低迷,苹果已向制造商发去通知,将该机型的产能大幅砍掉了近四成。此外正如组件出货量变动所暗示的那...
日期:10-21
共同战“疫”,通付盾在行动(携手共同战疫)
  新型冠状病毒疫情的发展牵动着每一个国人的心,疫情前线激战正酣,为了打赢“新型冠状病毒疫情”攻坚战,通付盾积极响应党中央、国务院号召,第一时间成立公司应急工作小组,迅...
日期:11-03
腾讯向股东派发9.58亿股美团股票,腾讯总裁刘炽平卸任美团董事「腾讯持有美团多少股份」
2022年11月16日消息,腾讯控股公告显示,将按合资格股东持有每10股股份获发1股美团B类普通股的基准,向于记录日期名列本公司股东名册上股东按彼等当时各自于本公司之持股比例,以实...
日期:11-25
IDC预计到2026年50%终端将搭载硬件AI引擎功能「idc2021」
通信世界网消息(CWW)随着近年来人工智能的快速迭代与发展, 数据大模型日益完善。AI的场景化落地成为未来发展的重要突破口,终端的AI化也成为了AI发展与落地的重要支持方向。IDC...
日期:07-25
iphone 12 mini 小不小「「iPhone 12 mini要凉 「小屏爱好者哭了」」」
来源:中关村在线苹果首款mini机型—iPhone 12 mini在2020年推出时,厂商大力宣扬5.4寸手机的优点。然而,现在苹果却决定停产mini系列。这是为什么呢? 在iPhone 12 mini发布后,...
日期:09-17
大学生找家教的app_良师家教APP打造不一样的大学生家教信息平台
  暑假来临,对于中小学生来说,尽情玩乐和假期作业总是一起出现。对于做家教的大学生而言,意味着有更多时间社会活动、勤工俭学。各类家教兼职群里也热闹起来,特别是大学生家...
日期:11-02
比亚迪1月销量151341辆,同比增长58.6% 市占率接近四成
2月2日消息,比亚迪日前公布了2023年1月销量成绩单。数据显示,比亚迪汽车1月销售151341辆,同比增长58.6%。其中,EV纯电车型71338辆,DM混动车型78826辆。苹果今年秋季发布会1月王朝...
日期:02-02
2999元起!一加Ace 2 Pro发布:骁龙8 Gen2加持「一加8t和ace2评测」
一加Ace 2 Pro正式发布,售价方面分别为2999元、3399元和3999元。该机搭载高通骁龙8 Gen2移动平台,最高内存配置为24GB,是目前市场上内存最大的骁龙8 Gen2手机。为了充分发挥大...
日期:08-17
三星最新黑科技芯片发布,手机越用越慢或将成为历史!「三星下一代芯片」
从去年开始,全球手机市场出现了大萧条,各个品牌的手机销量均出现了大幅下滑。今年关于年轻人为什么不愿意换新手机的话题也多次上了热搜,对于大家为什么不愿意换新手机的原因,网...
日期:09-06
上海东方有线被指霸王收费 不缴欠款不停机(东方有线 上家欠费)
  近日,家住汾西路的黄女士连续向本报维权热线反映东方有线收费不合理、账单收不到等问题。《IT时报》记者就此做了调查。   2010年3月,黄女士所在小区进行数字电视整体...
日期:07-22
联想坐稳一哥:PC市场份额高达42.3% 再创历史新高「联想pc业务的现状」
11月15日,联想中国区召开2022/23上半年财年(4-9月)总结大会。会上,联想集团执行副总裁兼中国区总裁刘军表示,克服重重不利因素,PC市场份额保持稳定,销售额市场份额再创历史新高达42...
日期:11-16
全国“扫黄打非”办公布2010年度工作十大数据_2017扫黄打非
  这十大数据包括:   4437万件——截至目前,全国共收缴各类非法出版物4437.3万件。其中,淫秽色情出版物98.1万件,侵权盗版出版物3734.6万件,非法报刊392.7万份。   1.6万...
日期:07-25
领航信息文明 赋能高质量发展——中国移动发布2022年可持续发展报告
通信世界网消息(CWW)6月15日,中国移动发布2022年可持续发展报告,这是中国移动连续17年发布可持续发展报告。报告以“领航信息文明 赋能高质量发展”为主题,围绕“至诚尽性,成己达...
日期:06-15
淘宝商城遭对手挖角:腾讯当当趁乱抢中小商户
  10月14日上午消息,在淘宝商城(微博)依然陷于与中小卖家的对峙中时,其竞争对手则高调向中小商户抛出橄榄枝:腾讯商城表示保证金费用远低于淘宝、并且不收技术服务年费。而...
日期:07-23
人机对话能否跨越“心灵沟通”之坎
  对话嘉宾  黄民烈(清华大学计算机系副教授、中文信息学会自然语言生成与智能写作专委会副主任)  刘 群(华为诺亚方舟实验室语音语义首席科学家、国际计算语言学学会会...
日期:08-27