您的位置:首页 > 媒体评论

清华团队推出对话机器人ChatGLM 支持在个人电脑上部署和调优「清华机器人视频」

发布时间:2023-03-23 02:02:37  来源:互联网     背景:

IT之家 3 月 22 日消息,在 ChatGPT 的核心团队中,不乏清华大学毕业进入 OpenAI 的开发者,就在 GPT-4 发布的同一天,清华大学顶尖的 NLP 团队,也公开了自研的类 ChatGPT 的大模型 —— 中英双语对话模型 ChatGLM-6B,初具问答和对话功能,现已开启邀请制内测(内测申请网址 http://chatglm.cn),后续还会逐步扩大内测范围。

官方博客中提到,这是一个初具问答和对话功能的千亿中英语言模型,并针对中文进行了优化。该模型基于 General Language Model(GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。

具体来说,ChatGLM-6B 具备以下特点:

充分的中英双语预训练:ChatGLM-6B 在 1:1 比例的中英语料上训练了 1T 的 token 量,兼具双语能力。

优化的模型架构和大小:吸取 GLM-130B 训练经验,修正了二维 RoPE 位置编码实现,使用传统 FFN 结构。6B(62 亿)的参数大小,也使得研究者和个人开发者自己微调和部署 ChatGLM-6B 成为可能。

较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8)和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。

更长的序列长度:相比 GLM-10B(序列长度 1024),ChatGLM-6B 序列长度达 2048,支持更长对话和应用。

人类意图对齐训练:使用了监督微调(Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(RLHF)等方式,使模型初具理解人类指令意图的能力。输出格式为 markdown,方便展示。

因此,ChatGLM-6B 具备了一定条件下较好的对话与问答能力。当然,ChatGLM-6B 也有相当多已知的局限和不足:

模型容量较小: 6B 的小容量,决定了其相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时,ChatGLM-6B 可能会生成不正确的信息;她也不擅长逻辑类问题(如数学、编程)的解答。

可能会产生有害说明或有偏见的内容: ChatGLM-6B 只是一个初步与人类意图对齐的语言模型,可能会生成有害、有偏见的内容。

特斯拉上海超级工厂已经进入试点生产

较弱的多轮对话能力: ChatGLM-6B 的上下文理解能力还不够充分,在面对长答案生成,以及多轮对话的场景时,可能会出现上下文丢失和理解错误的情况。

英文能力不足: 训练时使用的指示大部分都是中文的,只有一小部分指示是英文的。因此在使用英文指示时,回复的质量可能不如中文指示的回复,甚至与中文指示下的回复矛盾。

清华机器人培训机构

易被误导: ChatGLM-6B 的“自我认知”可能存在问题,很容易被误导并产生错误的言论。例如当前版本模型在被误导的情况下,会在自我认知上发生偏差。即使该模型经过了 1 万亿标识符(token)左右的双语预训练,并且进行了指令微调和人类反馈强化学习(RLHF),但是因为模型容量较小,所以在某些指示下可能会产生有误导性的内容。

清华机器人有实体吗

该团队称,一直在探索、尝试和努力,GLM 系列模型取得了一丝进展,但离国际顶尖大模型研究和产品(比如 OpenAI 的 ChatGPT 及下一代 GPT 模型)都还有明显差距。中国大模型研究在原创算法、AI 芯片和产业上的追赶与突破需要大家的一起努力,更需要我们对下一代 AI 人才的培养与锻炼。

清华机器人都开始组乐队了

以上是ChatGLM-6B的对话效果展示。


返回网站首页

本文评论
抖音不跟微信“聊天”「抖音不能说微信」
以黑色为背景色,配以亮绿色的圆形图案,在该圆形中,一道闪电刺破中心,这是2022年12月30日上线的抖音聊天App图标。对于一直想做社交的字节跳动来说,这可谓是为2023年打响的第一枪,...
日期:01-17
罗技入场,宣告“大掌机时代”正式到来?「罗技游戏机」
刚踏入工作之时,小雷曾想买一台Windows掌机,方便在公司外接显示器办公和玩LOL,外出时也能玩玩《失落城堡》《饥荒》之类的单机游戏,结果一看市面上的Windows掌机,只有GPD、壹号本...
日期:09-04
马斯克在推特上推的币_把警告当耳边风 马斯克被爆强推付费认证导致推特失败
凤凰网科技讯 北京时间11月15日消息,据科技新闻网站Platformer报道,就在埃隆·马斯克(Elon Musk)准备推出售价8美元的蓝V付费认证服务Twitter Blue之前,推特内部团队已经警告他...
日期:11-18
精准定位,Meta 或使用 Quest Pro 眼球追踪技术提供个性化广告
  10 月 14 日消息,本周 meta 公司推出了 meta Quest Pro,这是一款新的虚拟现实头显,售价高达 1500 美元(约 10755 元人民币),搭载升级的硬件和先进的功能,还有指向内侧的摄像...
日期:10-22
马斯克要求复工_马斯克把公开给他纠错的工程师开除了
“He’s”fired.”马斯克的裁员大戏还在继续,而最新的这“一集”,矛头直指一名在推特待了6年的工程师。甚至The Verge都这样描述:虽然马斯克已经开除了数千人,但最新的人事变动...
日期:11-30
为苹果多造一块零件 A股电子巨头的心机与辛酸_苹果配件相关股票
5月17日,即苹果iPhone 14发布的四个月前,库克做了两件事:第一,在公司总部接待了前来拜访的越南总理;第二,再次确认了苹果在越南将扩展供应链。新品发布会后不到20天,苹果再次与印度...
日期:10-11
全民理财神器走下神坛,普通人成了理财“白痴”?_全民理财的时代
原标题:人到中年 理财“白痴”作者|金鄞编辑|宋函对于手里的30万现金,刘星不知道该怎么办了。刘星是80后,为了孩子能上一个还算不错的小学,今年他在家里的帮助下买了北京海淀区一...
日期:09-24
35个月超过瑞幸,这家咖啡有股“韭菜味儿”_为什么瑞幸咖啡经常售完
今年的咖啡赛道格外热闹,前有老品牌跨界联名,后有新品牌不断诞生。最近,T97咖啡直播间里的大嘴妹靠着喊麦成为带货界新晋红人。比大嘴妹更出圈的是该品牌的老板李潇,他曾扬言T97...
日期:11-02
宁王最近怎么了_别问 问就是宁王还会涨
文|金融街老李2022年二级市场流行一句话:这是时代的宁德,也是宁德时代。但时代轮回,也许今年的宁德时代还是“宁王”,但长远来说,这个时代终将远去。开年后的第一个交易日,宁德时代...
日期:02-02
英伟达元宇宙平台_英伟达的元宇宙梦想 不止Omniverse
要谈元宇宙,英伟达是避不开的。不管是更真实呈现虚拟世界所需要的光追技术,还是元宇宙所需要的人工智能以及大算力,英伟达都提供了一系列的技术和平台支持。而在今年的英伟达 G...
日期:10-26
双11后还有什么狂购节?_双11第14年了,电商购物节还“灵”吗?
记者 | 李叙瑾编辑 | 倪 妮11月12日凌晨,今年的双11正式收官。从2009年诞生至今,双11战报中最受关注的就是各大电商平台的交易总额GMV,但这个数字在今年消失了。天猫、京东和抖...
日期:11-26
加码直播电商 小红书为“恰饭”奋力一搏「小红书上加v是啥意思」
为了赚钱,小红书真的急了。据《晚点LatePost》报道,小红书近期进行了一轮组织架构调整:直播升级为一级独立部门,由小红书社区生态负责人银时担任一把手;商业化团队则由小红书COO...
日期:03-14
GPT-4震惊四座 中国创业者激战“小模型”
当瓦特蒸汽机的齿轮转动了第一圈;当乔布斯从牛皮纸袋掏出Macbook;当ChatGBT用流畅优美的语言回答第一个问题。科技,曾经、正在、也将改变未来。发布ChatGPT仅三个多月后,OpenAI...
日期:03-16
微信PC版上线聊天记录迁移功能「新版本微信聊天记录迁移」
  8月26日消息,今天,微信PC版推送3.7.6版更新,正式上线聊天记录迁移功能,该功能允许用户将聊天记录在移动端和PC端之间迁移。更新后,用户可以在微信PC端菜单中选择“迁移和备份...
日期:08-27
极氪汽车主页_极氪动力系统故障频发遭车主集体投诉
凤凰网《风暴眼》出品作者|任清编辑|张涛核心提示:1、2月以来,多位极氪车主向凤凰网《风暴眼》爆料称,自己购买的汽车极氪001存在严重安全隐患,多次出现动力系统故障,无法行车,影响...
日期:02-11
李开复亲自下场 筹组ChatGPT中文版AI新公司
这也是创新工场塔尖孵化的第7家公司。微商主动出击该聊什么文丨猎云精选 ID:lieyunjingxuan作者丨王非谁能再救威马一次歌词ChatGPT爆火,引无数“英雄”竞折腰。美团王慧文、...
日期:03-21
留给寒武纪的时间还有多久?_寒武纪至今
寒武纪的亏损还在继续扩大。近日,寒武纪披露了2022年业绩预告。公告称,2022年,寒武纪实现营业收入72,500万元到75,000万元,较上年同期略有增长;归属于母公司所有者的净利润预计亏...
日期:02-26
棉花被和羊毛被_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:11-26
低价之外 京东还需要更多武器「京东还有价格保护吗」
燃次元(ID:chaintruth)原创作者 | 冯晓亭编辑 | 饶霞飞北京时间3月9日晚间,京东( JD.US;09618.HK )公布了未经审计的四季度和2022年全年财务业绩报告。总的来看,业绩表现要高于市场...
日期:03-11
消费市场刮起“精致量贩”风_精致消费指什么
作者|白露声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。比亚迪半导体上市进程最近,“18元5片土豆”和“汉堡越来越小了”两个话题先后登上网络热搜。而...
日期:02-26