您的位置:首页 > 互联网

阿里达摩院推大语言模型PolyLM:通晓18种语言 拥有1.7B和13B两种参数版本

发布时间:2023-07-18 17:24:02  来源:互联网     背景:

7月18日 消息:最近,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种参数版本可选。

官方的介绍是这样的:

联想小新pro14电脑有什么功能

小米对开门冰箱价格

PolyLM是一个通晓多语言的大语言模型,涵盖中文、英文、西班牙语、法语、德语、俄语、葡萄牙语、意大利语、阿拉伯语、日语、韩语、泰语、越南语和印尼语等18种语言。该模型可以应用于对话问答、文本生成、机器翻译和情感分析等领域,能够自动生成高质量的多语言文本,从而为跨语言、文化的交流提供便利。

据了解,POLYLM 使用了包含640B 个token 的庞大数据集进行训练,数据集来源于维基百科、mC4和 CC-100等公开可访问的资源。

画师会被人工智能取代吗

image.png

研究团队提出了一种课程学习技术,逐渐增加高质量、资源较少的语言在训练中的比例,重点是从英语向其他语言转移通用知识。

团队还开发了一个名为 MULTIALPACA 的多语言指令数据集,用于监督微调阶段。为了评估 POLYLM 的多语言能力,团队还开发了一个基准测试,包括十个任务和十五种语言。研究表明,POLYLM 在非英语语言上的表现优于同等规模的开源模型。总的来说,POLYLM 提供了一个具有多语言能力的开源模型,有助于解决现有模型在非英语语言上的局限性。

团队总结了 POLYLM 的表现:

已经执行了熟练的13B 比例模型,在西班牙语、俄语、阿拉伯语、日语、韩语、泰语、印度尼西亚语和中文等主要非英语语言中表现良好。该模型补充了现有的开源模型,这些模型要么缺乏对这些语言的熟练程度,要么具有较小的版本而没有相同的功能。

提出了一种先进的课程学习方法,有助于将主要通过英语获得的一般知识转移到各种非英语语言和特定的自然语言处理任务(例如机器翻译)。

人们提出了一个名为 MULTIALPACA 的数据集,它补充了现有的教学数据集,使大语言模型能够更好地遵循多语言教学,特别是非英语母语人士的教学。

论文网址:https://arxiv.org/abs/2307.06018

项目网址:https://modelscope.cn/models/damo/nlp_polylm_13b_text_generation/summary

小米12s ultra和华为mate50pro


返回网站首页

本文评论
内存降价也卖不动 美光库存长达214天:最坏的日子还没到
美光公司前几天发布了2023财年Q1季度财报,业绩可以说一片惨淡。截至12月1日,23财年Q1财季中美光营收40.9亿美元,上一季度为66.4亿美元,去年同期为76.9亿美元。盈利方面,美光当季...
日期:12-25
无名最终票房9.31亿元 评价两极分化_无名谁演的
电影《无名》已于4月16日结束公映,灯塔专业版数据显示,该片共上映85天,最终票房为9.31亿元,观影人次达1774.9万。360手机业务并入锤子《无名》由程耳执导,梁朝伟、王一博、王传君...
日期:04-17
解析金鹏信息公安情指行督一体化平台背后的融云通信解决方案
  近年,公安信息化与科技强警是提升公检法机关核心战斗力的有力武器,尤其在重大突发事件面前,以安全稳定、灵活高效的通信体系作为支撑的公安情指行督一体化系统平台发挥了...
日期:10-09
Netflix star_Starz与Netflix内容授权谈判破裂
  9月2日午间消息,据美国科技资讯网站CNET报道,Starz电视网周四宣布,该公司已停止就续签内容授权协议与流媒体服务商Netflix进行谈判,在2012年2月现有合同到期后,将不再向Netf...
日期:07-22
微软 Win10 免费工具集 PowerToys 0.33.1 发布:改善 SVG 图像预览
  3月5日消息 微软免费工具集 PowerToys 今日发布了 v0.33.1 版。新版本的变化是添加一些关键的新功能,改善 PowerToys Run 快捷启动器的易用性。   关键更新日志如下:...
日期:07-16
刚刚 腾讯宣布大变革!互联网开启下一个时代!
今天,腾讯在20岁生日之际,宣布组织架构调整方案:既保持深耕垂直领域的优势和特点,保留原有的企业发......
日期:09-30
调查显示iPhone在果粉生活中比iPad和Mac更重要 维修换新也更快
4月6日消息,据外媒报道,在苹果目前的硬件产品线中,iPhone的销量是最高的,近几年都在2亿部之上,为苹果带来的营收也最多,贡献了苹果近半数的营收。而从国外相关机构最新的调查来看,...
日期:04-06
坚持为用户利益而战!卢伟冰:Redmi焊的门谁能搬得走?「卢伟冰怼iqoo」
今日早间,Redmi官宣Redmi Note 12 Turbo将于3月28日正式发布,随后小米集团合伙人、Redmi品牌总经理卢伟冰针对部分问题进行了回答。对于你焊的门会被搬走吗?”的问题,卢伟冰则霸...
日期:03-24
花了上百亿美元,扎克伯格的元宇宙居然像恐怖片_扎克伯格元宇宙
声明:本文来自于微信公众号 开菠萝财经(ID:kaiboluocaijing),作者毕安娣,授权转载发布。在8月平凡的一天,尴尬的妈妈给尴尬打开门,小札的元宇宙自拍就站在门口,尴尬到家了。事情发...
日期:08-22
理想汽车:第10000辆理想L9正式下线_理想汽车9月交付
9 月 28 日讯:今日,理想汽车宣布,第10, 000 辆理想L9 从常州制造基地下线。iphone15会采用typec接口吗...
日期:10-02
从微信到抖音,从私域到公域:「联联」如何做本地生活服务|服务商对话No.9
声明:本文来自于微信公众号 窄播(ID:exact-interaction),作者|顾 远 监制|庞梦圆,授权转载发布。联联周边游跨越了两个时期、两种生态。初入抖音时,它可以复用此前在微信生态沉淀...
日期:12-14
防止APP窃取用户隐私问题,OPPO安全在行动_防止手机应用窃取你的隐私
  在2020年3·15晚会所曝光的问题中,手机APP窃取用户隐私的情况再度出现。根据央视报道称,部分APP中集成的SDK存在未经过授权窃取用户的个人敏感信息的情况。   OPPO作为...
日期:07-14
NFT史上最大危机?大家却在关心周杰伦(NFT周杰伦)
图源:东方IC摩托罗拉或将于7月28日发布新手机信息   来源:IT时报   作者/崔鹏志   编辑/王昕;挨踢妹;   全球NFT交易的“中道崩殂”仍在蔓延。   今年6月,据加密数据...
日期:07-31
女子穿联名汉服进入迪士尼被拦 官方回应:网友吵翻 说好的穿衣自由呢
穿汉服去迪士尼乐园被拒绝,这是被商家忽悠了吧?近日,一网友在社交媒体平台发帖称,自己去迪士尼时穿了十三余和迪士尼公主联名款的汉服,却被保安拦住无法入园。波音737自动降落该...
日期:06-15
马云美国密会携程高层探讨并购或深度合作
  你知道什么是TAB吗?这是指中国互联网行业最大的三家带头大哥式企业:腾讯、阿里巴巴和百度;这三家公司分别控制着IM、电子上网与搜索市场的大头,而其他互联网企业多多少少都...
日期:07-26
搭载高频版骁龙8 Gen2!红魔8S Pro定档7月15日:170万分安卓天花板「红魔008l怎么样」
努比亚红魔游戏手机宣布将于7月15日下午15:00召开发布会,正式发布新旗舰——红魔8S Pro。作为游戏手机,该机的性能是最大的亮点,据称将搭载高频版骁龙8 Gen2处理器。根据曝光的...
日期:06-26
贾乃亮、傅首尔道歉,董宇辉拉黑,趣店到底为啥惹众怒?
记者/李彪   今日,明星贾乃亮、前《奇葩说》冠军辩手傅首尔通过微博回应了与趣店的合作,并发表道歉声明。此合作系上周举办的“趣店预制菜”抖音直播带货活动。 趣分期属于...
日期:07-31
腾讯马化腾发起的“科学探索奖”首批50位获奖人出炉,每人在未来5年获300万元
  9月20日消息,经过四个多月的评审,2019年“科学探索奖”获奖名单正式向社会公布。这份名单中的50位获奖人是从千余名申报人中评选而出,每位获奖人将在未来5年获得由腾讯基...
日期:02-18
8大角度深入解读联发科天玑9200:真快!真冷!_联发科天玑920和1100
一、CPU首发三大架构、GPU光线追踪飞跃联发科天玑移动平台自诞生以来,一直稳扎稳打,不断向高端、向旗舰迈进,每一代产品都能带来无限的惊喜,让这个市场充满激情与活力。如今,天玑...
日期:11-15
女子推开保护罩让孩子摸文物 管理方:禁止触摸
7月4日消息,陕西西安有网友发视频称,一对母女在大雁塔内推开保护罩伸手触摸石刻。视频显示,母女两人从保护罩缝隙处伸手抚摸石刻,随后又将另一侧保护罩推开触摸。华为发布6g网络...
日期:07-04