您的位置:首页 > 互联网

阿里云大模型全家桶来了!测通义千问2.0,打败8成Python用户_阿里云datahub

发布时间:2023-11-01 22:11:36  来源:互联网     背景:

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

作者 | 三北
编辑 | 漠影

时隔六个月,阿里云对标GPT-4的大模型终于来了!

iphone中国销量 全球市场占比

今日,在2023云栖大会上,阿里云推出千亿级参数大模型通义千问2.0,它在多个测评中综合性能超越GPT-3.5,加速追赶GPT-4。

比如,智东西实测用基于通义千问2.0的智能代码助手解决一个Python问题:“返回所给字符串中最后一个单词的长度”的需求,输出结果在权威测试平台力扣上验得正确,直接击败了83.17%的Python3用户。



▲智东西用通义灵码通过权威代码测试平台的测试

同时,阿里云扔出一个AI全家桶,从IaaS(基础设施即服务)、PaaS(平台即服务)和MaaS(模型即服务)全方位秀出“肌肉”:

1、加速追赶GPT-4,千亿级参数的通义千问2.0发布,通义千问APP和官网全新上线。

2、基于通义大模型训练的8大行业模型组团上线。

3、发布一站式大模型应用开发平台阿里云百炼,开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型。

4、一年时间,魔搭社区模型下载量已突破1亿,累计为开发者贡献了3000万小时的免费GPU算力。

5、作为中国最早开源大模型的科技巨头,阿里云坚定开源开放,预告将开源通义千问720亿参数版本。

6、阿里云宣布给中国所有大学生每人送一台云服务器。

7、阿里云人工智能平台PAI全新升级,中国大模型公司有一半跑在阿里云上。

周靖人对智东西等媒体说,全球AI浪潮才刚刚开始,我们笃定这次的转型是深远的。本次AI技术变革的本质,是背后整个计算机技术体系的全面升级。

那么面向AI浪潮,阿里云的大模型产品及服务实力如何?作为全球第三、国内第一大云服务厂商,阿里云又在AI基础设施方面有哪些布局准备?

通过对话周靖人,并实测通义千问2.0的新品,智东西对此进行了深入探讨。

一、加速追赶GPT-4,千亿级参数通义千问2.0来了

“相比于GPT-3.5有很大的胜利,相比GPT-4.0各有胜负。”这是阿里云官方对其今日正式发布的通义千问2.0的评价。

在MMLU、AGIEval、C-Eval等10大主流测评集上,通义千问2.0综合性能超过GPT-3.5,加速追赶GPT-4。自今年4月通义千问大模型发布以来,二代版本已经迭代至千亿参数规模级别,在复杂执行理解、创作、数学、逻辑等能力上实现进化。

通用测评集很重要,实际使用的体感也很重要。

今日,阿里云通义千问APP正式发布,支持通义千问2.0所有人可用,智东西第一时间对其进行了体验。

当智东西体验通义千问2.0时,首先感到惊喜的是图片理解能力。当我输入一张照片及“请描述图片”的提示词,通义千问言简意赅地描述了图中有海水、青山、蓝天、船、年轻人等要素。

▲基于通义千问2.0的图片理解功能体验

当我一步追问照片中涉及的海域,通义千问通过图中的长尾船,推测出正确答案——泰国的海域,这令我十分震撼,因为一般人都很难分辨出来。这一图像识别能力和推理能力结合,正是通义千问2.0新增的多模态交互技术升级。

▲基于通义千问2.0的图片理解功能体验

同样值得一提的是对逻辑要求更高的编程,当智东西输入一个SQL编程需求,要求其解答“计算表t中b字段的count distinct值,按照a字段分组,有哪几种实现方法?”,通义千问立马给出了答案,同样是一个正确答案。

▲基于通义千问2.0的SQL编程

然后我找了一个程序员朋友给它上了个难度。

将代码在本地运行以后就出现了这个小游戏:

而在文本的输入和生成上,我感觉通义千问2.0的学习能力和生成效果更好了。

比如,当让通义千问2.0帮我写一份直播剧本,给它一个机械键盘的直播剧本给其参考,将直播的商品定为现代汉语词典,通义千问2.0可以输出一份直接可用的直播剧本,不仅符合直播要求,还结合词典产品本身特点。据悉,背后是理解、记忆、逻辑等能力的综合应用。

▲通义千问2.0生成的直播带货剧本

通义千问2.0可以用于日常的文本扩写,比如将“构建未来智能网络,是推动AI发展的重大需求。”扩写,其输出结果提及了“设备、系统、数据及用户”几个重要对象,整体逻辑也没有太大问题,不过仍有一些“废话文学”。

▲通义千问2.0文本扩写功能

不仅能扩写,通义千问2.0也能玩梗,比如一些比较新的网红用语“栓Q”、“早F晚E”,都能够解释地清楚明白。

▲通义千问2.0“玩梗”

▲通义千问2.0“玩梗”

用通义千问2.0助力写社交媒体文案,比如我让它用小红书风格,写一篇“青岛爬崂山”的文案,只要参考提供的提示词模板说清楚了需求,就能够获得非常贴合需求的内容。

▲用通义千问2.0撰写小红书稿件

实测发现,通义千问2.0在体验中“智商”和“情商”都提高了。阿里云相关人士称,背后通义千问2.0基于更大的参数规模和更先进的对齐技术,在复杂指令理解、文学创作能力、通用数学能力、知识记忆、幻觉抵御等能力维度上表现优异。

二、8大行业模型组团上线:百行代码AI数秒生成,对话机器人具备人格

大模型要在应用体感中检验效果,阿里云本次推出了八大行业模型,圈定了金融、医疗、法律、软件、个性化创作等八个领域,为行业带来降本增效或体验升级。

▲通义大模型家族全面升级

以大模型竞赛中的“上甘岭”、工作难度大的代码编程场景为例,智能代码助手通义灵码支持“不到1分钟居然生成了贪吃蛇的小程序”、“几秒钟生成100多行代码”,“不懂编程的运营员也能写前端页面”,有望大大解放软件业开发效率。

▲智能编程助手通义灵码

在智东西的体验中,我亲身感受到了通义灵码在代码上的“天赋”。比如我提出“返回所给字符串中最后一个单词的长度”的需求,通义灵码写出了正确答案。在权威测试平台力扣验证,灵码写的代码被判定正确,并击败了83.17%的Python3用户。

▲智东西用通义灵码通过权威代码测试平台的测试

华为哪些手机可能升级鸿蒙3.0

个性化角色创作平台通义星尘也独具特色。用户通过通义星尘能够生成的定制化机器人对话,就像在和一个个性鲜明的真人在对话。同时通义星尘支持定义第三方角色,用户将人之前的对话素材给到大模型,就能够快速生成个性化角色。

工作学习AI助手通义听悟累积用户已超100万,每天处理音视频达5万余个。

周靖人告诉智东西,阿里云的真正目不是为了做C(消费者)端应用,而是为了把大模型能力释放给广大开发者及客户。阿里云将提供网页嵌入、API与SDK调用等集成方式,加速应用落地。

三、掀起大模型技术平权革命:5分钟就能开发一个大模型应用

阿里云测评

本次大会上,阿里云还发布了一站式大模型应用开发平台阿里云百炼,不仅支持阿里云通义千问系列大模型,还支持更多第三方大模型,是一个助开发者降低大模型开发门槛的工具链。

▲阿里云百炼平台

通过阿里云百炼,开发者可在5分钟内开发一款大模型应用,几小时“炼”出一个专属模型。通过一键选用、二次训练,或通过“拖拉拽”的方式,用户就能进行应用开发,大大提高了开发效率,并能保障安全。

目前,央视网、朗新科技、亚信科技等企业已率先在阿里云百炼上开发专属模型和应用。

朗新科技是一家电力能源消费领域的头部企业,基于阿里云百炼平台成功训练出了一款电力行业专属大模型,开发“电力账单解读智能助手”“电力行业政策解析/数据分析助手”,为客户接待提效50%、降低投诉70%。

除了阿里云百炼外,本次云栖大会上,阿里云还亮出了全新升级的人工智能平台PAI,可以极大提升企业训练和推理大模型的效率。据了解,PAI底层采用HPN 7.0新一代AI集群网络架构,支持10万卡量级的集群可扩展规模,大规模训练线性拓展效率高达96%,远超业界水平;大模型训练中,可节省超50%算力资源。

值得一提的是,基于人工智能平台PAI,目前国内已有一半大模型企业跑在阿里云上。据悉,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业和机构都在阿里云上训练大模型。

百川智能CEO王小川分享了“半年发7款大模型”背后不为人知的成功原因。其中就离不开云计算设施的支持。王小川说,百川和阿里云进行了深入合作,在双方的共同努力下,百川很好地完成了千卡大模型训练任务,有效降低了模型推理成本。

AI产业化逐步深入,得算力者得天下。随着推理需求未来爆发,阿里云有望为AI大模型产业化落地提供更好的底座支持。

结语:阿里云AI全宇宙爆发,AI基础设施全面进化

随着百模大战进入深水区,互联网巨头、AI创企及行业龙头纷纷交出了最新答卷。本次阿里云不仅推出最新通义千问大模型版本,还推出了八大行业大模型、大模型应用开发平台,并从AI基础设施层面全方位布局,本次发布可谓阿里云的AI全宇宙爆发。

AI技术变革的本质,是背后整个计算机技术体系的全面升级。大模型研发与落地是一个系统工程,只有强大的云计算体系才能炼出高质量的大模型,促进国产AI的进一步发展。


返回网站首页

本文评论
手机维修报出天价?维修手机不如上爱回收严选买二手手机_修手机的回收手机吗
年底各个手机企业纷纷发布手机,不过消费者对这些新机关注度不高,倒是对国产手机的保修价格高度关注,不少国产手机的保修价格甚至超过了苹果,对此消费者又该如何应对呢?手机维修...
日期:01-09
充电宝太坑了「网售充电宝不合格率超35%:不合格充电宝长时间充电可致爆炸」
快科技6月25日消息,国家市场监督管理总局最新发布的网售移动电源产品质量监督抽查结果显示,抽查不合格率达35.4%。报告指出,这些不合格的移动电源有的容量虚标问题突出,有的则存...
日期:06-26
支持支付宝的浏览器_支付宝联合微软推出定制版IE浏览器
  第三方支付平台支付宝日前联合微软推出支付宝定制版IE浏览器,以解决网上消费过程中的安全和便捷性问题。   双方表示,未来双方在手机互联网和手机支付方面也将进一步探...
日期:07-24
三星最新款w24flip震撼上市承袭尊贵基因 绽放璀璨光华 心系天下三星W24-Flip
来源:中关村在线时间是经典的试金石,举凡经典之作,绝非昙花一现的短暂辉煌,而是历经岁月洗礼而魅力不减。心系天下三星W系列经历十六代传承,标志性的设计风格、出色的使用体验,以...
日期:11-29
诺基亚新款智能手机有哪些「诺基亚新款智能手机」
最近,诺基亚又推出了一款新款智能手机。这款手机名为诺基亚 X20。从外观上来看,它的造型与很多其他手机差不多。但是它的内部配置却非常出众。下面我们来看看它的一些具体特点...
日期:05-30
破天荒?腾讯鼎力支持华为,鸿蒙成功适配微信,外媒:事情闹大了
你一定听说过“缺芯少魂”四个字吧?毋庸置疑,“芯”肯定代表的是芯片,“魂”呢?实际上,“魂”代表的就是操作系统。由于中国科技起步晚,在很多前沿科技领域都处于落后水平。尤其芯...
日期:10-07
RTX 4090游戏性能实测:《守望先锋:归来》8K跑到520帧「2070守望先锋帧数」
随着RTX 4090显卡正式解禁,Tech Chap率先测试了其在8K分辨率下,游戏的实际性能表现。长虹电视能安装电视直播软件吗根据测试数据,在《守望先锋:归来》中,RTX 4090能够实现8K分辨...
日期:10-13
​美团拿出52亿元发奖金
声明:本文来自于微信公众号电商报Pro(ID:kandianshang),作者:老电 ,授权转载发布。 美团最新激励计划,价值60亿港币美团又开始向员工“发福利”了。近日,美团在港交所发布公告,开启新...
日期:04-18
京东众筹:10月10日起将暂停运营_京东众筹成立时间
10月8日 消息:近日,京东众筹发布公告称,10月10日起将暂停运营。印度CPU据悉,京东众筹于2014年7月1日上线,是京东金融旗下的一个互联网众筹平台,为用户提供智能科技、生活美食、智...
日期:10-11
电动两轮车日均起火近50辆 80%都是这三种情况引发_两轮电动车起火原因
两轮电动车因为方便、经济,成为城市通勤首选交通工具。不过,电动车的充电安全问题,特别是起火事故,也愈发引人关注。2019安卓对比苹果神舟十二号航天员进驻空间站小米全球用户数...
日期:11-26
Midjourney、DALL-E AI绘画提示词指南:250个提示词启发创意_提示语简笔画
什么是文本到图像的提示? AI绘画生成器Midjourney和DALL-E都是基于自然语言描述(文本到图像的提示)中生成逼真视觉和艺术的人工智能系统。他们使用文本-图像的数据集,对GPT-3的...
日期:03-24
贾玲成功减肥100斤 AI人工智能快速减肥应用有哪些?_贾玲减肥成功是真的吗
最近关于贾玲成功减肥 100 斤的报道,这是关于个人健康和生活方式改变的一个积极故事。贾玲的减肥成功展示了她对于个人健康的重视和坚持不懈的努力。这个成就不仅对她自己的...
日期:01-11
新能源车减免购置税条件「单车不超3万-2026年再减半 新能源汽车购置税减免政策正式出台」
6月21日消息,财政部税务总局工业和信息化部发布关于延续和优化新能源汽车车辆购置税减免政策的公告。对购置日期在2024年1月1日至2025年12月31日期间的新能源汽车免征车辆购...
日期:09-23
OpenAI CEO重申尚未开始训练GPT-5 还有很多工作需要做
6月8日消息,据外媒报道,在3月14日推出新一代的自然语言处理模型GPT-4之后,OpenAI何时会推出下一代的模型也就备受关注,在马斯克、沃兹尼亚克上千名业内人士及知名人士签署公开信...
日期:06-08
WDCC 2022世界设计之都大会开启元宇宙分会场
要加快推进世界知名“设计之都”建设,打造国际国内原创设计的首 发地,优 秀设计的产业转化高地,构建多元共赢的创意设计生态圈。——《上海市国民经济和社会发展第十四个五年规...
日期:09-16
员工发朋友圈吐槽公司被解雇 要求赔16万!法院如此判决_吐槽公司的朋友圈
员工吐槽公司各种问题,结果被开后要求赔偿,法院判决,不支持员工的赔偿诉求。据北京法院审判信息网披露的判决书显示,耿某某原系北京某医院有限公司员工,2020年4月30日,耿某某在朋...
日期:07-17
哪吒销量2020「哪吒9月销量破1.8万台 100万内最好轿跑哪吒S订单超15万台」
10月1日,哪吒汽车公布9月交付数据,哪吒U+V”交付量18005台,同比增长134%;1-9月累计交付111190台,同比增长168%。其中,哪吒V车系交付11935台,同比增长138%,有望连续12个月获造车新势...
日期:10-04
iPhone SE4曝光:6.1寸刘海屏预定真香机_苹果se刘海屏
iPhone 14被指诚意不足而且定价偏高,或许你可以考虑一下iPhone SE4了。据Display Supply Chain Consultants(DSCC)分析师罗斯·杨(Ross Young)称,第四代iPhone SE将采用6.1英...
日期:10-15
华为Mate60 Pro 正式开售:1000元订金预售,超1TB内存可选「华为mate60多少钱」
华为官方网站近日正式上架了华为Mate60 Pro+,这款手机现已支持1000元订金预售,提供16GB+512GB和16GB+1TB两种版本。同时,华为Mate60 Pro+的核心配置信息也已全面公布。在影像系统方...
日期:09-08
华为手机内存升级计划怎么样「华为手机存储空间升级活动上线:可享 8.8 折,342 元起」
IT之家 6 月 2 日消息,华为推出手机存储空间升级活动,活动期间可享 8.8 折优惠,价格 342 元起,活动时间 6 月 1 日到 8 月 31 日。以华为 Mate30 手机 6GB+128GB 版本为例:在主板...
日期:06-03