您的位置:首页 > 互联网

280万大模型中文开发者拿到最后一块拼图_国内模型大神

发布时间:2023-12-01 22:49:00  来源:互联网     背景:

声明:本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:油醋,授权转载发布。

2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。

那时候Meta的Llama已经开源4个月,但一些国内的开发者发现,从小以英文语料喂养起来的Llama,对中文世界并不友好。

这未来的“10亿”开发者里会有多少中文开发者,这个问题难以预测,但至少已经有755万人了。

图源备注:图片由AI生成,图片授权服务商Midjourney

755万人,这是2021年在GitHub上注册的中国程序员数量,现在的程序员一定会是未来大模型的第一批开发者。

有很多人已经是了。

在浙江省电力设计院工作的陶佳,尝试用一个开源的大模型来做基于私有知识库的检索问答类应用。他所面对的场景很特殊,经常需要从几十万甚至上百万字的文档中查找内容。陶佳的专业是电力系统控制优化,里面有一些结合了传统数学方法和AI方法的领域,因此对AI有基本认识,也从去年底就一直在关注着这波大模型的浪潮。

他试了几款,试下来通义千问是最好的。“准确,而且‘手感’很好,没有那些稀奇古怪的bug”,他说。

要做的事也很简单。有一些基本的软硬件基础后,在家里买个服务器、扔三四块显卡上去,下载通义千问、让它在服务器上运行,再搞个FRP反向代理,从阿里云上买最便宜的30多块钱一个多月的服务就行,这样就能通过外网访问家里的服务器,在单位里也能用通义千问做实验。

当一个开源生态开始成型,这样的开发者也逐渐变多。

开始闭环的开源生态

陶佳对大模型最深处的期待来自一个终极问题:人类能否成为上帝?

拼模型模拟器

美国的未来学家库兹韦尔在2015年曾经提出过这种可能性。库兹韦尔的想象里,人类到2030年将能够成为半机器人。通过在脑中植入纳米机器人,人类将能够直接接入互联网,智力将变得更高,并且将拥有幽默、音乐和爱等美好的天赋和能力。人类将成为像上帝一样的完美存在。

那一年OpenAI刚刚建立,但8年前库兹韦尔的设想放到现在仍然有相似的地方,只不过现在看起来好像在一个机器人(Agent)中加入意识和人性,这条路好像更近点——也就是AGI。

但哪怕技术是爆炸、是跃迁式的,现在离AGI还很远。如果说AGI会再造一个新的世界,那当下人类对大模型的期待,仍然是在现实基础上改造世界。而这首先需要建立在我们知道这个世界是什么样子的,哪里需要被改造。世界真实的声音需要被听到,建立一条通道非常重要。

大模型时代的开源,意义就在这里。来自不同现实场景,又具有代码能力的人们需要一个广场,来让技术主动和场景对齐,然后具有代表性的产品才能够出现。

这个广场要供大家交流用,还要有充沛且价格合适的算力资源,同时也需要足够丰富的可调用模型来做选择。开发者要的是这样一个闭环的开源生态,通义千问的优势开始显露出来。

算力是关于大模型所有想象力的基础。通义千问背后的阿里云拥有国内最强的智能算力储备作为基础设施支持。其智算集群可达最大十万卡GPU规模,这意味着在阿里云上可以承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。

苹果5s用一天

而在4月,阿里云在推出通义千问的同时,也宣布了史上最大幅度的一次降价,对比上一代主售产品最高可下降40%的同时,还开放了计算、存储、数据库、机器学习等核心产品免费试用的机会。这为大量新涌入的AI开发者提供了尝试和试错的机会。

在阿里云的算力支撑下,像陶佳一样的开发者开始带着“野心”涌入魔搭社区。

去年11月的云栖大会上,阿里云与CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,在社区上线同时贡献了300多个AI模型,全面开源开放,其中超过1/3为中文模型。上线一年后,魔搭社区上的AI开发者数量已经超过280万人,AI模型超过2300+,下载超过1亿+。

随着大模型的热潮转向Agent,魔搭社区在今年9月推出了AI Agent开发框架ModelScope-Agent,并且搭建了一个“打样产品”ModeScopeGPT,它可以调用社区里众多AI模型的API,然后自主完成人类布置的任务。这个ModeScopeGPT 的调用量已经超过了40万次。

除了通义千问之外,Llama2、智谱AI、百川智能甚至最新推出大模型的零一万物等近百款开源模型目前都已经进入社区。并且“目前中国有一半大模型企业跑在阿里云上”,阿里云CTO周靖人在2023年云栖大会上这样说的时候,魔搭已经是此刻国内规模最大、用户最活跃的AI模型开源地。

正在扩展的参数量

小米6屏幕oled

12月1日,阿里云举行通义千问发布会,开源了通义千问720亿参数模型Qwen-72B。在参数量上这是目前国内主流视线中最大的开源大模型,而在能力上,Qwen-72B的性能已经在测试中超越开源标杆Llama2-70B。

Qwen-72B的训练基础是3T tokens的高品质数据,它采用了更多的参数和训练数据,实现了全面的性能提升。这个模型延续了通义千问预训练模型的卓越表现,在10个权威测评中取得开源模型中的最佳成绩,并在某些评测中超越了非公开的GPT-3.5和GPT-4。

在英语任务方面,Qwen-72B在MMLU基准测试中获得开源模型中的最高分。在中文任务中,它在CEVAL、CMMLU、Gaokao等评测中领先,甚至超过了GPT-4。在数学推理领域,Qwen-72B在GSM8K、MATH评测中远超其他开源模型。同时,在代码理解任务上,通过HumanEval和MBPP评测,Qwen-72B展示了显著的进步,其代码能力实现了质的飞跃。

从8月初开始,Qwen-7B和Qwen-7B-Chat两款开源模型在魔搭社区上线开始,通义千问自身的模型开源开始提上日程。8月25日,以Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力大规模视觉语言模型 Qwen-VL开源。

Qwen-VL开源的一个月之后,阿里云在9月25日开源了通义千问百亿级的参数模型Qwen-14B及其对话模型Qwen-14B-Chat。这款模型在性能上开始第一次看向Llama-70B,加上前几款开源的模型,一个多月时间内在开源社区的下载量突破100万,在性能和可用性的平衡上,70亿和140亿参数的尺寸也是对开发者最友好的。

但当这个大模型开源生态开始走深,开发者对模型的性能上限有了更高的要求,也就需要更大参数的模型。Qwen-72B开始吸引到一些初创团队的目光。

“我对72B的模型抱有非常大的期待,好奇72B在我们领域中的能力极限值。”

颜鑫是华东理工大学X-D Lab(心动实验室)的成员,X-D Lab实验室之前的研究方向包括社会计算与社会智能、群体智能与隐私保护、公共卫生与舆情监测、工业智能与智能系统等方面,大模型出现之后,开始聚焦AI情感计算领域。

基于开源的通义千问基座模型,颜鑫和其他团队成员陆续开发了心理健康大模型 MindChat(漫谈)、医疗健康大模型 Sunsimiao(孙思邈)、教育/考试大模型 GradChat(锦鲤)三款垂直领域大模型,现在已有超过20万人次使用过这三款大模型,累计提供了超过100万次的问答服务。

考虑到计算资源的限制以及一些客户对于私有化部署的需求,颜鑫表示目前团队在提供问答服务时7B或14B尺寸的大模型是更合适的选择,但在更开放的学术探索上——比如如何利用联邦学习算法处理数据——Qwen-72B有着前者不具备的性能优势。

而开源模型参数量的向上探索,未来也有机会推动ModelScope-Agent这样关于如何接近AGI的畅想更接近现实。

此前在阿里从事大数据业务近7年的秦续业,现在身份是未来速度Xorbits联合创始人&CEO。Xorbits打造了企业级的分布式推理框架Xinference。通过Xinference,开源模型可以降落在个人用户和开发者的个人电脑上,企业用户能够在计算集群上轻松部署并管理模型,享受私有化部署带来的安全、定制化以及低成本。

秦续业表示,如果外接知识库做问答应用,通过大模型召回一些数据,放到上下文中进行总结,最后给出有用的回答,那么小尺寸(10B以下)的模型是够用的。如果需要具备一定的逻辑推理能力的模型,20-30B的中等尺寸模型是比较好的选择。

“但在Agent或者需要强大推理能力的场景中,70B+的大模型会更有优势。”

AI Agent是秦续业远处的期待,但他同样也是个现实主义者。眼下把模型用起来是更重要的事情,所以Xorbits已经攻克的焦点,是让通义千问跑在一台Mac电脑上。

秦续业觉得这一点能击中很多人。因为很多开发者都是用Mac电脑,他们直接在本地拉起Qwen系列模型,可以极大提升开发效率。

Qwen系列的全尺寸完善不止一个72B的大参数模型。与Qwen-72B同步,阿里云此次开源了通义千问18亿参数模型Qwen-1.8B和通义千问音频大模型Qwen-Audio,至此,通义千问开源光谱已经了覆盖从18亿、70亿到140亿、720亿参数的4款大语言模型,以及视觉理解(Qwen-VL)、音频理解两款多模态大模型。

大模型的开源生态,这是AI时代最终能够汹涌而来的一味药引。周靖人对通义千问的定位是“AI时代最开放的大模型”,现在打点好一切,静待开发者入场了。


返回网站首页

本文评论
软通动力:iSSMeta数字仿真推演平台获软博会银奖,以工业仿真为核心,重塑虚拟制造
(原标题:软通动力:iSSMeta数字仿真推演平台获软博会银奖,以工业仿真为核心,重塑虚拟制造) 8月31日至9月2日,以“塑造软件新生态,赋...
日期:09-05
总比爆雷的世界500强好-董明珠回应“格力落榜世界500强”「格力在不在世界500强」
【】8月20日消息,格力电器董事长兼总裁董明珠首次就格力电器今年从2023年《财富》世界500强的榜单中落榜一事进行了公开回应。据媒体报道,在一档访谈节目中,当被问“难过吗”时...
日期:09-16
iphone12pro max销售量「iPhone 14 Plus遇冷 Pro版却卖爆 销售额甚至上涨」
中关村在线消息:iPhone 14系列开售近一个月,Pro系列愈加火热,与此相对的是iPhone 14 Plus最高降价已经达到了千元级别。根据Sandalwood电商市场监测数据,系列四款机型之间的销售...
日期:10-14
女子退烧后发现银手镯变黑了 真是排毒?网友科普秒懂_银手镯怎么突然变黑了,在排毒吗
近日,河北廊坊三河一女子退烧后,发现佩戴的银手镯变黑”了,这让她非常的惊奇,莫非自己排毒了?银饰品会变黑,这其实是因为发汗的原因。是硫化作用!因为银离子与硫离子间有很大亲和力...
日期:12-17
英国ai芯片公司「外媒:英国计划斥资1.3亿美元购买数千颗高性能人工智能芯片」
8月21日消息,据外媒报道,为了在全球计算能力竞赛中迎头赶上,英国首相里希·苏纳克(Rishi Sunak)计划斥资1.3亿美元(1亿英镑)购买数千颗高性能人工智能(AI)芯片。据外媒报道,这笔资金将...
日期:08-21
技术领先,追求卓越 | 新华三S12500R融合交换路由器荣获IT168“2022年度技术卓越奖”
  近日,紫光股份旗下新华三集团推出的S12500R融合交换路由器,凭借良好的技术性能与出色市场表现,在业界知名IT垂直门户媒体IT168的年度评选中脱颖而出,荣获“2020年度技术卓...
日期:07-10
oppo三折叠手机「OPPO Find N3 Flip首销破纪录:3.26英寸竖向折叠屏」
OPPO Find N3 Flip在行业首销日的销量和销售额均创下了新纪录,成为小折叠手机的佼佼者。该款手机的起售价为6799元。 OPPO Find N3 Flip延续了上一代的设计,配备了一块3.26英...
日期:09-11
部分商户停用落榜购物卡
  9月1日“大限”前一天,央行终于公布了第二批第三方支付企业牌照名单,上海银联、联动优势等13家企业分获不同种类的业务许可牌照。   然而,这仅仅是163家申请企业中的一...
日期:07-22
免费加速器哪个比较好?这几款真的超级香的「免费加速器哪个比较好?这几款真的超级香」
白嫖一时爽,一直白嫖一直爽~(游戏也不例外)今天,就来给大家推荐几款非常不错的免费加速器,身边小伙伴用过都直呼真香。第 一款:突突加速器刚出来没多久,官方宣称是纯免费加速。支...
日期:04-11
还敢买吗?iPhone 15 Pro系列用户又中招:烧屏再现 没法直视
iPhone 15的烧屏问题你遇到了吗,又有国外用户吐槽这事了。10月17日消息,有国外iPhone 15 Pro Max 用户发现主屏幕应用程序的图像被烙印在显示屏上,而有不少用户也在苹果论坛反...
日期:10-17
完善产业数字化发展,京东数科用科技引领前沿_京东宣布构建数智化社会供应链
  近日,记者从京东数字科技控股有限公司(以下简称京东数科)获悉,,京东数科完成了猫酷科技并购,旨在深度拓展购物中心数字化服务领域,完善产业数字化,届时估值也会进一步...
日期:07-15
Meta携手Hugging Face和Scaleway共同支持开源项目
**划重点:**1. 育碧买的dlcsteam不能玩...
日期:11-10
腾讯在港股价「腾讯港股盘中跌超3% 股价跌破350港元」
2 月 22 日讯:截至发稿,腾讯控股跌超3%,股价跌破 350 港元,总市值3. 34 万亿港元。卢伟冰晒Redmi K40强大的续航特斯拉涨价10000卢伟冰红米K50...
日期:03-01
AI视野:Stability AI发布大模型Stable Beluga;美图推数字人生成工具DreamAvatar;谷歌DeepMind推水印工具SynthID
Stability AI发布开源大语言模型Stable BelugaStability AI发布开源大语言模型Stable Beluga,并基于它开发Stable Chat聊天机器人,采用解释微调技术进行优化,允许用户通过网页...
日期:08-31
网易云歌曲发布审核「QQ音乐、网易云音乐下架李易峰作品 个人介绍无法搜到」
  9月11日,李易峰相关消息公布后,多品牌紧急宣布与李易峰解约,包括真果粒、Prada普拉达、六福珠宝、京都念慈菴、HONMA高尔夫等等。  而现在包括QQ音乐、网易云音乐、芒果...
日期:09-14
荣耀70手机促销仅2199:立减500 24期免息「国庆节荣耀手机会降价多少」
荣耀70手机现在立减500元了,在国庆节旗舰这个活动就开始了,而由于由于用户的热情不减,8+256G仍然立减500元,促销将一直持续下去,并且接连双十一的促销,现在到手只要2199元了。而荣...
日期:10-22
创新力时代变革中的苹果和OpenAI_iphone创新成功的原因
文/王慧莹编辑/子夜硅谷,很久没有如此备受期待了。当地时间11月6日,早上八点多,旧金山市区内SVN West会场门口已经人头攒动,全球各地开发者聚集在一起,准备参加一场科技行业跨时...
日期:11-11
IDC数据称iPad和亚马逊分别统领平板电脑及电子书市场_亚马逊iPad
  北京时间1月19日,据国外媒体报道,来自IDC的数据称,苹果iPad统领了平板电脑市场,其第三季度的销售量占同期所有平板电脑销量的90%,而亚马逊则占据了电子阅读器市场41.5%的份...
日期:07-25
马斯克称xAI人工智能将与特斯拉、推特密切合_马斯克 人工智能芯片多久完成
7月15日 消息:特斯拉CEO马斯克日前谈及其刚成立的xAI人工智能公司的愿景和计划。他表示,xAI将与推特和特斯拉展开密切合作,旨在“理解宇宙”。据了解,马斯克在推特上进行了长达...
日期:07-15
越来越不省心!大量用户反馈苹果手机自动关机 iPhone 15也在列
快科技10月11日消息,iPhone真的用起来越来越不省心了,一些老用户反馈了新的问题。tik tok三星iphone x屏幕有划痕怎么解决据9to5Mac等多个外媒报道称,已经有不少网友反馈,自己的...
日期:10-11