您的位置:首页 > 互联网

击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens

发布时间:2024-05-21 19:12:15  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:鱼羊,授权转载发布。

通义千问GPT-4级大模型,直接击穿全网底价!

就在刚刚,阿里突然放出大招,官宣9款通义大模型降价。

其中,性能对标GPT-4的主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,也就是1块钱能买200万tokens,相当于5本《新华字典》的文字量,堪称全球大模型的性价比之王。

更直观一点对比——

Qwen-Long支持1000万tokens的长文本输入,对比GPT-4,价格仅为1/400。

超大杯新品,此番也在降价名单中:刚发布不久的通义千问超大杯Qwen-max,API输入价格也直降67%,低至0.02元/千tokens。

开源方面,Qwen1.5-72B、Qwen1.5-110B等5款开源模型的输入价格也分别直降75%以上。

这波操作,再次击穿全网最低价,可以说是专属大模型企业、程序员的618狂欢了。

1块钱200万token

来看具体降价情况:

本次降价,共覆盖9款通义千问系列模型,商业化模型、开源模型全都在列。

包括:

Qwen-Long,性能对标GPT-4,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅97%;API输出价格从0.02元/千tokens降至0.002元/千tokens,降幅90%。

Qwen-max,在权威基准OpenCompass上性能追平GPT-4-turbo,API输入价格从0.12/千tokens降至0.04元/千tokens,降幅67%。

发邮件到国外邮箱失败

上榜大模型竞技场排名的Qwen1.5系列开源模型方面,Qwen1.5-72B的API输入价格从0.02元/千tokens降至0.005元/千tokens,降幅75%;API输出价格从0.02元/千tokens降至0.01元/千tokens,降幅50%。

与OpenAI的GPT系列相比,降价后的通义千问系列,基本上都是1折购,性价比拉满。

以降幅最大的Qwen-Long为例,价格仅为GPT-4的1/400,性能指标上却并不逊色。

尤其在长文本方面,Qwen-Long支持最长1000万tokens的超长上下文对话,也就是能轻松处理约1500万字或1.5万页的文档。配合同步上线的文档服务,还可支持word、pdf、Markdown、epub、mobi等多种文档格式的解析和对话。

值得关注的是,不同于国内大部分厂商输入输出价格相同的定价方式,这次Qwen-Long的输入价格比输出价格降幅更大。

对此,阿里官方也给出了解释:

现在,用户结合长文本(论文、文档等)对大模型提问已经成为最常见的需求之一,所以模型输入调用量往往大于输出调用量。

根据统计,真实的模型输入调用量一般是输出的8倍左右。我们把用户使用量最大的输入token价格大幅降下去,对企业来说更划算,可以更好地做到普惠。

也是希望大家把长文本用起来。

阿里一出手就是大招

说起来,这已经不是阿里云第一次击穿行业底价。

就在今年的2月29日,阿里云刚刚整过一个云产品“疯狂星期四”的大活儿:全线云产品价格直降20%,最高降幅达55%。

属实是砍自己一大刀了。

如此大手笔,底气来源是阿里云作为国内第一大公有云厂商,在长期技术积累和规模效应下,已经构建起完备的AI基础设施和Infra技术优势。

而此番诚意满满的降价,背后更是显露出大模型应用时代,这种技术红利正在成为公有云厂商的“杀手锏”之一。

在AI基础设施层面,从芯片层到平台层,阿里云已经基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建起了高弹性的AI算力调度系统。

举个例子,PAI支持10万卡量级的集群可扩展规模,超大规模训练线性拓展效率达96%。在大模型训练任务中,达到同样效果可节省超50%算力资源,性能达到全球领先水平。

推理优化方面,阿里云主要提供了三大能力:

其一,高性能优化。包括系统级的推理优化技术,以及高性能算子、高效推理框架、编译优化的能力。

其二,自适应调优。随着AI应用的多样化,一个单一的模型很难在所有场景中都保持最佳效能,自适应推理技术允许模型根据输入数据的特性和计算环境的约束,动态调整推理技术应用和计算资源选型。

其三,可扩展部署。模型推理部署资源的扩展和弹性,能解决推理服务在一定时期内的潮汐现象。

Galaxy A系列

此前,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光也表示,公有云的技术红利和规模效应,会带来巨大的成本和性能优势。

这将促使“公有云+API成为企业调用大模型的主流方式”。

大模型应用时代主流路线:公有云+API

这也正是阿里云把大模型“价格战”再度推向高潮的核心原因。

尤其对于中小企业、创业团队而言,公有云+API一直以来被视作做大模型应用的性价比之选:

尽管开源模型发展势头迅猛,以Llama3为代表的最强模型们更被认为已经有媲美GPT-4的表现,但私有化部署仍然面临着成本高昂的问题。

以使用Qwen-72B开源模型、每月1亿token用量为例,在阿里云百炼上直接调用API,每月仅需600元,私有化部署成本则平均每月超10000元。

除此之外,公有云+API模式还便于多模型调用,能提供企业级的数据安全保障。以阿里云为例,阿里云可以为企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密。目前,阿里云已主导、深度参与10多项大模型安全相关国际国内技术标准的制定。

云厂商的开放性,还能为开发者提供更丰富的模型和工具链选择。比如,阿里云百炼平台在通义千问之外,还支持Llama系列、百川、ChatGLM等上百款国内外大模型,同时提供大模型应用一站式开发环境,可以做到5分钟开发一款大模型应用、5到10行代码即可搭建企业级RAG应用。

量子位智库在《中国AIGC应用全景报告》中提到,AIGC应用产品中,基于自建垂直大模型和API接入的产品占到将近7成。

这一数据同样从侧面佐证了“公有云+API”模式的市场潜力:在应用市场,对业务的理解和数据积累才是破局关键,在公有云+API的基础上做应用,在成本和启动速度方面都是更现实的选择。

实际上,无论是直观的价格之争,还是更深层次的AI基础设施之卷,反映出的都是,当大模型发展焦点逐步从基础模型迈向落地应用,平台厂商如何降低大模型的使用门槛,已经成为竞争的关键所在。

刘伟光指出:

作为中国第一大云计算公司,阿里云这次将主流大模型API输入价格降低97%,就是希望加速AI应用的爆发。

我们预计未来大模型API的调用量会有成千上万倍的增长。

总结起来就是,一方面,对于平台厂商而言,“价格战”背后其实是基础设施、技术能力之争;另一方面,对于整个大模型行业而言,应用是否能持续爆发、进一步普及,入局门槛、运营成本已成关键因素。

如此看来,近来卷起的降价趋势,对于开发者和期待更多大模型应用的胖友们而言,不可谓不是利好消息。

你觉得呢?


返回网站首页

本文评论
10月主机大战落下帷幕:索尼折戟掉至第二 任天堂重回第一宝座
  近日,NPD Group公开了2021年10月的主机市场销量报告,根据这份销量报告,任天堂在上个月成功击败索尼,重新回到了全球主机销量第一的宝座。   在9月份,索尼成功在销量上击...
日期:07-17
小米4骁龙多少「小米14全球首发第三代骁龙8 卢伟冰:首批备货量超上一代一倍」
10月25日 消息:高通在今日凌晨的夏威夷发布会上正式推出了第三代骁龙8旗舰移动平台,而小米14系列将成为首款搭载该平台的旗舰机型。苏宁易购平台模式小米总裁卢伟冰在发布会...
日期:10-25
没有李佳琦,商品会更便宜吗?
声明:本文来自微信公众号“字母榜”(ID:wujicaijing),作者:谭宵寒,,授权转载发布。李佳琦“祸从口出”之后,不止是他,带货主播这个群体,乃至整个直播带货行业,都成为众矢之的。一些观点...
日期:09-24
奢侈品电商第一股寺库人去楼空「寺库奢侈品电商平台」
  来源:北京商报  寺库的危机正在不断浮出水面。8月16日,北京商报记者探访发现,曾经摆满了奢侈品的寺库大厦如今已空空如也,仅剩5层还有部分工作人员,大厦内还专门设立了消费...
日期:10-01
苏宁华硕超品日送意外险,网友:坏成这样也能修?
  1月10日,正值年货节期间,苏宁易购华硕独家启动2020年的第一场超品日,这场超品日除了众多爆款电脑产品享受降价优惠外,此次双方联手独家推出买电脑送意外险,一年内不限次数,任...
日期:05-24
Mac再迎一款3A大作:《死亡搁浅》导演剪辑版上架AppStore
快科技6月7日消息,在早些时候的WWDC 2023直播中,小岛秀夫曾登台,宣布小岛工作室的游戏将登陆Mac平台。适合佳能m100的微单镜头今天,玩家发现《死亡搁浅》导演剪辑版已经上架美区...
日期:06-08
看好中国经济前景 三位前总统加盟一家民企
  2019年1月27日,在鸟巢旁的国家会议中心,天九共享集团迎来了第28个年度盛会,哥斯达黎加前总统何塞·玛丽亚·菲格雷斯、塞尔维亚前总统塔迪奇和比利时前首相莱特姆三位前国...
日期:04-28
挑选家用投影仪一定要选内存大的吗?体验实测,原来内存那么重要
  现在我们挑选家用投影仪的时候,往往都会关注到投影仪的亮度、分辨率,因为这是最能直观体现投影仪画质的两个参数。而实际上,影响投影仪体验的因素可远远不止这两点。亮...
日期:04-01
Redmi K60 Ultra关键参数曝光:1.5K直屏 天玑9200 芯片_redmi k60pro
据数码博主透露,Redmi K60 Ultra将于7月份发布。该款新品采用1.5K极窄边框直屏,并搭载联发科天玑9200 旗舰Soc。相比Redmi K60,Redmi K60 Ultra在屏幕和处理器等方面有很大的变...
日期:06-22
比尔盖茨是美国微软电脑公司的总裁_微软创始人比尔-盖茨:PC就是平板电脑
比尔-盖茨(腾讯科技配图)腾讯科技讯(万学)北京时间5月20日消息,据国外媒体报道,微软创始人兼主席比尔-盖茨(Bill Gates)本周接受英国广播公司(BBC)采访时,面对记者史蒂芬•萨克(Stephen...
日期:07-28
美国大学生追踪马斯克飞机推特帐号被封禁 博主大骂马斯克是“彻头彻尾的伪君子”
12月15日消息,美国大学生威尼因在推特创立机器人帐号追踪亿万富豪马斯克(Elon Musk)等名人的私人飞机动向,成为网络名人。但推特最近暂停了这一帐号。在得知自己的@Elonjet帐号...
日期:12-15
Faraday Future正式宣布交付首辆FF 91给用户_ff 91什么时候上市
8月14日 消息:就在刚刚 FF(Faraday Future)宣布,正式交付首辆FF91 2.0 Futurist Alliance给首位用户,并在8月12日举行了新车首位塔尖用户交付仪式。小鹏汽车 特斯拉 马斯克 怒告...
日期:08-14
腾讯发布Q3财报:全面拥抱大模型,ToB业务收入占比创新高_腾讯财报2020q1
通信世界网消息(CWW)11月15日,腾讯发布2023年Q3财报,当季总营收1546亿元,同比增长10%。其中,金融科技与企业服务(简称“ToB业务”)收入520亿元,同比增长16%,占总营收的34%,创下历史新高...
日期:11-16
微软宣布放弃Win10后出现意外一幕:用户变得更多了!_微软放弃windows7
快科技6月4日讯,来自StatCouters的报告显示,截至5月份,Win10的最新份额达到71.9%。Windows 11则是22.95%,比4月份略有下滑。合计来看,Windows用户中,多达94.85%已经升级到Win10或W...
日期:06-04
能解决多出手指等bug,Meta发布"类人"AI图像创建模型
6月14日消息,美国当地时间周二,Facebook母公司Meta宣布,将向研究人员提供一种新型“类人”人工智能模型组件。这种名为I-JEPA的模型比现有模型更准确地分析和完成未完成的图像...
日期:09-24
土巴兔股票市值_土巴兔赴港IPO铩羽而归  业绩下滑严重或是关键
  近日,互联网家装平台土巴兔被爆赴港IPO受挫,已撤销上市。知情人士透露,其业绩下滑严重或是关键。   招股书数据显示,土巴兔2018年上半年收入2.7亿元,同比下降40.8%,净亏损6...
日期:11-11
小米13系列最便宜新机小米13 Lite来了:安卓灵动岛加持
MWC(世界移动通信)大会定于2月27日到3月2日在西班牙巴塞罗那举办,小米确认,将在2月26日面向海外用户推出小米13系列机型,同日在印度还会举办小米13 Pro专题发布会。除了小米13、...
日期:02-09
如何成为Linus Torvalds(如何成为黑客)
  Linux最初是基于微内核操作系统Minix,也许很多人知道,或者不知道,Linux的创始人Linus Torvalds和Minix的创始人Andrew Tanenbaum曾在新闻组(中文简介)里展开过一番你来我...
日期:07-29
比亚迪新能源老大「黄仁勋猛夸比亚迪:全球最大电动汽车公司」
快科技3月19日消息,在今天的英伟达GTC 2024开发者大会主题演讲中,黄仁勋称比亚迪为全球最大电动汽车公司。黄仁勋表示,英伟达一直致力于推动人工智能技术的发展,而Thor芯片将成...
日期:03-19
Ace 2 原神定制礼盒真机赏析_让香菱与锅巴真正住进手机- 「一加」
4 月 17 日,一加正式发布了倍受用户及《原神》玩家期待的一加 Ace 2 原神定制礼盒。此次一加联动《原神》人气角色香菱,并巧妙提炼出香菱各种元素融入礼盒与手机设计中,打造业...
日期:09-17