您的位置:首页 > 互联网

Mistral携微软引爆小语言模型潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

发布时间:2023-12-18 11:03:22  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。

最近,小语言模型忽然成为热点。

本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral8x7B模型。

这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3.5打平,因此迅速在开发者中赢得了一片称赞。

之所以叫Mixtral8x7B,是因为它结合了为处理特定任务而训练的各种较小模型,从而提高了运行效率。

这种稀疏专家混合模型并不容易实现,据说OpenAI在今年早些时候因为无法让MoE模型正常运行,而不得不放弃了模型的开发。

紧接着,就在第二天,微软又发布了全新版本的Phi-2小模型。

跟Mistral的70亿参数比,Phi-2小到可以在手机上跑,只有27亿参数。相比之下,GPT-4的参数达到了一万亿。

Phi-2在精心挑选的数据集上进行了训练,数据集的质量足够高,因此即使手机的计算能力有限,也能确保模型生成准确的结果。

虽然还不清楚微软或其他软件制造商将如何使用小型模型,但最明显的好处,就是降低了大规模运行AI应用的成本,并且极大地拓宽了生成式AI技术的应用范围。

荣耀4X发布会

这是一件大事。

Mistral-medium代码生成完胜GPT-4

最近,Mistral-medium已经开放内测。

有博主对比了开源的Mistral-medium和GPT-4的代码生成能力,结果显示,Mistral-medium比GPT-4的代码能力更强,然而成本却只需GPT-4的3成!

总价来说就是:

1)Mistral会始终完成工作,完成度很高;

2)不会在冗长的解释性输出上浪费token;

3)提供的建议非常具体。

第一题,编写用于生成斐波那契素数的PyTorch数据集的cuda优化代码。

Mistral-Medium生成的代码严肃、完整。

而GPT-4生成的代码,就差强人意了。

浪费了很多token,却没有输出有用的信息。

最新的苹果手表怎么选择

然后,GPT-4只给出了骨架代码,并没有具体的相关代码。

第二道题:编写高效的Python代码,将大约10亿个大型Apache HTTP访问文件摄取到 SqlLite数据库中,并使用它来生成对sales.html和product.html的访问直方图。

Mistral的输出非常精彩,虽然log不是CSV格式的,但修改起来很容易。

GPT-4依旧拉跨。

此前,这位博主测试过多个代码生成模型,GPT-4一直稳居第一。

而现在,把它拉下宝座的强劲对手Mistral-medium终于出现了。

虽然只发布了两个例子,但博主测试了多个问题,结果都差不多。

他建议:鉴于Mistral-medium在代码生成质量上有更好的体验,应该把它整合到各地的代码copilot中。

有人按照每1000token算出了输入和输出的成本,发现Mistral-medium比起GPT-4直接降低了70%!

的确,节省了70%的token费用,可不是一件小事。甚至还可以通过不冗长的输出,来进一步节省成本。

华硕b660m-k主板上的接口介绍

参考资料:

https://www.theinformation.com/articles/the-rise-of-small-language-models-and-reinforcement-learning

https://twitter.com/deliprao/status/1734997263024329157


返回网站首页

本文评论
李斌:蔚来明年销量目标超过雷克萨斯_蔚来汽车的市场战略
作为中国造车新势力的领军品牌,蔚来汽车在高端豪华新能源汽车市场已经站稳了脚跟。2022年年初至今交付106,671辆汽车,同比增长31.8%,同比超3成的增长率,远超国内车市大盘,对于202...
日期:12-25
含4000条“突然加速”投诉,特斯拉被曝大规模数据泄露_特斯拉官方调查结果
据外媒报道,荷兰数据监管机构表示,特斯拉可能存在数据保护漏洞。据了解,该信息由德国勃兰登堡州的监管机构移交荷兰方面,位于勃兰登堡的数据保护中心称此次数据泄露“规模巨大”...
日期:09-26
行业首发一表双待!荣耀手表4正式发布「荣耀最新款智能手表」
快科技7月12日消息,今晚荣耀Magic V2折叠屏发布会上,荣耀手表4正式发布,定位续航最长的独立通信智能手表。荣耀手表4基于eSIM通信首次加入MagicRing信任环,提供行业首发的一表双...
日期:07-12
胡歌新电影来了 本人回应“未来五年不拍戏”:经常会自我矛盾
8月28日消息,近日演员胡歌发微博:如果未来五年我不拍戏了,去做一些更有意义的事情,你们应该会支持我的吧?”这条微博引发了网友热议,胡歌在《不虚此行》电影沙龙上对这条微博做出...
日期:08-29
语音微博iPhone版发布 真实社交更安心
  10月5日,由梦想兄弟推出的移动网络社交工具语音微博1.4.0正式登陆苹果App Store。新版本在延续了以往版本各种好玩的功能的基础上,优化了系统的响应速度,免去了以往iOS系...
日期:07-23
便利蜂盘点专员_不做“甩手族” 便利蜂高峰期9成顾客主动收盘
  小的便利店里藏着城市文明的大课题。记者近日在东三环附近的一家便利蜂意外发现,很多就餐的年轻人都会在餐后主动端走餐盘,将垃圾倒入店内的垃圾桶,方便其他顾客用餐。  ...
日期:11-07
“你的iPhone信号怎么样”上热搜 网友在评论区疯狂开火_你的信号怎么这么差
  【手机中国新闻】每年苹果推出新iPhone都会出现不一样的槽点,但有一点雷打不动,那就是信号问题。不仅如此,iPhone的信号问题可谓是微博热搜榜的“常客”。10月13日,手机中国...
日期:10-16
字节跳动或将在科创板上市 相关部门已经联系
  2月22日消息,据香港《南华早报》报道,消息人士表示,抖音运营商字节跳动或将在上海证券交易所科创板上市。   据悉,知情人士透露,相关部门已经联系了该公司,希望其在科创板...
日期:02-17
李佳琦遭多方围攻背后 底价协议是否构成垄断?
近期,李佳琦因涉嫌"二选一"以及底价协议问题被卷入争议。这场风暴中,涉及电商平台、头部主播和品牌商家之间的复杂纠纷。一方面,有人指责李佳琦签署了底价协议,影响其他商家的定...
日期:10-26
美国新高铁时速仅200公里,也能上热搜,为啥美国修高铁那么难?_美国修高铁为什么慢
说起来你可能不信,号称世界上科技最发达的国家,美国竟然连开通一条普通的高铁都能上热搜——而且速度还比我们慢很多。当地时间9月22日,佛罗里达州的亮线铁路公司迈阿密和奥兰...
日期:09-25
淘宝直播发布《商家成长经营指南》_淘宝网店直播
9月30日消息,淘宝直播依托今年宝藏好店主打的“五力模型”推出《商家成长经营指南》,旨在帮助不同层级的商家成功打通成长力、货品力、内容力、流量力、粉丝力五大方面中的“...
日期:10-06
突然“爆雷”!2万亿科技巨头暴跌超13%,市值一夜蒸发3300亿元!啥情况?
截至美股周二收盘,因业绩指引不及预期,万亿科技巨头甲骨文(ORCL)遭到市场猛烈抛售,盘中大跌超13%,创2020年3月以来最大盘中跌幅,总市值蒸发461亿美元(约合人民币3363亿元),最新市值为2...
日期:09-13
京东11.11手机狂促限时加码 iPhone,14直降600元
来源:中关村在线京东11.11手机狂促限时加码,iPhone 14直降600元,小米24期免息。同时,iPhone 13也在京东自营旗舰店有优惠活动。此外,在该活动中还有其他好价单品可供选择。例如Re...
日期:10-24
流量正悄悄转移,中国厂商应尝试出海新渠道__国内企业出海
(原标题:流量正悄悄转移,中国厂商应尝试出海新渠道) “广告业就是这样,人们往哪里移动,广告预算就会相应去到哪里。疫情期间消费...
日期:09-15
iphone 14上市日期「苹果官网显示iPhone 14 Plus最初被命名为「iPhone 14 Max」」
9月29日消息:新发现的苹果网站上将iPhone14Plus称为「iPhone14Max」,这表明这是最初打算用于低端6.7英寸设备的名称,后来苹果公司在短时间内改变主意。据荷兰博客iCreate所发...
日期:09-30
Buddy Compiler打通LLaMA 2端到端推理
要点:vivo X80 ProLLaMA2端到端推理打通!结合 MLIR 和 PyTorch 的编译生态,中国团队展示了 Buddy Compiler 的前端部分实现,可以覆盖 LLaMA 计算图,进行 MLIR 转换和部分优化。...
日期:11-23
谁还在抢着做「旅游」这门苦生意?「旅游城市做生意」
声明:本文来自于微信公众号 真探AlphaSeeker(ID:deep_insights),作者:李静林,授权转载发布。旅游生意不好干已不是什么新闻。根据文旅局发布的数据,2022年上半年国内旅游总人次为...
日期:10-03
欢太科技是什么平台_欢太科技有限公司解析互联网服务发展趋势
  近年来,互联网促进了开放共享发展,便捷化的“互联网+”出行信息服务、全天候的指尖网络零售模式、“一站式”旅游在途体验、数字化网络空间学习环境、普惠化在线医疗服务...
日期:04-27
中国联通智网创新中心荣获“2023自智网络优秀解决方案”奖「中国联通智网创新中心怎么样」
通信世界网消息(CWW)百舸争流,奋楫者先。自智网络发展四年多来,涌现出众多对产业发展做出重要贡献的解决方案。8月24日在通信世界全媒体主办的“自智网络技术创新与应用发展论坛...
日期:08-27
行业竞争激烈 上市一年的印尼最大科技公司GoTo盈利之路要怎么走?,-亏损加重
北京时间4月7日早间消息,据报道,印尼最大科技公司GoTo的首席执行官安德烈·索里斯托(Andre Soelistyo)在谈到2022年净亏损增长超过50%时称,这段时期 “具有挑战性”,对一直努力...
日期:10-03