您的位置:首页 > 互联网

GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅

发布时间:2024-07-27 14:42:06  来源:互联网     背景:

声明:本文来自微信公众号“新智元”,作者:新智元,授权转载发布。

Llama3.1405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。

Llama3.1开源的同一天,OpenAI也open了一回。

GPT-4o mini可以免费微调了,每天畅用200万训练token,限时2个月(截止9月23日)。

收到邮件的开发者们激动地奔走相告,这么大的羊毛一定要赶快薅。

另一边,GPT-4o mini在大模型竞技场LMSYS排名也出来了。

总榜单中,GPT-4o mini与GPT-4o并列第一。

Altman本尊激动地表示,我从未对任何一次评估如此兴奋过,GPT-4o mini与GPT-4o性能如此接近,而价格仅有其1/20!

微软 Surface RT

同时,他表示,GPT-4o mini的微调现在上线了。

OpenAI能把如此强大的模型,放出来让大家免费用,实在是出人意料。

网友一度以为,这可能是最高级的钓鱼邮件。

每天200万token,GPT-4o mini免费微调

邮件中,OpenAI宣布现正式推出GPT-4o mini微调功能,为的是让最新小模型在特定用例上,表现更加出色。

7月23日-9月23日期间,开发者们每天可以免费使用200万训练token。

超过的部分,将会按3美元百万token收费。

到了2个月免费使用截止后,微调训练也将按照3美元百万token收费。

此外,OpenAI在邮件中给出了,每个人值得从GPT-3.5Turbo切换到GPT-4o mini的原因:

- 更实惠:GPT-4o mini的输入Token费用比GPT-3.5Turbo低90%,输出Tokens费用低80%。即使在免费期结束后,GPT-4o mini的训练成本也比GPT-3.5Turbo低一半。

- 更长的上下文:GPT-4o mini的训练上下文长度为65k Token,是GPT-3.5Turbo的4倍,推理上下文长度为128k Token,是GPT-3.5Turbo的8倍。

- 更聪明且更有能力:GPT-4o mini比GPT-3.5Turbo更聪明,并且支持视觉功能(尽管目前微调仅限于文本)。

最后,邮件中还提到,GPT-4o mini微调功能将向企业客户,以及Tier4和Tier5开发者开放,未来将逐渐扩大访问权限,扩展至所有级别的用户。

想要动手操作的小伙伴们,OpenAI已经放出了微调指南,可参见:

https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples

一部分网友对此并不看好,他们正在保存我们的数据,来训练和改进AI模型。

又名,把你的私人数据给我,我会收你很少的钱。

网友用例

拿到资格的网友,已经迫不及待上手测试了。

开发者使用《经济学人》风格的头条数据集,对gpt-4o mini进行了微调。

然后,他比较了gpt-4o、gpt-4o min原始模型和微调后的模型在生成头条方面的表现。

小模型霸榜,堪比GPT-4o

GPT-4o mini发布一周后,在大模型排行榜中的成绩终于出来了。

共收到了4K+用户投票,GPT-4o mini小模型直接攀升至榜首,与GPT-4o并列第一。

最最重要的是,便宜20倍!

这对于众多开发者来说,是个好消息,能够以更低的成本,搭建更强大的应用。

在数学细分领域中,GPT-4o mini的性能有所下降,排在第9。

此外,在hard prompt评测中,GPT-4o mini依旧保持了稳健的性能,实力仅次于GPT-4o、Claude3.5Sonnet。

在编码领域,GPT-4o mini同样展现出强大的能力。

关于GPT-4o mini在Arena中排名如此高的原因,很多人提出了疑问。

官方对此解释是:

- Chatbot Arena根据不同领域的人类偏好进行评估。鼓励大家不仅关注总排行榜,还要查看各个类别的排名(如数学、编码等)。

- Arena评估是实时进行的。鼓励大家在Arena中亲自对比模型,实时验证自己的假设。

- 透明性是我们的核心价值;所有代码和分析都是开源的(https://github.com/lm-sys/FastChat)。我们定期发布20%的数据,保留其余数据以避免过拟合,维护基准测试的完整性。

- 我们将根据政策发布随机的20% GPT-4o mini对战数据,大家可以亲自查看答案。

不过,另有网友认为,gpt-4o-mini的胜利是一个实质性的证据,证明了普通人并不那么聪明。

而且,这是历史上首次,AI变得足够聪明可以愚弄我们。有点疯狂,也有点具有历史意义。

参考资料:

https://x.com/moyix/status/1815840634013639086

https://x.com/HamelHusain/status/1815848198927434019

https://x.com/sama/status/1815877987696533897

https://x.com/0xSMW/status/1815869241205350641


返回网站首页

本文评论
硬卧下铺别人能不能坐?12306回应:相应位置使用权仅限购票乘客
您是否曾经在乘坐火车时遇到过别人占用您购买的硬卧下铺的情况?这一问题近日引起了广泛的关注和讨论,因为关于硬卧下铺的使用权归属问题引发了疑问。中国铁路客户服务中心(123...
日期:08-30
乔布斯去世十年,粉丝哀叹苹果正失去昔日创新光环,但库克是更好领导者
  10 月 4 日消息,据外媒报道,苹果联合创始人史蒂夫・乔布斯(Steve Jobs)去世十年后,这家公司已经成长为设备和服务领域的“双巨头”,成为世界上市值最高的公司。然而,这位科...
日期:07-17
银鹭八宝粥整活推出小米特别款:送专业保护盖 称想成为小米手机配件商
快科技3月13日消息,近日银鹭八宝粥罐盖成小米14 Ultra配件的发现引起大家关注,被称为最强小米配件。小鹏 新车银鹭甚至还出了一份官方实测,小米14 Ultra在佩戴了官方摄影套装保...
日期:03-13
电子烟监管条例「国家烟草专卖局关于加强电子烟监管有关事项的通知」
  国烟办〔2022〕118号  各省级烟草专卖局:  为深入贯彻党中央、国务院加强电子烟监管的重大决定,严格落实《国务院关于修改<中华人民共和国烟草专卖法实施条例>的决定...
日期:10-02
巴菲特:ChatGPT确实很厉害 但不确定能否给人类带来好处
4月13日消息,当地时间周三传奇投资人士沃伦·巴菲特(Warren Buffett)在接受采访时表示,自己也试用过人工智能聊天机器人ChatGPT,认为ChatGPT确实很厉害,但还不确定能否给人类带...
日期:04-13
电装中国完成首笔ESG存款,积极推动绿色可持续发展_电装中国工作怎么样
(原标题:电装中国完成首笔ESG存款,积极推动绿色可持续发展) 近日,电装(中国)投资有限公司携手三井住友银行(中国)有限公司、瑞穗银行...
日期:12-06
华为发布2021年上半年经营业绩「华为发布2023年上半年业绩:营收3109亿元 同比增3.1%」
8月11日消息,今日,华为发布2023年上半年经营业绩,上半年收入3109亿元,同比增长3.1%。上半年,华为实现销售收入3109亿元人民币,同比增长3.1%,净利润率15.0%。其中,ICT基础设施业务收...
日期:08-11
购机即可抽女神节礼盒:荣耀V40线上线下联动献礼(荣耀v40预售活动方案)
  女神节将至,荣耀于3月4日公布了促销方案,联手野兽派定制精美礼盒献礼女性。从3月5日到8日线上购机即有机会抽取礼盒,另有免息福利。而线下指定门店的购机抽礼盒活动时间则...
日期:07-16
女神张俪淘宝直播为天猫精灵打call,明星的理想生活你也能轻松get
  “天猫精灵,最近有什么歌好听? ”“养什么宠物,养天猫精灵就行了。” 10月14日晚,明星张俪在淘宝直播间里,热情地和天猫精灵互动。卸下偶像包袱,变身网红主播,张俪畅亲...
日期:03-03
虎牙斗鱼合遭“事前”叫停 反垄断监管进入灵活、精准新阶段_虎牙 斗鱼 反垄断
  7月10日,国家市场监督管理总局公告显示,依法禁止虎牙公司与斗鱼国际控股有限公司合并。   腾讯成为继阿里之后,又一家遭遇反垄断强监管的互联网企业。   这是首张...
日期:07-16
2020中国云计算生态峰会召开 浪潮云摘得三项大奖_2020中国云网络峰会
  近日,由B.P商业伙伴主办的2020中国云计算生态峰会成功召开,充分展示云计算领域最新趋势、行业应用的创新成果,以及新技术、新产品和解决方案在各行各业的最佳实践。   ...
日期:02-23
为避免遭调查和欧洲云计算公司达成2000万欧元协议,微软“破财免灾”
7 月 11 日消息,根据路透社报道,微软为了避免欧盟对其云计算部门展开调查,宣布和欧洲云基础设施服务提供商协会(CISPE)达成 2000 万欧元(备注:当前约 1.58 亿元人民币)协议,并同意该...
日期:07-11
港股美团收跌超9% 快手跌超4%_美团股票最近大涨
  讯 8月16日下午消息,香港恒生指数收跌1.05%,恒生科技指数收跌2.03%。港股美团收跌超9%,盘中市值一度跌破万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。...
日期:10-11
天玑920 780g「搭载天玑9200处理器+12GB内存 疑似OPPO-Find X6现身Geekbench 6」
今年开年的旗舰大战已告一段落,不少品牌都已推出了旗下今年的首款代表性旗舰,同时也还将有多款机型正在到来的路上,其中就包括OPPO的新旗舰Find X6系列。随着发布时间的临近,截...
日期:09-19
联想公布2022/23财年:营收4240亿 非PC业务占比近40%_联想去年营收
5月24日消息,联想公布截至2023年3月31日的2022/23财年全年及第四财季业绩:全年营收为4240亿人民币,净利润129亿人民币;第四季度营收为865亿人民币,净利润19亿人民币,全年非PC营收...
日期:05-24
华为Mate 50紧急补货 杜绝黄牛加价 4999原价买_华为mate40限制黄牛
华为Mate 50系列实在是太火爆了,首销开售的3款机型华为Mate 50、Mate 50 Pro和华为Mate 50 RS保时捷设计版刚刚开售,就全都卖光了。余承东在华为Mate 50系列首销当天也都在公...
日期:10-02
国家关键技术和新兴技术战略「美国白宫发布2024年版《关键技术和新兴技术清单》」
通信世界网消息(CWW)近期,美国白宫科技政策办公室(OSTP)发布了一份对美国国家安全具有潜在重要意义的关键技术和新兴技术(CETs)最新清单。这份于2024年更新的清单概述了可能为美国...
日期:02-21
斯坦福大学发布2024年人工智能指数报告:十大要点解析_斯坦福大学人工智能在线课程
4月22日 消息:在2024年4月19日,斯坦福大学以人为中心的人工智能研究所发布了其备受瞩目的2024年人工智能指数报告。这份全面的研究报告深入分析了人工智能(AI)的现状,探讨了主要...
日期:04-22
日本麦当劳早餐「日本部分麦当劳停售照烧蛋堡 又是因为缺蛋」
近日,朝日电视台等多家日媒就“日本缺蛋”发表报道,《朝日新闻》14日称,日本麦当劳当天表示,部分店铺将停止销售春季传统商品“照烧鸡蛋堡”。一咳嗽就漏尿怎么办魅族魅蓝2多少...
日期:03-15
苹果2018发布会产品「美媒:Pro级产品将成苹果秋季发布会最耀眼明星」
9月5日消息,苹果即将于美国当地时间9月7日举办2022年秋季新品发布会,预计其将发布旗舰级智能手机、智能手表以及耳机等新品。不过,苹果资深分析师马克·古尔曼(Mark Gurman)认为,...
日期:11-05