您的位置:首页 > 互联网

直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?

发布时间:2024-02-02 14:22:21  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型miqu,的确是Mistral公司训练的一个旧模型的量化版。此前,冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。

破案了!

让众多网友抓心挠肝的开源新模型miqu,的确是Mistral训练模型的一个旧的量化版本,是在Llama2上重新训练的。

今天,Mistral CEO亲口确认了这一点。

CEO表示,模型是一位过于热情的员工从抢先体验的客户那里泄漏的。

过去几天,引起AI社区热烈讨论的这桩悬案,终于有了答案。

神秘模型泄漏

事情是这样的。

1月28日,一位名为miqudev的用户,在HuggingFace上发布了一组文件,这些文件共同构成了一个看似全新的开源LLM,名为miqu-1-70b。

奇怪的是,网友们在HuggingFace条目中发现,这个新模型的提示格式跟Mistral完全相同。

随后,miqu-1-70b的链接,又在4chan上泄漏了。

发布链接的,是4chan上的一位匿名用户,大家推测他极有可能是就miqudev。

随后,X上的网友们奔走相告,因为他们发现,miqu-1-70b的性能实在是太强了!

在EQ-Bench基准测试上,它甚至已经接近了之前的模型王者——GPT-4。

网友们百思不得其解,为什么这个神秘的新模型能击败Mistral Medium,接近GPT-4。

干脆有人提议,不如用EQ-Bench检查下,miqu的数据集是不是被污染了。

miqu模型真面目, 是Mistral还是Llama?

为了确定miqu的真实身份,有网友向Mistral-Medium和miqu发送了同一个俄语问题。

结果发现,两个模型的回答竟然是一模一样的俄语。

最后,他得出结论——我现在100%相信miqu就是Mistral-Medium。

更有网友熬夜进行了测试,比较了miqu和Mixtral模型的能力。

结果发现,miqu与Mixtral的确非常相似,无论在德语拼写和双语语法上,还是回复中的一些语言习惯上。

总的来说,miqu的表现优于Mistral Small和Medium,逊于Mixtral8x7B Instruct。

因此,miqu可能是Mistral模型的泄漏版本,一个较旧的概念验证模型。

当然,也有部分开发者认为,miqu更像Llama70B,而不是专家混合模型。

综合当时的推测来看,miqu既可能是Mistral Medium的早期版本,也可能是在Mistral Medium数据集上微调了Llama70B。

Mistral量化版?

随着声浪越来越大,摩根大通的机器学习研究者Maxime Labonne也注意到了这件事。

他发帖称,目前还不确定miqu是否就是Mistral量化版,但可以肯定,它很快就会成为最好的开源LLM之一。

而且多亏了@152334H,现在大家已经有了一个未量化版本的miqu。

Labonne表示,现在调查还在继续,我们很快就会看到,微调版本的miqu性能会优于GPT-4了!

在机器学习中,量化指的是这种技术,通过用较短的数字序列替换模型架构中的特定长数字序列,使得在功能较弱的计算机和芯片上运行某些AI模型成为可能。

很多人猜,miqu很可能是一种新的Mistral模型,是公司故意要泄漏出去的。

毕竟上次的磁力链接事件就表明,Mistral一向有通过深奥的技术手段大张旗鼓地发布新模型的传统。

美团腾讯的股份

或者,也有可能是员工或者客户泄漏出去的。

CEO确认:没错,它是Mistral的量化版

今天,事情终于水落石出了。

Mistral的联创兼CEO Arthur Mensch在X上澄清道:

我们有一位抢先体验的客户,对接他的过于热情的员工泄漏了我们训练和公开分发的旧模型的量化和水印版本。

为了快速开始与一些选定的客户合作,我们在访问整个集群的那一刻,就从Llama2重新训练了这个模型——预训练在Mistral7B发布当天就完成了。从那以后,我们又不断取得了良好的进展,敬请期待!

有趣的是,CEO并没有要求HuggingFace上的帖子被删除,而是表示发帖人可能需要考虑归属。

总之,敬请期待这四个字表明,Mistral在训练的,似乎不仅仅是这个接近GPT-4的miqu模型。

开源AI进入关键时刻?

miqu模型的泄漏之所以能引起如此轩然大波,也是因为这件事很可能成为开源生成式AI的分水岭,以及整个AI和计算机科学领域的分水岭。

2022年3月发布的GPT-4,在大多数基准测试中仍然是世界上性能最强的LLM。甚至连谷歌传闻已久的 Gemini都无法超越它。(根据一些测试,目前的 Gemini模型实际上比旧的OpenAI GPT-3.5模型还要差)。

如果现在有一个类似GPT-4性能的模型出来,且能免费商用,就必然给OpenAI及其订阅服务带来巨大的冲击。

尤其是现在越来越多的企业开始寻求开源模型或开源和闭源的混合,来支持自己的应用程序。

靠着GPT-4Turbo和GPT-4V,OpenAI已经竭尽全力保持优势,但开源AI社区的迅速追赶,已经不容忽视了。

OpenAI是否有足够的领先优势,GPT Store和其他功能是否具有护城河,让ChatGPT停留在LLM榜首的位置呢?

参考资料:

https://venturebeat.com/ai/mistral-ceo-confirms-leak-of-new-open-source-ai-model-nearing-gpt-4-performance/


返回网站首页

本文评论
同档位“降维打击”!一加Ace 3将首发1.5K东方屏_一加 lcd
快科技12月23日消息,这次一加Ace 3的预热风格非常独树一帜,每天通过大红底的文字海报揭晓亮点。在日前官宣之后,今天官方又透露,一加Ace 3的东方屏在同档位是降维打击”。据悉,该...
日期:12-23
去哪儿:十一期间三亚机票平均支付价超800元_去年春节三亚机票一万多
9 月 28 日消息,昨日 12 时起,三亚全面恢复各类生产生活秩序。去哪儿数据显示,临近十一,国庆期间飞往三亚的国内航线机票预订量增幅明显, 9 月 27 日预订量较一周前增长 5 倍。机...
日期:09-29
苹果宣布:停止销售!_苹果将停售
近日,苹果公司爆出大消息由于与医疗技术公司Masimo之间存在长期专利纠纷苹果准备在美国停售Apple Watch S9及Apple Watch Ultra 2据了解,苹果公司发布的一份声明中宣布,它将很...
日期:12-20
真假蟹卡背后谁泄露了收货人地址?真相揭开_真假蟹卡背后谁泄露了收货人地址?真相揭开
10月9日消息,演员孙艺洲近日发文称收到快递是一张蟹卡,最后发现是诈骗”。孙艺洲表示,以为是哪位朋友送的蟹卡,扫了下码觉得不对劲,又搜了搜发现好像是诈骗。2021年围棋第一人业...
日期:10-09
AI视野:Nijijourney APP正式上架App Store;微软AutoGen框架爆火;AI破译2000年前赫库兰尼姆卷轴;vivo自研AI大模型11月1日发布
支持matter智能家居品牌有哪些疫情对游戏行业的影响分析苹果6系统9.2.1建议升级ios12吗阿里巴巴融资战略...
日期:10-16
海尔不如美的和格力了「跟美的、海尔比,格力真是掉队了」
作者|Eastland头图|视觉中国在国内外多重不利因素作用下,经济增长放缓、居民对未来收入的信心不足,社会消费总额下降。由于购买家电不是刚需(冰箱、洗衣机、电视机只要还能用,晚几...
日期:09-18
上半年国产手机出货量下降超25% 年轻人不爱换手机了?(有报告指出今年上半年国内手机累计销售超过6000万部)
文/记者 温婧 ; ; ; ;近日有数据显示,今年上半年,国内市场手机总体出货量同比下降21.7%,国产手机出货量下降25.9%。还有数据显示,年轻人换机周期拉长至31个月。年轻人为什么不爱...
日期:08-16
余承东在“华为不造车”帖子留言:这时代变了 只会让我们更加艰难
2020年11月25日,华为在心声社区”发布任正非签发的《关于智能汽车部件业务管理的决议》,明确华为不造车。自动驾驶行业研究2023年3月31日晚,余承东在帖子下留言:这个时代变了,这...
日期:04-01
19分钟充满电!小米13T系列海外首发:首次支持IP68_小米13.3air i7
快科技9月26日消息,小米于北京时间今晚8点在德国柏林举行发布会,推出小米13T系列手机。生产呼吸机血氧仪的上市公司此次发布小米13T系列包括13T和13T Pro两款手机。其中小米13...
日期:09-27
戴尔emc公司「Dell'Oro报告:全球MEC市场发展未及预期 2023年预期下调20%以上市场报告」
2023/5/24 10:36 Dell'Oro报告:全球MEC市场发展未及预期 2023年预期下调20%以上  艾斯 C114讯 北京时间5月24日消息(艾斯)根据市场研究公司Dell'Oro Group最新发布的报告...
日期:05-26
【邀请函|6月28-30日】中信国际电讯集团即将亮相2023 MWC上海世界移动通信大会,时不我待,共创未来!
【邀请函|6月28-30日】中信国际电讯集团即将亮相2023 MWC上海世界移动通信大会,时不我待,共创未来! 通信产业网|2023-06-14 15:34:33作者:通文来源:通信产业网【通信产业网讯】MWC...
日期:06-14
国美献北京消费季省钱购物攻略 双重补贴促家电换新步伐(北京国美节能补贴)
  ​6月6日,为期4个月的大型全市性促消费活动“北京消费季”即将启动。同期,国家发展改革委、市场监管总局等7部委联合印发《关于完善废旧家电回收处理体系推动家电更新...
日期:07-14
锐龙7000御用平台 微星4款X670主板开卖:顶配8999元「锐龙7 1700X」
AMD昨晚发布了锐龙7000处理器,这一代不仅升级了5nm Zen4架构,还带来了全新的AM5平台及600系芯片组,今晚高端的X670系列也上市了,微星推出了4款X670系列主板,其中最豪华的MEG X670...
日期:09-28
对中国发展研究基金会捐助增加至 1 亿元人民币 苹果,CEO 库克关注乡村教育
3 月 25 日消息,苹果官方今日宣布对中国发展研究基金会的捐助增加至 1 亿元人民币,以为中国各地的教师和学生创造成长机会。此次 Apple 新增的 5000 万元人民币捐赠将资助为期...
日期:10-05
VIAVI向您发来邀请:6月28日锁定5G,一起集结上海MWC2023!
通信世界网消息(CWW)2023年是MWC落户上海的第十个年头,6月28日,上海世界移动通信大会(简称“MWC 上海”)迎来盛大开幕,全球260多家参展商再次齐聚上海新国际博览中心(SNIEC),展开为期...
日期:06-26
中国联通营业厅效果图「中国联通营业厅新貌:架起通往数智生活的桥梁」
通信世界网消息(CWW)贴心服务,一站式解决各类需求;全年无休,热情接待每一位客户……说起遍布全国的中国联通营业厅,你肯定不陌生。而如今,亲切之上,更添新鲜,营业厅也在不断“进化”...
日期:06-15
4399游戏盒新版发布 大型游戏下载更高速(4399游戏盒下载4399小游戏)
  不少游戏网站都提供有大型游戏下载,不过这些动辄数GB的大型游戏下载起来确实很伤神,往往要花费玩家不少精力。近日,全国最大的全能游戏客户端--4399游戏盒发布了新版1.8.0...
日期:07-24
海底捞回应取消半份菜 个别门店试点统一菜品规格_海底捞半份菜品是半价吗
近日,海底捞因在西安、北京等部分门店试点调整份量和价格而引起关注。有消费者通过发帖表示,在点餐时这些门店不再提供“半份”和“整份”的选项。该消息于11月15日晚上引起微...
日期:11-17
2299元起双芯旗舰卖爆了!iQOO Neo9系列预售1小时销量超上代全天_iqooneo什么芯片
快科技12月28日消息,日前iQOO Neo9系列正式发布,并同时开启定金预售。根据官方公布的成绩,iQOO Neo9系列全款预售开启一小时,销量就已超过上代定金预售全天的数据,提升巨大。系列...
日期:12-28
Google和GiveDirectly利用AI地图将现金精准迅速送到伊恩飓风灾民手中
在像伊恩飓风这样的灾难发生后,人们可能需要几天甚至几周的时间才能得到援助,而且当援助到达时,通常是以实物捐赠的形式,从衣服到食物,但这可能不是某人当时需要的。非营利组织Gi...
日期:10-09