您的位置:首页 > 互联网

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

发布时间:2024-06-04 17:26:37  来源:互联网     背景:

声明:本文来自于微信公众号量子位(ID:QbitAI),作者:量子位,授权转载发布。

斯坦福团队抄袭清华系大模型事件后续来了——

Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。

最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。

不在其中、来自南加利福尼亚大学的Mustafa Aljadery(简称老穆)被指是主要过错方,并且自昨天起人就失踪了:

我们希望由老穆首发声明,但自昨天以来一直无法联系到他。

悉达多、我(阿克什)和老穆一起发布了Llama3-V,老穆为该项目编写了代码。

悉达多和我的角色是帮助他在Medium和Twitter上推广这个模型。我俩查看了最近的论文以验证工作的创新性,但我们没有被告知和发现面壁智能先前的工作。

被指跑路的老穆本人,X主页目前已经开启保护锁定状态,申请才能关注:

整体来看,这条致歉推文和昨天那条发出后又急忙删掉的推文内容大差不差,主要是突出了道歉和进一步甩锅。

毕竟连斯坦福人工智能实验室主任Christopher Manning都下场开喷:

这是典型的不承认自己错误!

他认为团队在事发后避重就轻,用“架构相似”、“MiniCPM比我们更快实现”的借口推脱,拒不承认是抄袭。

但全新道歉声明,并没有止住网友们的质疑。并且最新爆料还指出,这几位老哥根本就是抄袭惯犯,之前写的教材也是一整个大抄特抄。

而原作者团队面壁智能这边,除CEO李大海昨天回应“也是一种受到国际团队认可的方式”外,首席科学家刘知远也已在知乎出面“亲自答”:

已经比较确信Llama3-V是对我们MiniCPM-Llama3-V2.5套壳。

人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。我们这次开源的MiniCPM-Llama3-V2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库,该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。

新的证据

还是先来简单回顾一下这个大瓜。

一句话总结就是,有网友发现,最近在开源社区大火的斯坦福团队多模态大模型Llama3-V,架构和代码与国产MiniCPM-Llama3-V2.5几乎一毛一样,并列举了诸多证据直指Llama3-V抄袭。

随着事件逐渐发酵,斯坦福AI团队删库跑路,面壁智能团队也就此事展开了调查。

面壁智能首席科学家、清华大学长聘副教授刘知远给出的判断Llama3-V是MiniCPM-Llama3-V2.5套壳的一大理由,正是对于清华简的识别能力。

这是MiniCPM-Llama3-V2.5的“彩蛋”能力,是他们用了从清华简逐字扫描并标注的数据集训练的,并未公开。而Llama3-V的表现和MiniCPM-Llama3-V2.5一模一样,不仅做对的题一样,出错的地方都一样。

今天,在第一波证据的基础之上,又有其他网友扒出了新线索。

有人研究后发现,Llama3-V几乎每一层的权重差值都符合均值为0、标准差为1.4e-3的高斯分布。

于是推测,Llama3-V只是直接在MiniCPM的权重上添加了低方差噪声。

除此之外,那个跑路的大兄弟老穆还被曝之前写了本关于“计算机网络设计”的书,也是抄的。

从书中随便抽出一章,用抄袭检测器检测一下就是一堆红点:

以及,这本书的作者栏里,据网友爆料也有悉达多的名字。

也有网友认为抄书这事儿是不是真的还有待考究。不过,现在这本书也404了。

说回这次的抄袭,悉达多和阿克什的致歉声明中也有提到他们之所以和穆哥一起宣传这个项目,最初也是被这个多模态模型惊艳到了,特别喜欢穆哥所描述的基于Idefics、SigLip和UHD的架构扩展。

但实际上网友一早扒出Llama3-V在空间模式等很多方面的具体实现都和LLaVA-UHD不同,却跟MiniCPM-Llama3-V2.5出奇一致。

根据MiniCPM-Llama3-V2.5主页介绍,MiniCPM-Llama3-V2.5是面壁智能MiniCPM-V系列的最新开源模型,基于SigLip-400M和Llama3-8B-Instruct构建,总共8B参数。

从性能上讲,MiniCPM-Llama3-V2.5在OpenCompass上取得了65.1的平均分,性能超过如GPT-4V-1106、Gemini Pro、Claude3、Qwen-VL-Max等专有模型,且显著超越其他基于Llama3的多模态语言模型。

此外,MiniCPM-Llama3-V2.5的OCR能力也很强,在OCRBench上得分700+,超越GPT-4o、GPT-4V-0409、Qwen-VL-Max和Gemini Pro。

基于最新的RLAIF-V方法,MiniCPM-Llama3-V2.5在Object HalBench上的幻觉率为10.3%,也低于GPT-4V-1106的13.6%。

“中国大模型被忽视了”

尽管甩锅甩得飞快,但网友们很快又从阿克什和悉达多童鞋的道歉声明里发现了华点:

合着你俩啥也没干,帮着搞搞推广就算项目作者啦?

宣发的时候说是你们仨的项目,出事了就把锅全甩给一个人?

如果是老穆一个人写了所有代码,那你俩是干啥的,就发发帖吗?

还有网友挑起了一个更关键的话题,进一步引发热议——

开源社区是否忽视了来自中国的大模型成果?

谷歌DeepMind研究员、ViT作者Lucas Beyer就提到,Llama3-V是抄的,但成本低于500美元,效果却能直追Gemini、GPT-4的开源模型确实存在:

但相比于Llama3-V,MiniCPM得到的关注要少得多,包括我自己也有所忽略。

主要原因似乎是这样的模型出自中国实验室,而非常春藤盟校。

抱抱脸平台和社区负责人Omar Sanseviero说的更加直接:

社区一直在忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。

包括Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、InternLM、OpenBMB、Skywork、ChatTTS、Ernie、HunyunDiT等等。

对此,不少网友表示赞同,“他们推出了目前最好的开源VLM”。

从更客观的大模型竞技场的角度看,此言不虚。

在模型一对一PK的视觉大模型竞技场中,来自零一万物的Yi-VL-Plus排名第五,超过了谷歌的Gemini Pro Vision。智谱AI和清华合作的CogVLM也跻身前十。

此外,DeepSeek、通义千问和这次遭到抄袭的MiniCPM系列多模态模型,也都有不错的表现。

在更受到广泛认可的LMSYS Chatbot Arena Leaderboard竞技场榜单中,来自中国的大模型也同样在不断刷新“最强开源”的新纪录。

正如刘知远老师所说:

从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;同时,从纵向来看,我们已经从十几年前的nobody,快速成长为人工智能科技创新的关键推动者。

oppo find x2全面测评

此瓜甚巨,吃瓜者众,或许更重要的是,一些成见正在破壁。你觉得呢?

MiniCPM原论文

https://arxiv.org/abs/2404.06395

参考链接:

[1]https://x.com/AkshGarg03/status/1797682238961914370

[2]https://x.com/siddrrsh/status/1797682242145464814

[3]https://x.com/teortaxesTex/status/1797712605286645846

[4]https://x.com/chrmanning/status/1797664513367630101

[5]https://x.com/RylanSchaeffer/status/1797690302167417322

[6]https://x.com/giffmana/status/1797603355919028547

[7]https://x.com/RylanSchaeffer/status/1797690302167417322

[8]https://x.com/osanseviero/status/1797635895610540076

[9]https://huggingface.co/spaces/WildVision/vision-arena


返回网站首页

本文评论
苹果将于6月在WWDC发布首款AR设备「苹果ar产品展示」
据报道,苹果计划在6月的WWDC上发布其首款混合现实设备,可能名为Apple Reality Pro。该装置的制造成本估计约为1 500美元,最昂贵的部件是新的微发光二极管屏幕,成本在280美元至32...
日期:05-20
小米 造车 雷军「雷军介绍小米汽车9100吨压铸岛:自研流水线系统 全国最领先之一」
快科技3月22日消息,日前,小米汽车超级工厂正式揭幕,小米CEO雷军发布视频介绍了工厂内部情况。视频中,雷军向大家展示了小米超级大压铸,9100吨压铸岛集群有两个篮球场大小,非常壮观...
日期:03-22
华为5g总裁杨超斌新昌「共筑新一代数智基础设施-华为杨超斌,抓住大机遇」
【】3月15日消息,以“因聚而生 数智有为”为主题的华为中国合作伙伴大会2024在深圳继续举办。继大会首日系统阐述了华为携手伙伴通过强化“伙伴+华为”体系,帮助客户抓住数智...
日期:03-16
AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】10年前,地震预测在圈内还是如尼斯湖水怪一般的奇谈怪论,但机器学习的发展,已经让准确预测...
日期:01-04
华为120hz刷新率的智慧屏「华为发布Vision智慧屏:120Hz高刷 86寸 5999元起」
今晚华为推出了新品牌的Vision智慧屏,主要有三个系列,分别是Vision智慧屏、Vision智慧屏Z电竞版及Vision智慧屏便携版,其中便携版是10.4寸的,电竞版主打高性能及游戏,,最高75寸,Vis...
日期:10-06
专家:ChatGPT对话水平已超过九成人类
凤凰网科技讯 2月4日消息,大型语言模型ChatGPT走红网络。ChatGPT会颠覆搜索引擎吗?技术突破性体现在哪里?凤凰网《前行者》直播连线清华大学计算机科学与技术系教授黄民烈,他表...
日期:02-04
tws+ 华为「以创新音频技术破局 华为引领TWS迈向全链路无损时代」
根据市调机构Canalys的最新报告,2023年第三季度全球TWS耳机出货量增长3.9%。虽然仍保持增速,但TWS耳机市场已经趋于饱和,正从“走量”向“重质”发展。随着产品快速迭代,用户对T...
日期:11-24
Google发布PaLI-3视觉语言模型,性能相当于体积大10倍的模型
东芝R634特斯拉model s plaid中国交付李彦宏的故事简短...
日期:10-25
1.6吨黄金在加拿大机场被盗 被装在航空运输集装箱「加拿大的黄金便宜吗」
加拿大多伦多皮尔逊机场发生一起大规模抢劫案,导致一家大型银行损失上亿美元,涉事的这家航空公司不知所措,因为丢失的是1.6吨黄金,价值上亿美元。据《多伦多太阳报》首先报道,这...
日期:04-21
马斯克晒娃「AI生成马斯克婴儿照疯传 本人幽默回应:我可能药吃多了」
快科技6月6日消息,近日,一张AI生成的马斯克婴儿照片在社交媒体上疯传,引发网友热议,并得到特斯拉CEO本人的回应。据了解,这张照片是由一个账户名为Not Jerome Powel”的网友分享...
日期:06-06
快手发布宠物活体类目个人店铺准入公告 公棚赛鸽对个人店铺开放定向邀请入驻
12月14日 消息:今天,快手发布《宠物活体类目个人店铺准入公告》,公告显示,为了更好地推进快手小店业务生态发展,平台对宠物生活>>宠物活体类目(二级类目)调整如下:宠物生活>>宠物...
日期:12-14
92岁史学大师许倬云:我不要做传奇,不要做圣人,我要做个人
作者丨普子胥“我不要做传奇,我不要做圣人,我要做个人。”2022年12月19日,92岁的史学大家许倬云在2022网易未来大会思想之夜首日,与知名文化学者余世存探讨“如何从传统文化中寻...
日期:12-21
ipad 亚马逊_亚马逊CEO:别指望苹果iPad取代Kindle
  北京时间5月27日消息,据国外媒体报道,亚马逊CEO杰夫·贝索斯(Jeff Bezos)日前表示,无需担心苹果iPad平板电脑,因为它不可能取代Kindle电子书阅读器。   当苹果发布iPad时...
日期:07-29
六到十年私家车两年一检「今日起!私家车10年只检两次 老车正式告别“一年两检”」
  10月1日起,国内机动车检车新政策正式开始实施。李佳琦厉害还是罗永浩  新措施规定,调整优化检验周期,进一步优化调整非营运小微型载客汽车(9座及9座以下,面包车除外)、摩托...
日期:10-03
2022年前8月我国手机产量9.9亿台 同比下降4.5%_2018年4月,手机产量最高的3个省
  昨日,工信部发布了《2022年1—8月份电子信息制造业运行情况》,1—8月份,我国规模以上电子信息制造业增加值同比增长9.3%,增速分别超出工业、高技术制造业5.7和0.9个百分点。...
日期:10-02
“先涨价再降价”老套路为何难禁止「先低价再涨价」
;  张涛  10月24日晚8点,各大电商平台的“双十一”预售正式开启,今年“双十一”大促进入实质性阶段。近日有网友发现某平台在售的手机在悄然涨价。山东的沈女士爆料称,某品...
日期:10-28
窝窝团——团购界的及时雨_窝窝团购网
  网络团购曾经“被昙花一现”,可是窝窝团及时发现问题,让网络团购得到了一定的保障,让有可能干涸的网络团购下了一场及时雨。   2010年3月15日,窝窝团特意选择“消费者权...
日期:07-22
OpenAI或用3D引擎/虚幻引擎训练视频模型Sora_虚幻引擎教学视频
3月1日 消息:OpenAI最近发布了多段由Sora生成的视频,展示了令人惊叹的3D效果。这些视频内容丰富,包括潜水探索沉船、描述日本江户时代宁静场景的立体模型等。春节人口迁徙大数...
日期:03-01
耐克官方回复“入驻拼多多”:信息不实 与公司无关_耐克声明在拼多多没有店铺
快科技12月14日消息,据媒体报道,耐克官方对于耐克品牌入驻拼多多”的传言回复称,报道涉及的耐克品牌或将入驻拼多多的信息不实,与耐克公司无关。 今天有媒体报道称,今年下半年...
日期:12-14
新能源车充电价钱「新能源汽车充电价格上涨 出租司机:以前一天40 现在电费要80」
近段时间,国内多个城市的新能源汽车车主表示,充电费用涨价不少,与此前相比,开车运营成本大幅增加。win10太阳谷更新什么时候上海,郑州、重庆等多地的新能源车主纷纷吐槽,公共充电...
日期:08-31