您的位置:首页 > 互联网

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5,手机都能运行的那种

发布时间:2023-03-14 15:15:30  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:梦晨 金磊,授权转载发布。

一夜之间,大模型界又炸出个big news!

斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):

只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。

而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!

还有一个更绝的“骚操作”。

研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。

(薅羊毛高手……)

然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:

复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。

而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:

项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:

不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。

话不多说,我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca

在斯坦福官方的演示中,他们先小试牛刀地提了一个问题:

什么是羊驼?它和美洲驼的区别是什么?

草泥马Aplaca给出的答案较为干练:

羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁:

亚马逊语音助手alexa

对此,团队给出的解释是:

Alpaca的答案通常比ChatGPT短,反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件:

写一封e-mail祝贺被斯坦福大学录取的新生,并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来,直接给出了一个像模像样的邮件模板:

难度再次进阶,团队这次提出了让草泥马Alpaca写论文摘要的需求:

写一篇经过深思熟虑的机器学习论文摘要,证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看,非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何,以及未来展望。

当然,也有迫不及待的网友亲自下场试验,发现草泥马Alpaca写代码也是不在话下。

不过即便草泥马Alpaca能够hold住大部分问题,但这并不意味着它没有缺陷。

例如团队便演示了一个例子,在回答“坦桑尼亚的首都是哪里”的问题时,草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

除此之外,若是亲自体验过草泥马Alpaca就会发现,它……巨慢:

对此,有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑

Meta开源的LLaMA大模型,刚发布几周就被大家安排明白了,单卡就能运行。

所以理论上,基于LLaMA微调的Alpaca同样可以轻松在本地部署。

奇瑞新能源吧

没有显卡也没关系,苹果笔记本甚至树莓派、手机都可以玩。

在苹果笔记本部署LLaMA的方法来自GitHub项目llama.cpp,使用纯C/C++做推理,还专门对ARM芯片做了优化。

作者实测,M1芯片的MacBook Pro上即可运行,另外也支持Windows和Linux系统。

还是这个C++移植版本,有人成功在4GB内存的树莓派4上成功运行了LLaMA的70亿参数版本。

虽然速度非常慢,大约10秒生成一个token(也就是一分钟蹦出4.5个单词)。

更离谱的是仅仅2天之后,有人把LLaMA模型量化压缩(权重转换成更低精度的数据格式)后成功在Pixel6安卓手机上运行(26秒一个token)。

Pixel6使用谷歌自研处理器Google Tensor,跑分成绩在骁龙865+到888之间,也就是说新一点的手机理论上都能胜任。

微调数据集也开源

斯坦福团队微调LLaMA的方法,来自华盛顿大学Yizhong Wang等去年底提出的Self-Instruct。

以175个问题作为种子任务,让AI自己从中组合出新的问题以及生成配套答案实例,人工过滤掉低质量的,再把新任务添加到任务池里。

所有这些任务,之后可以采用InstructGPT的方法让AI学会如何遵循人类指令。

套娃几圈下来,相当于让AI自己指导自己。

斯坦福版Alpaca,就是花了不到500美元使用OpenAI API生成了5.2万个这样的示例搞出来的。

这些数据同样开源了出来,并且比原论文的数据多样性更高。

同时还给出了生成这些数据的代码,也就是说如果有人还嫌不够,可以再去自行扩充微调数据,继续提高模型的表现。

微调代码也会在HuggingFace官方支持LLaMA后放出。

不过Alpaca最终的模型权重需要Meta许可才能发布,并且继承了LLaMA的非商用开源协议,禁止任何商业用途。

并且由于微调数据使用了OpenAI的API,根据使用条款也禁止用来开发与OpenAI形成竞争的模型。

One More Thing

nova10 5G

还记得AI绘画的发展历程吗?

2022年上半年还只是话题热度高,8月份Stable Diffusion的开源让成本下降到可用,并由此产生爆炸式的工具创新,让AI绘画真正进入各类工作流程。

语言模型的成本,如今也下降到了个人电子设备可用的程度。

最后还是由Django框架创始人Simon Willison喊出:

大语言模型的Stable Diffusion时刻到了。


返回网站首页

本文评论
微信 macOS 版 3.5.5 正式版发布,支持聊天记录迁移与备份_苹果系统备份微信聊天记录
IT之家 8 月 27 日消息,微信 Mac 版现已更新 3.5.5 正式版,更新日志显示,新版本修复了一些已知问题。从网友反馈来看,微信 macOS 版跟 Windows 版一样,已经支持聊天记录迁移与备...
日期:09-10
浪潮助力莒南打造“莒易行”,返乡登记安全又便捷!(莒南人才网)
  春节将近,在外务工、上学等各类人员陆续返乡,给基层(村镇、社区等)疫情防控和返乡人员摸排带来了很大的难度和压力。为防范人员流动带来的疫情风险,提高人员摸排效率,浪潮...
日期:07-16
从8个营销热词,看2023年消费趋势!_快消品消费趋势
声明:本文来自于微信公众号 营销兵法(ID:lanhaiyingxiao),作者:兵法先生,授权转载发布。近年传统商业结构逐渐被打破,新赛道、新模式、新消费、新品牌、新商业业态呈现出爆发式增...
日期:01-06
北京卫视2022北京冬奥会直播_北京冬奥会将通过阿里云向全球转播:全程 4K 超高清模式
  1 月 28 日消息,据阿里云官方和奥林匹克运动会官方微博宣布,北京冬奥会将通过阿里云向全球转播,以全程 4K 的超高清模式。带来 6000 小时的精彩内容。   这将是 1964...
日期:08-07
爱回收 营收「爱回收二季度营收及GMV增速双双放缓,线下门店仍在扩张」
查看最新行情   记者/于浩  8月24日,二手消费电子产品交易和服务平台万物新生集团(纽交所股票代码:RERE,以下称“爱回收”)发布了2022年...
日期:09-09
手工耿爆改五菱神车 自制健身房车:百公里损耗四个大汉
日前,手工耿又带来的新发明自制健身房车,车上四人在健身的同时,还能让汽车前进,一举两得。视频中,手工耿将一辆五菱之光面包车拆掉内饰和底盘,前排驾驶位安装了一辆动感单车,副驾驶...
日期:10-04
小快抖直播淘什么意思「这届双十一,抖快淘如何「改命」直播电商?」
声明:本文来自于微信公众号 壹娱观察(ID:yiyuguancha),作者:太史詹姆斯,授权转载发布。刚刚过去的双十一很平静,成了第一个没有GMV的双十一。但直播电商依然站在C位——李佳琦复...
日期:11-17
抢购白色iPhone4黄牛达百人 每人获劳务费50
  据网友反映,在获悉苹果将于4月28日在华发售白色版iPhone4后,很多苹果产品经销商雇佣黄牛前往苹果北京直营店抢购。据了解,由于苹果执行每人限购2台的政策,黄牛排队人数已达...
日期:07-27
乐享兔年 多米音乐Android版给力2011
  兔年扑扑腾腾将至,如果今年你还以为带着iPhone塞着耳机傍晚陪女友牵着一只小泰迪散步,或是拿着iPad在地铁上玩植物大战僵尸就很拉风,那你就out了。今年过年不玩“苹果”,要...
日期:07-26
加强网信领域监管 斩断涉老诈骗“黑手”(先锋网信集团诈骗立案 2020-07-15)
□ 郭明龙   一段时间以来,利用互联网实施涉老诈骗的手段不断翻新,一些不法分子通过网站平台、手机App设置“套路”,打着养老服务、健康养老、投资理财等名义承诺高额回报,实...
日期:08-12
华为申请“星耀手机”商标_荣耀 商标
2 月 8 日讯:天眼查App显示, 1 月 31 日,华为技术有限公司申请注册“星耀手机”“星耀版”商标,当前商标状态为申请中。淘宝618和双十一...
日期:02-08
200亿美元“卖身”巨头,Figma不是SaaS的“终极出路”「figma 融资」
  屠龙少年未必一定变成恶龙,也可能是恶龙的“新救赎”。  作者 | 罗宁; 编辑;|;靖宇  来源:极客公园京东物流智能配送机器人  9 月 15 日,成立十年零一个月的设计平台...
日期:10-04
基于海拉克斯打造 丰田推出首款纯电皮卡原型车 网友:丑到我眼睛了
电动化时代,很多传统车企一下子被新生的造车新势力打得有点找不到北,这其中典型的就是丰田。网站CMS12月17日消息,丰田泰国运营60周年之际,丰田汽车本作向全世界展示了其首款全...
日期:12-18
字节跳动90亿收购Pico「字节跳动旗下Pico申请XR相关商标」
9 月 28 日讯:天眼查App显示, 9 月 20 日,字节旗下Pico-VR关联公司北京小鸟看看科技有限公司申请注册多个“PICO XR”商标,当前商标状态均为申请中。三星note8双摄怎么用金山毒...
日期:09-28
Meta同意推迟收购VR公司Within Unlimited(90亿收购VR)
讯 8月7日下午消息,一份法庭文件显示,Facebook母公司Meta Platforms已同意推迟完成对VR公司Within Unlimited的收购。后者旗下产品包括健身应用Supernatural。今年7月,美国联邦...
日期:08-08
微博发现页面_微博将上线“用户个人资料页展示近期发帖所在地”功能
  据 @微博管理员 ,微博将于未来一周上线“用户个人资料页展示近期发帖所在地”的功能。   据介绍,此功能将在“个人主页-个人资料”中展示用户最近一个月内最后一次发...
日期:04-18
武汉一线摄影记者手记 | 记录战“疫”一刻 凝聚感动瞬间_采访武汉疫情的专题特写
  2020年,一场突如其来的疫情笼罩荆楚大地,阴霾蔓延全国。大疫当前,有这样一群人,他们背上相机,奔赴抗“疫”一线,用镜头和文字记录着那一幅幅令人感动且又真实的生活瞬间,真实...
日期:07-14
马斯克:希望20年内在火星建造自给自足城市(马斯克宣布火星计划)
ssd 涨价   特斯拉和SpaceX公司CEO埃隆·马斯克周末重申,他坚定不移地致力于殖民火星,并让人类成为多行星物种。   马斯克在一条推文中写道:“我希望20年内火星上有一座自...
日期:08-17
华强北破解美版iPhone 14 国内能用了_美版有锁iphone12 5g国内能用吗
中关村在线消息:今年发布的iPhone 14系列手机,美版把取消了SIM卡槽,国行版的还是有,这导致了美版机不能使用手机卡。不过华强北已经破解,直接给美版机打了个SIM卡槽用来装SIM卡。...
日期:10-28
百度智能云携手头部商业银行,区块链技术落地金融行业_百度旗下区块链应用
  近期,百度智能云区块链团队取得新的突破,“金融级联盟链治理平台”与浦发银行进行深度合作。这是在2018年9月之后,百度智能云区块链又一次获得头部银行伙伴的认可。   ...
日期:05-07