您的位置:首页 > 互联网

OpenAI大神Karpathy纯C代码打造简化版Llama2 已获2.2K星

发布时间:2023-07-24 23:08:06  来源:互联网     背景:

7月24日 消息:OpenAI的Andrej Karpathy(其在深度学习领域的贡献而闻名)创建了一个简化版的Llama2模型_Baby-Llama,并展示了在资源受限设备上使用纯C代码运行复杂模型的可行性。

创建Llama2模型

Karpathy测试了开源项目Llama2,他在纯C编程语言中将nanoGPT调整为Llama2架构,并通过开发C代码的推理引擎“run.c”来实现。该项目在GitHub上已经获得了2.2K star。

image.png

Karpathy的方法成功地实现了高度交互率,即使使用包含数百万参数的合理规模模型,并在TinyStories数据集的1500万参数模型上进行训练。他在M1MacBook Air上报告称,Llama2模型的推理速度为每秒约100个标记,在C代码中实现了这一结果,展示了在资源受限设备上运行复杂模型的可行性。

image.png

360安全路由P1

南京什么时候有茶颜悦色

Karpathy的Baby-Llama方法受到了Georgi Gerganov的项目llama.cpp的启发,该项目几乎与使用C和C++在MacBook上运行第一个版本的LLaMA相同。他的方法涉及使用PyTorch从头开始训练Llama2LLM架构,并将模型权重保存到原始二进制文件中。接着,他写了一个名为“run.c”的500行C文件,加载保存的模型,并使用单精度浮点数(fp32)进行推理。这种简化的方法确保了较低的内存占用,并且不需要外部库,从而在单个M1笔记本电脑上高效执行,无需GPU。

小型LLM的崛起

模型逐渐变小的最大原因是为了在较小的本地设备上进行训练和集成。Karpathy的方法不仅不需要GPU,而且为单设备上的实现提供了案例。此外,Meta与芯片制造商Qualcomm合作,旨在使Llama2在本地硬件上运行,而苹果则推出了为Apple Silicon优化的Transformers架构。Karpathy已经展示了许多可能性。

iqoo neo6可以用120w快充吗

Karpathy强调这个项目是一个周末实验,并不适用于生产级部署,主要目的是展示在资源受限设备上使用纯C代码运行Llama2模型的可行性,因为长期以来,C语言在机器学习中并不常用,因为它不涉及GPU。

oppok3销量怎么样

项目网址:https://github.com/karpathy/llama2.c


返回网站首页

本文评论
4399游戏盒祖玛消除游戏 中文版更给力_4399祖玛小游戏大全
  游戏在当今时代已经成为大众主流消遣方式之一,也正因为如此,4399游戏盒中的万余款益智游戏才具有如此高的人气。这不,4399游戏盒近期更新的《埃及祖玛5 中文版》,以全新的...
日期:07-26
欣兴电子将为非英特尔客户增加 ABF 载板产能
  IC 载板龙头欣兴电子近日将 2022 年的资本支出从原本计划的 297.3 亿新台币上调至 358.58 亿新台币,主要是为了支持 ABF 载板在中国台湾地区的产能扩张,以满足非英特尔客...
日期:07-17
这里是全球最赚钱的市场,也是最封闭的市场_在世界市场上,可以称为世界“封闭市场”价格的有
  ;郑峻   网购人肉中国手机   Shubham;Mazumdar是硅谷洛斯阿尔托斯(Los;Altos)一名小有名气的医生。在工作之余,他的最大爱好就是数码设备,尤其是玩各种不同的智能手机,...
日期:08-16
专业好压(haozip) 五大绝招显神威
  经常上网的朋友想必对好压(haozip)并不陌生,作为国内用户量最大的免费解压缩软件,它的用户安装量已经突破6000万。好压独创的7Z格式注释功能和智能过滤技术,大幅提高了压缩...
日期:07-25
Midjourney使用指南:如何使用midjourney负面提示改善图片?
注:文中图片均由Midjourney生成Midjourney 是一款功能强大的工具,可让您根据文本提示生成逼真且富有创意的图像。您可以使用它来创建风景、肖像、logo、插图等。但有时,你可能...
日期:04-23
在微光中寻找曙光 温情家乡年货短片打动“原年人”
  春节的脚步临近,年味儿也渐渐浓了起来。与往年不同的是,今年很多人都会在工作的城市“原地过年”,上年货节囤家乡年货成了“原年人”们解乡愁、表心意、过好年的必备姿...
日期:07-10
《荒野大镖客2》戴尔G7带领带你体验快意西部世界(戴尔游匣g3能玩荒野大镖客2吗)
  经历了一年的等待,玩家们翘首期盼的《荒野大镖客2》终于登陆PC平台了。作为2018年的无冕之王,本作无论在剧情、人物刻画以及世界观营造上都是无与伦比的,无论是在单人战役...
日期:11-20
身怀绝技!小羊学狗叫吓懵同伴:连动作都像狗
羊学狗叫是怎样一种体验?最近,一直身怀绝技”的羊火了。据时间视频消息,10月1日,辽宁铁岭一只羊学会了狗叫,冲着同伴不停发出汪汪汪”的声音,连动作也很标准,很像一只小狗。它的同...
日期:10-04
腾讯音乐 美股行情_美股三大指数集体高开 贝壳、腾讯音乐涨超2%。
环球晶圆产能 查看最新行情   讯 7月25日晚间消息,美股三大指数集体高开,道指涨0.26%,纳指涨0.05%,标普500指数涨0.16%。贝壳、腾讯音乐涨超2%。 谷歌眼镜...
日期:07-31
开源办公套件LibreOffice 6.4.4维护版本更新发布(libreoffice7.2)
  面向所有支持的桌面平台,文档基金会今天发布了LibreOffice 6.4.4生产力套件更新。由于是第四个维护版本更新,因此并没有引入任何新的功能,主要是对细节上的打磨,修复BUG和...
日期:07-14
VR游戏分岔点宣布完两轮共数千万元投资
讯 8月15日上午消息,上海分岔点网络科技有限公司宣布完成数千万元Pre-A轮融资。   本轮融资由红杉中国种子基金投资,资金将主要用于产品研发以及技术团队扩充。在此前半年,分...
日期:08-16
万兴科技首发新版万兴恢复专家-苹果恢复 帮你解除微信数据恢复烦恼
  万兴恢复专家-苹果恢复 首发 加码数据管理实力   万兴科技(300624.SZ)旗下数据管理解决方案万兴恢复专家-苹果恢复产品近日正式对外发布。这是一款全面支持所有iOS设...
日期:08-23
国家信息中心发布《“新型冠状病毒肺炎”公众认知与信息传播调研报告2020》
  信息的功能是消除和减少不确定性。   突发公共卫生事件与社会公众的身体健康和生命安全息息相关,拥有一段时间内最高的公众关注度和影响力。及时有效的信息公开,可以帮...
日期:05-09
苹果公司通过网络钓鱼捕获员工泄露信息
苹果公司通过使用网络钓鱼方案跟踪泄露源,捕获了一名员工泄露有关即将推出的产品的信息。该名员工Analyst941在陷入网络钓鱼骗局后被抓获,随后被解雇并删除了帐户。台积电超越...
日期:05-13
抖音上线图书聚合页功能 可查看图书豆瓣评分_抖音图书类目
2月2日 消息:2月2日,抖音上线了图书聚合页功能,可以查看图书的豆瓣评分和精选书评,并可以跳转到抖音商城的搜索结果。京东年终奖2023年什么时候发我国电子信息产业已经由低速增...
日期:02-02
htc刷机方法「htc hd2刷机」
HTC HD2是一款知名的智能手机,其作为世界上第一款内置Windows Mobile 6.5操作系统的手机而备受瞩目。不过,由于硬件设备已经老化,加之软件方面较为滞后,使得HTC HD2的使用变得不...
日期:05-31
荣耀90通过工信部认证:顶配骁龙8 、支持66W快充「荣耀9或6月正式发布 搭载麒麟960处理器」
快科技5月5日消息,荣耀90目前已经通过了工信部认证,型号REA-AN00,支持最高66W快充。苹果智能家居平台realme book多少钱MACHENIKE 机械师据爆料,荣耀90系列顶配机型将会搭载高通...
日期:05-05
苹果毫无诚意,iPhone14再度传来“坏消息”,果粉:不如iPhone13「iphone13卖疯了」
作为高端旗舰机手机领域的巨头之一,苹果每次召开发布会都会吸引很多果粉的关注,不管是旗舰手机还是其他产品,都得到了不错的口碑和销量。即使在近两年苹果针对iPhone并没有什么...
日期:09-26
《指环王》第二季2024年上线_《指环王》第二季2024年上线时间
该剧第一季落下帷幕,揭示了索伦的真面目。第二季将重点描写索伦由源起到崛起的全过程,待遇可参照首季中的腹语者凯兰崔尔(以下内容涉及剧透)。Chrome网络商店联想yoga pro 14c和...
日期:10-16
苹果各产品线蓄势待发 iPad将迎来新挑战(苹果ipad产品时间线)
  【赛迪网讯】6月15日消息,据国外媒体报道,苹果已经做好准备发布最新版本MacBook Air和iPhone 5,以期在 笔记本 电脑和智能手机市场再进一筹。  台湾的《每日经济》指出,...
日期:07-30