您的位置:首页 > 互联网

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍_amd ai芯片

发布时间:2024-10-02 03:13:33  来源:互联网     背景:

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为AMD-135M”。

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。

AMD-135小模型隶属于Llama家族,有两个版本:

chrome同步功能已停用

amd ai芯片

一是基础型AMD-Llama-135M”,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型AMD-Llama-135M-code”,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。

创建与部署流程

它使用了一种名为推测解码”(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。

淘宝造物节意义:淘宝造物节9月将开幕

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。

amd语法

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。

防止苹果氧化变色

比如在MI250加速器上,性能可提升最多约2.8倍,锐龙AI CPU上可提升最多约3.88倍,锐龙AI NPU上可提升最多约2.98倍。

推测解码

美团三季度财报解读

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。


返回网站首页

本文评论
科目三相关视频「科目三完整版舞蹈曝光 此前受到国内外网友争相模仿」
近日,舞蹈科目三在网络上迅速走红,但其魔性动作只是冰山一角。近日,有网友深入挖掘,发现了舞蹈科目三的完整版视频。令人惊讶的是,其高难度动作令人咋舌,让人们对这一舞蹈的魅力有...
日期:01-02
中国信科罗昆初:持续5G创新 连接数字化美好未来_罗信科技主要做什么
通信世界网消息(CWW)7月19日,由中国通信企业协会、工业和信息化部新闻宣传中心、中国信息通信研究院、中国电子信息产业发展研究院、中国工业互联网研究院主办的2023 5G应用创...
日期:07-20
液晶电脑显示器改电视「液晶电脑」
,又称为平板电脑,是现代化信息技术领域的一大成果。作为一个小巧轻便的电子设备,它不仅实现了计算机与网络技术的结合,也带给用户更为便捷的使用和携带体验。下文将从的历史,分类...
日期:05-30
英特尔宣布将于 10 月 20 日举行 13 代酷睿上市分享会「英特尔酷睿发布会」
10月9日消息:英特尔官方宣布,将会在10月20日 举行第13代英特尔酷睿上市分享会,发布相应产品。零跑汽车 IPO英特尔此前在9月底正式发布第13代英特尔酷睿处理器,旗舰产品i9-13900...
日期:10-12
NextStarterAI官网体验入口 一站式开发工具套件免费使用地址_next entertainment
NextStarterAI是一个全面的开发套件,旨在帮助用户快速启动SaaS、AI工具或其他任何类型的Web应用程序。它提供了Next.js模板、着陆页组件、支付系统集成(Stripe/Lemon Squeezy)...
日期:03-19
抖音电商双11预售战报出炉:商品曝光同比增长2000%_抖音电商财报
10月31日 消息:昨日晚间,抖音电商公布了首份双11预售战报。从10月24日预售开启,抖音双11好物节正式拉开序幕。三星摄像头凸起的手机抖音电商预售战报数据显示,截至10月27日24点...
日期:11-11
古茗向港交所提交上市申请书_古茗上市对加盟商有什么好处
1月2日 消息:1月2日,古茗控股有限公司向港交所提交上市申请书。vivo nex前指纹手机小米13屏幕尺寸数据显示,2023年,古茗的GMV达到人民币192亿元,较2022年增加37.2%。截至2023年1...
日期:01-03
博主因性别称谓发视频曝光空乘 网友:你男扮女装要别人怎么称呼?
近日,有一位博主称飞行途中乘务员没有用姓氏加性别称呼问候自己,随后便发视频曝光空乘,并吐槽乘务员没有眼力见。mozilla和firefox不久后,他又发了一条视频回应,解释当时乘务员向...
日期:06-12
卡巴斯基还能用吗「顺带夸了下360用户,周鸿祎评论美国禁售卡巴斯基软件」
【】6月24日消息,据外媒报道,美国商务部近日宣布,将禁止俄罗斯网络安全企业卡巴斯基的反病毒软件在美国市场销售,禁售措施将于9月29日生效。对此,国内安全公司360的创始人周鸿祎...
日期:06-24
2021中国新经济企业500强榜单发布 腾讯、阿里、字节位列前三_2020中国新经济企业500强榜单发布
  中国企业评价协会发布了“2021中国新经济企业500强”榜单,腾讯、阿里巴巴、字节跳动位列前三。魅族手机黄章简介  榜单显示,2021年新经济500强榜单,较上年变化率达到34.2...
日期:09-05
带来制造难题 苹果混合现实头戴设备的设计复杂性超乎想象
苹果的混合现实头戴设备被报道称将是该公司迄今为止最复杂的硬件产品,其独特的设计给制造带来了前所未有的挑战。据 The Information 报道,这款头戴设备采用了非传统的弯曲设...
日期:09-26
快手116品质购物节「快手116心意购物节玩法公布:两倍流量助推+官方补贴」
10月20日消息,快手电商正式官宣2022年快手116心意购物节主题为“真的补,真的省”。作为快手电商的第5个116,今年快手116心意购物节分三个活动阶段:9月28日至10月19日为商家报名...
日期:10-21
双11淘宝直播开局战报出炉!薇娅李佳琦都很拼,但的惊喜不是他们
“疯了,抢疯了...”身经百战的薇娅,露出了不可思议的表情。“所有女生,真的没办法加了”,李佳琦也一脸无奈。“还是备货备少了...”,雪梨对着镜头外的助理说道。10月21日零点,淘宝...
日期:08-01
从3499元跌到2687元,16GB+512GB旗舰沦为中档机,IMX890+1.5K屏_imx8处理器
刘作虎成立一加之初,并不太想把一加和OPPO扯上关系,而且一加最开始主攻海外市场,收获了不少海外粉丝之后,才开始慢慢发展国内市场,与国外市场一样,一加在国内也是风生水起销量年年...
日期:10-06
李彦宏14亿投资家乡阳泉 每年为中国节电1亿度
  提起李彦宏大家都不陌生,百度创始人、董事长兼CEO,BAT三大佬中唯一的北方人。他创立的百度是当今世界上最大的中文搜索引擎,也是国内最早布局人工智能的公司之一,人工智能...
日期:02-21
快手出品!DragAnything:拖动锚点精准控制视频物体和镜头运动_快手总出现拖动滑块
划重点:⭐️ 快手科技联合浙江大学研究团队提出了 DragAnything 方法,利用实体表示实现了对任何物体的运动控制。⭐️ 对比现有的运动控制方法,DragAnything 在用户友好性、对象多...
日期:03-13
vivo手机x100多少钱「vivo X100 Ultra今晚发布:具体参数曝光」
5月13日 消息:在科技数码界掀起一阵热潮的vivo X100Ultra今日正式揭开了其神秘的面纱。作为vivo的最新旗舰机型,X100Ultra凭借其前沿的参数细节,将再次引领手机摄影的新风潮。...
日期:05-13
中国移动公布5G基站集采结果,五大设备商分得蛋糕_中国移动5g集采中标
通信世界网消息(CWW)5月28日,中国移动在其采购与招标网公布了2024年至2025年5G无线主设备(2.6GHz/4.9GHz、700MHz)单一来源采购公告,此次中国移动共集采48万站5G基站,五大设备商皆...
日期:05-29
董宇辉博物馆直播打灯遭质疑 会破坏文物吗 馆方回应_董宇辉演讲
快科技3月28日消息,近日,董宇辉在湖北行直播期间,参观了湖北省博物馆以及荆州博物馆。kbg25管价格多少1米然而,其团队在博物馆内直播时使用了补光灯,这引发了一些网友的质疑。他...
日期:03-28
AI 大语言模型 LLM,为啥老被翻译成法学硕士?!_ai语言是什么
声明:本文来自微信公众号“极客公园”(ID:geekpark),作者:靖宇,,授权转载发布。但凡偷懒一点,喜欢用浏览器或者翻译插件来看英语新闻的同学,估计都免不了在 AI 大模型火热的当下,被满...
日期:11-06