您的位置:首页 > 互联网

可在RTX工作站上部署-英伟达发布80亿参数新AI模型,精度、效率高_英伟达新品

发布时间:2024-08-23 12:00:40  来源:互联网     背景:

8 月 23 日消息,英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。

英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。

英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12B,并知识蒸馏(knowledge distillation)轻度重新训练后获得 Mistral-NeMo-Minitron 8B,相关成果发表在《Compact Language Models via Pruning and Knowledge Distillation》论文中。

剪枝通过去除对准确率贡献最小的模型权重来缩小神经网络。在 "蒸馏" 过程中,研究小组在一个小型数据集上重新训练剪枝后的模型,以显著提高通过剪枝过程而降低的准确率。

就其规模而言,Mistral-NeMo-Minitron 8B 在语言模型的九项流行基准测试中遥遥领先。这些基准涵盖了各种任务,包括语言理解、常识推理、数学推理、总结、编码和生成真实答案的能力。附上相关测试结果如下:

英伟达ai技术

参考

iphone12画质模糊

股东质押及解除质押

Lightweight Champ: NVIDIA Releases Small Language Model With State-of-the-Art Accuracy

Mistral-NeMo-Minitron 8B Foundation Model Delivers Unparalleled Accuracy

朋友圈设置三天可见,你怎么看

Compact Language Models via Pruning and Knowledge Distillation

为什么停售布洛芬


返回网站首页

本文评论
多款 App 下线拍照搜题功能(拍照就可以搜题的APP,答案秒出!)
  8 月 24 日消息 近日,好未来旗下中小学拍照搜题软件题拍拍发布公告称,题拍拍从 2021 年 8 月 5 日起不再提供拍照搜题服务。此前,在线教育平台阿凡题也于 2021 年 8 月 3...
日期:03-23
苹果手机花多少钱「买一部iPhone手机要花多少年薪 中美差距超6倍」
如果你住在美国,花费总年薪的1.8%左右就可以购买一部iPhone 14,这一数字在全球范围内处于较为优秀的水平。然而,这一数字在一些其他国家和地区则远高于此,部分消费者需要花费50%...
日期:03-01
欧洲企业裁员「“他们裁员,我们招聘” ,美国硅谷大裁员德国公司捡漏」
1月31日消息,许多德国公司正面临劳动力市场供需紧张的困境,急需具备关键软件工程技能的员工,为此他们正将美国硅谷裁员潮视为招聘顶尖人才的绝佳机会。iphone11黄牛价格美国西...
日期:01-31
OPPO首个AI大模型!安第斯大模型AndesGPT发布_oppo安第斯事业部在哪
快科技12月27日消息,据OPPO官方消息,OPPO今天举行了Find X7系列技术沟通会,在这次会议上,OPPO首个AI大模型安第斯大模型AndesGPT正式发布。据官方介绍,AndesGPT具备功能全面、强...
日期:12-27
《阿凡达2》12月16日上映 能救活电影院吗?机构预计国内票房超20亿_阿凡达2还能上映吗
前两天,科幻电影迷们终于迎来了今年最重磅的消息,《阿凡达2:水之道》中国内地正式定档,12月16日同步北美上映。gta5被黑客入侵制片人Jon Landau也发文宣布,已经完成了最后的混音...
日期:11-27
抖音下载量全球第一「Sensor Tower:10月抖音全球移动应用下载量」
11月23日 消息:据Sensor Tower最新数据显示,今年10月,抖音及其海外版TikTok仍然是全球热门移动应用(非游戏)下量第一,总下载量达6600万次。其中,抖音的下载量占12%,TikTok 巴西市场...
日期:12-12
山东联通携手中兴通讯打造临沂、淄博双会场万兆体验,助力用户体验再升级
通信世界网消息(CWW)近日,山东联通携手中兴通讯,在临沂琅琊古城、淄博烧烤节现场部署5G-A 网络,创新使用5G-A新品业界最大带宽万兆AAU,既解决景区高密度用户区域的容量问题,又大幅...
日期:05-09
高德地图自己定制路线_高德推出 DIY 地图功能:可定制自驾游路线,自主标记多位置点
  8 月 23 日消息 高德地图近日创新上线了新功能 DIY 地图,可以让用户所见即所得地绘制属于自己的地图,自主标记多个位置点,自由创建定制路线。DIY 地图支持多人共建,用户通...
日期:06-05
苹果 欧盟「欧盟之后还有日本,苹果要被迫开放第三方应用商店了」
“苹果即将发布的iOS 17或首次带来对第三方应用商店的支持,以满足欧盟数字市场法案的要求”,这一消息如今已传得沸沸扬扬,也意味着其多年来苦心孤诣维持的“围墙花园”,可能很快...
日期:06-05
AI赚钱案例!​我通过编辑ChatGPT生成的内容赚了3500美元
划重点:⭐️ Sultan Ali 通过帮助忙碌的客户使他们的 AI 生成的内容听起来更加人性化,已经赚取了超过3500美元。⭐️ 他分享了4个他如何做到这一点的建议。⭐️ 他在巴基斯坦的巴哈...
日期:02-26
游客吐槽25元看海洋馆就几个鱼缸 大排档的海鲜都比这生猛「海洋馆鱼的品种大全及名字」
微信的社交功能"朋友圈"可以发布文字、图片或分享音乐等内容,好友可以对内容点赞、评论。然而,自从微信从社交软件变成了办公软件后,朋友圈也出现了各种各样的广告。近日,一位宁...
日期:03-13
中国单身人口超2亿 “单身经济”引关注
中国单身人口数量超过2亿,单身经济成为一个万亿大市场。近年来,随着传统文化的深入人心,七夕节日益成为国人表达爱意的重要节日。魅族2k+120数据显示,七夕节玫瑰销量较情人节增...
日期:08-23
Note 11挤入2022年全球智能手机出货量前十榜单 为国产手机正名_Redmi
3月10日消息,日前,市场调研机构Canalys公布了2022年全球智能手机出货量Top10的榜单。榜单中,苹果和三星的产品占据了前十名中的九个位置,而Redmi Note 11则成为唯一上榜的国产手...
日期:09-19
国美零售港股盘中涨超30% 消息称国美电器将启动门店直播「香港国美零售股票」
11月25日 消息:今日盘中,国美零售港股一度涨超30%,截至发稿,国美零售上涨34.45%,报0.160港元,总市值57.15亿港元。此前, 有消息称,国美电器将在全国各地门店陆续启动直播。据悉,国美...
日期:12-03
这次的跨年演讲们,你看了吗?「跨年演讲题目」
声明:本文来自于微信公众号三言Pro(ID:sycaijing),作者:DorAemon,授权转载发布。前几天,又到每年一次的“跨年演讲季”。与往年一样,罗振宇、吴晓波早就开始为造势宣传;同时,还有很...
日期:01-04
马斯克自动驾驶汽车「马斯克自动驾驶出租车项目定名“Cybercab”:8月8日首发亮相」
快科技4月24日消息,据媒体报道,特斯拉首席执行官埃隆马斯克近日宣布,特斯拉的自动驾驶出租车将于8月8日亮相。尽管详细信息尚未公布,但在周二特斯拉第一季度财报电话会议上,马斯...
日期:04-24
樊代明院士:我为何力挺中医「樊代明院士:4万种疾病90%以上无法治愈,医学创新很紧迫」
作者:章剑锋 出品:网易新闻《科学大师》栏目网易新闻《科学大师》栏目本期访问樊代明医生,他最看重和喜欢的是“医生”头衔,因为治病救人是他毕生从事的本职工作,他同时也是一位...
日期:01-22
软硬件结合提供最优游戏体验 黑鲨4将与更多游戏厂商深度合作(黑鲨4系列软件系统)
  最近的手机市场可谓热闹非凡,伴随着高通新一代旗舰处理器骁龙888的问世,众多新机蓄势待发引起了不少用户的关注与讨论。强悍的性能一直都是游戏手机的标配,黑鲨作为游...
日期:09-10
神经元科技发布AI Agents—“萨蔓莎”
(原标题:神经元科技发布AI Agents—“萨蔓莎”) 今天神经元科技发布AI Agents—“萨曼莎”(Samantha )! 取名“萨蔓莎”,是来自于...
日期:12-30
曙光重磅亮相2020中国智能制造联盟大会  张迎华:先进计算赋能智能制造和工业互联网,助力中国制造业高质量发展
  1月13日,由中国智能制造系统解决方案供应商联盟、中国电子技术标准化研究院主办的2020年中国智能制造系统解决方案大会暨联盟会员代表大会在北京召开。工业和信息化部副...
日期:09-09