您的位置:首页 > 互联网

英伟达预告新版TensorRT-LLM,推理能力飙升 5 倍、支持 Chat API_英伟达新发布

发布时间:2023-11-16 18:34:50  来源:互联网     背景:

IT之家 11 月 16 日消息,微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持。

英伟达新产品

周鸿祎听音室

IT之家今年 10 月报道,英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。


英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

苹果将在印度生产iphone 13

英伟达官宣

2020苏宁双11狂欢夜


TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达还为此推出了抢先体验注册页面。

英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

用户可以在 8GB 显存以上的 GeForce RTX 30 系列和 40 系列 GPU 上运行,一些便携式 Windows 设备也能使用快速、准确的本地 LLM 功能。


4g网络太慢了


返回网站首页

本文评论
RIM管理层面临新挑战 CEO不得兼任董事长(rim公司现状)
6月12日消息,据国外媒体报道,RIM已经很难跟上苹果等竞争对手。现在,RIM又面临另一个挑战:持不同政见的股东要求改变公司的管理方式。 作为RIM股东的一个加拿大投资公司Nor...
日期:07-30
一加 Ace 2 今日开售:12GB 内存起步,2799 元起
IT之家 2 月 13 日消息,2 月 7 日一加正式发布了 Ace 系列新品一加 Ace 2,该机将于今日上午 10:00 正式开售,起售价 2799 元。一加中国区总裁李杰表示:一加 Ace 2 是明确双品牌...
日期:02-13
上热搜了!网友盘点iPhone羡慕安卓的功能:一只手都数不过来「苹果安卓功能」
快科技7月21日消息,微博话题iPhone羡慕安卓的功能”上了热搜榜。谷歌眼镜项目有网友盘点了国产安卓手机已有、iPhone却不具备的功能,轻松一盘点就多达十几项,具体如下:1、高频PW...
日期:07-22
5月6日将发布“1+N认知智能大模型”-科大讯飞刘聪_科大讯飞刘聪博士简介
4月7日消息,在近日召开的人工智能大模型发展论坛上,科大讯飞副总裁、研究院执行院长刘聪透露:科大讯飞“1+N认知智能大模型”将在5月6日正式发布。8月份造车新势力销量realme r...
日期:10-03
“2021年全球500强品牌 ”公布_2021年世界500强企业榜单
  (原标题:“2021 年全球 500 强品牌 ”公布:苹果时隔 5 年再次成为全球最有价值品牌)   1月28日消息 评估权威机构 Brand Finance 每年都会发布 “全球 500 强品牌”,今...
日期:04-07
可预测像素值 英伟达RTX-4070中端芯片增加AI功能
北京时间4月13日早间消息,据报道,英伟达周三宣布,该公司将为游戏玩家提供一款通过更多人工智能功能来提高画质的中端芯片。此举表明,尽管游戏业务的收入放缓,但对英伟达依然非常...
日期:10-03
雷军的演讲「雷军:这次演讲比前几年更长 估计3小时 are you ok?」
  【手机中国新闻】2023雷军年度演讲将于8月14日(周一)晚7点举行,这是雷军的第4个年度演讲,主题是“成长”。雷军在微博上透露,相比前几次演讲,这次将会扩充更多内容,所以时间比...
日期:08-09
这个“五一”,200元一次的高校游火了
声明:本文来自于微信公众号 电商在线(ID:dianshangmj),作者:王崭,授权转载发布。“这是学校的情人坡,不过在这玩儿的不少都是‘单身狗’,情人反而比较少。之前还有人在这拍婚纱照,...
日期:05-07
三星MICRO」,LED以极致工艺彰显制造初心 「未来显示背后的技术突破「三星led官网」
作为MICRO LED技术坚定的支持者和先发品牌,三星自研发制造MICRO LED显示以来,不断以创新技术解决产品发展难题,以突破革新保持行业领先地位。7月15日,在厦门举办的三星MICRO LED...
日期:09-10
西双版纳比三亚怎么样「春节被挤爆的西安和西双版纳,为何逆袭三亚?」
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:杨晓鹤 陈桥辉,授权转载发布。三星在印度金山软件董事会以往每年春节,最热门的旅游目的地都很好猜测,不是海南三亚,就是东南...
日期:01-31
“苹果GPT”秘密开发中?
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:毕安娣,授权转载发布。盼望着,盼望着,苹果的脚步近了。当地时间周三,彭博社科技记者马克·古尔曼(Mark Gurman)爆料,苹果正在...
日期:07-21
荣耀v40 ddr「荣誉发布全新内存版荣耀x40」
荣耀宣布发布全新内存版荣耀x40 gt,采用8gb+128gb,售价仅为1799元。这款手机配备了旗舰级的snapdragon 888芯片,使其成为游戏的理想选择。荣誉将手机的散热系统升级为13层3d散...
日期:04-29
终于通网入驻抖音!郁美净董事长直播间跳舞:10小时带货超100万_郁美净集团网站主要栏目
9月15日消息,最近几天,在众多国货品牌跟热度、抱团、炒cp的同时,网友发现,天津老牌国货郁美净”刚刚注册账号。ios14.7何时发布中国互联网金融协会rtx3080 8G天津郁美净集团有限...
日期:09-15
AI前哨 | 多模态虚拟人或成ChatGPT终点「前哨工具」
凤凰网科技讯 《AI前哨》5月24日消息,ChatGPT的火爆,伴随AIGC生成算法的广泛运用和各类多模态模型的涌现,让虚拟人正加速进化成真正的“人”,或许能够使其成为ChatGPT之后能承载...
日期:05-25
素描人工智能「开发人员创建一个AI素描工具来生成嫌疑人画像 专家却无比担忧」
2月8日 消息:据Motherboard报道,两名开发人员使用 OpenAI 的 DALL-E2图像生成模型创建了一个法医素描程序,可以根据用户输入内容为创建“超逼真的”嫌疑人素描。iphone11proma...
日期:02-08
掌舵18个月净亏29亿!国美电器已被申请破产清算 昔日中国首富正断臂求生
中城院要案中心11月29日发布称,国美电器有限公司因拖欠供应商数百万货款,经催要不能偿还,被向北京市第一中级人民法院破产法庭申请破产清算,法院已启动审查。国美2022年中报显示...
日期:12-03
火山同传亮相北京智源大会 为AI学术交流提供实时字幕
  6月1日至3日,国际性人工智能学术交流活动北京智源大会在线上和线下同步召开,超过3万名人工智能领域专业人士注册参会。大会期间,火山引擎旗下产品“火山同传”为现场和...
日期:03-02
DeepMind推出AI图像识别工具;华为Mate 60 Pro接入盘古大模型
08/29全球AIGC产业要闻1、谷歌推出面向AI大模型的芯片TPU v5e2、谷歌引入Meta、Anthropic的AI模型到云平台3、DeepMind推出AI生成图像识别工具4、Windows Copilot预览版引入...
日期:08-30
从618看电商终局,自营电商或成为马拉松赢家?_618电商业绩
  2020年618的关注度与补贴比拼,堪称史上之最,从百度指数的变化也可见一斑。从6月1日起,“618”的百度指数较去年同比增长 36%,关注度比去年更高,是近五年来倍受瞩目的年中购...
日期:07-14
“2023我喜爱的中国品牌”百强!见证麒麟软件品牌力量_中国麒麟软件公司是不是央企
在品牌强国战略的牵引下,由新华社、中国品牌建设促进会、中国资产评估协会共同主办,浙江省人民政府联合主办的 2023 中国品牌日系列活动在浙江德清隆重举行。活动期间,第六届点...
日期:05-15