您的位置:首页 > 互联网

阿里魔搭社区开源推理引擎 DashInfer_阿里 mock

发布时间:2024-05-24 10:42:42  来源:互联网     背景:

5月24日 消息:ModelScope 推出了预训练大语言模型(LLM)推理引擎 DashInfer,支持 C++ 和 Python 语言接口,可在多种 CPU 架构上高效推理大模型。

阿里魔战在线阅读

DashInfer 采用 C++ Runtime 编写,支持连续批处理和多 NUMA 推理,能充分利用服务器级 CPU 的算力,为推理14B 及以下的 LLM 模型提供更多硬件选择。该引擎已开源,提供轻量级架构,高精度实现,优化的计算 Kernel,以及行业标准 LLM 推理技术。DashInfer 支持主流 LLM 开源模型和 PTQ 量化技术。

阿里魔战在线阅读

此外,引擎还提供多语言 API 接口,支持多种硬件和数据类型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等数据类型。关于模型支持,DashInfer 可以加载和序列化模型,执行推理过程,并采用 DLPack 格式的 tensor 与外部框架交互。在单 NUMA 架构下,推理引擎使用多线程和线程池进行调度;而在多 NUMA 架构下,引擎采用多进程 client-server 架构,实现 tensor parallel 的模型推理。

30米÷6=多少分米

阿里魔战在线阅读

古墓丽影暗影1060显卡测试

性能测试结果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能够有效提升大模型推理效率。

美团股东 腾讯

代码开源地址:

https://github.com/modelscope/dash-infer

推理体验地址:

https://www.modelscope.cn/studios/modelscope/DashInfer-Demo


返回网站首页

本文评论
华为回应美或出台新规「白宫回应华为新手机发布:将继续对华搞“小院高墙”技术限制」
据白宫网站发布的记者会实录,美国总统国家安全事务助理沙利文当地时间5日在回答有关问题时表示,在获得有关华为新手机技术的具体特征和组成信息前,不会对特定芯片和问题发表评...
日期:09-07
国庆档黑马《万里归途》票房突破2亿:评分9.6「一千万票房」
据灯塔专业版实时数据,截至10月1日18时8分,影片《万里归途》票房突破2亿。截至10月1日16时54分,2022年国庆档新片总票房(含点映及预售)突破3亿,《万里归途》以票房2.02亿(含点映...
日期:10-04
微软暗示 Win11 23H2 重大版本“太阳谷 3”将“精细投资”_Windows 10 21H2太阳谷
  据 Windows Latest 报道,在 Windows 11 的发布活动中,微软表示将重新关注这个成名的操作系统。作为提高 Windows 普及度努力的一部分,微软将部分 Windows 开发转移到 Pano...
日期:11-12
新突破!亚信科技将与通号、中铁一局联合打造西南最大高铁智慧枢纽
新突破!亚信科技将与通号、中铁一局联合打造西南最大高铁智慧枢纽 通信产业网|2023-06-09 15:43:21作者:通文来源:通信产业网【通信产业网讯】日前,重庆东站配套综合交通枢纽工...
日期:06-09
育碧《全境封锁2》出离谱Bug:修复更新问题反而导致更新系统故障
一直以来,除了祖传的糟心服务器质量外,育碧旗下游戏最为人所诟病的,就是其堪称百花齐放,突破人想象力的神奇Bug。近日,育碧发布公告,表示在修复《全境封锁2》更新问题的过程中,开发...
日期:02-13
国家邮政局消息,今年双11「“双11”大促即将开始!国家邮政局:11月前4天揽收超20亿件」
快科技11月5日消息,我们从国家邮政局官网获悉,随着一年一度的双11”大促即将开始。作为华为公司的创始人,任正非十分注重11月1日-11月4日,我国全网累计揽收量达到了20.27亿件,同...
日期:11-05
​Paper-Piano纸上钢琴:通过摄像头追踪在纸上就能演奏钢琴
划重点:- 魄力的意思是什么文中老先生破的例是指什么女性艾滋病可以治愈吗2019创维led电视最好画质是哪一款...
日期:03-13
eBay宣布将裁员500人 约占员工总数4%「ebay全球副总裁年收入」
  讯 北京时间2月8日早间消息,据报道,当地时间周二,eBay提交给美国证券交易委员会(SEC)的文件显示,eBay宣布计划裁员500人,约占其员工总数的4%。小米商城米粉节比亚迪赵长江跳槽...
日期:02-08
西安不倒翁小姐姐回应生娃后变憔悴:少贩卖焦虑「西安不倒翁女孩换人了吗」
近日,西安大唐不夜城的演员冯佳晨成为网络热议的焦点。一段“大唐女子绝美牵手”的短视频中,她扮演的“唐妞”宛如随风摇摆,轻舞罗扇,将中国唐朝美人的妩媚娇羞演绎得淋漓尽致。...
日期:02-08
美团外卖与顺丰同城、闪送、UU跑腿达成合作「美团跑腿和顺丰同城哪个好」
8月28日消息,美团外卖宣布与顺丰同城、闪送、UU跑腿达成合作。美团外卖将结合自有配送体系,与合作方共同为商家打造更丰富配送网络,合作将给商家提供更丰富的运力选择、提升经...
日期:08-28
华为云安全月特惠来袭,为你的数据安全保驾护航(华为云服务安全储存你的数据)
  如今数据的重要性不言而喻,数据的安全直接关系到企业的未来发展乃至生存问题,一旦发生安全事故,其后果是不堪设想的。但很多企业在购买云服务后,往往会因为成本原因缩...
日期:05-22
滴滴能打到自动驾驶汽车了 UP主体验:车上有司机 禁止拍照「滴滴自动驾驶app」
快科技5月8日消息,今年3月27日,滴滴自动驾驶作为第一批获得广州智能网联示范运营资质的企业,正式在花都开启商业化运营。乘客打开滴滴自动驾驶”小程序,输入出发地和目的地,点击...
日期:05-08
外媒:韩国12月芯片出货量同比增长113.7% 创1997年来最大增幅_韩国芯片产业链
通信世界网消息(CWW)近日,据外媒报道,韩国2023年12月的半导体出货量创下1997年以来的最大增幅,同时库存增长进一步放缓,这表明该国最重要的行业正在清理积压的电脑内存。韩国统计...
日期:01-31
春节档入账超8亿,王健林的“电影梦”又行了?
声明:本文来自于微信公众号全天候科技(ID:iawtmt),作者 | 胡描 编辑 | 罗丽娟,授权转载发布。近日,网传《流浪地球2》电影票在大连万达国际电影城标价高达300元/张,引发热议。网友...
日期:01-30
人工智能在音乐及相关领域的发展「人工智能走出科幻片,AI音乐立法走到哪一步了?」
声明:本文来自微信公众号“音乐先声”(ID:nakedmusic),作者:范志辉,授权转载发布。“2023年是人工智能技术走出科幻小说领域的一年。”面对去年人工智能技术的突飞猛进,Billboard...
日期:01-26
灵动版本「iPhone 15及Plus预计有17项升级和变化 包括灵动岛和4800万像素主摄」
8月28日消息,据外媒报道,上周曾有外媒在报道中表示,苹果即将推出的iPhone15系列中的Pro款和Pro Max款,较上一代将在芯片、边框、充电、存储等方面将有21项升级和变化,价格也会更...
日期:08-28
荣耀官宣自研端侧平台级AI大模型:魔法大模型
快科技1月10日消息,在下午的荣耀MagicOS 8.0发布会上,荣耀官宣了自研端侧平台级AI大模型魔法大模型。东风风光ix7值得购买吗据介绍,荣耀魔法大模型是一款具有70亿参数的大模型,...
日期:01-10
2020数字政府发展指数报告前三名「IDC发布2022年数字政府大数据及数据治理市场份额报告」
通信世界网消息(CWW)建设数字中国,发展数字经济是推进中国式现代化的重要引擎。数字基础设施和数据资源体系是数字中国建设的“两大基础”,大数据平台作为数字基础设施的关键能...
日期:07-12
运营商财经网康钊:中国高铁会被进口轴承卡脖子?「国产高铁轴承上市公司」
运营商财经 康钊/文中国高铁的技术全球领先,但这不代表着中国高铁的所有零部件都能自己生产,轴承一直就是个大问题。近日,中国轴承工业协会总工程师何加群撰文呼吁应加快高速动...
日期:07-12
小米ai os14「徕卡影像之王 小米科普14 Ultra首个AI大模型计算摄影」
快科技3月13日消息,今年2月,徕卡影像之王小米14Ultra正式发布,这是小米有史以来最强悍的影像旗舰,不仅配备全新Summilux全明星四摄,还首次搭载AI大模型计算摄影平台Xiaomi AISP。...
日期:03-13