您的位置:首页 > 互联网

喊话3年超过英伟达,Groq​大模型推理芯片每秒500tokens超越GPU

发布时间:2024-02-21 12:38:58  来源:互联网     背景:

划重点:

1. Groq公司推出的大模型推理芯片,每秒500tokens的惊人速度超越了传统GPU,挑战谷歌TPU。

2. 该芯片由初创公司Groq研发,由谷歌TPU团队原班人马打造,推理速度提高10倍,成本降低十分之一,支持多种大模型。

3. Groq的目标是在三年内超越英伟达,采用自创的LPU方案,克服计算密度和内存带宽瓶颈,实现18倍于云平台速度的推理性能。

 

站长之家(ChinaZ.com)2月20日 消息:Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发,其团队成员来自谷歌TPU,包括创始人兼CEO Jonathan Ross,曾设计实现第一代TPU芯片的核心元件。

Groq采用了全球首个LPU(Language Processing Unit)方案,旨在克服计算密度和内存带宽的瓶颈,最终实现大模型推理性能比其他云平台厂商快18倍。据介绍,英伟达GPU需要大约10到30焦耳才能生成响应中的tokens,而Groq仅需1到3焦耳,使得推理速度提高了10倍,成本降低十分之一,性价比提高了100倍。

Groq的芯片采用14nm制程,搭载了230MB大SRAM以保证内存带宽,片上内存带宽高达80TB/s。在算力方面,该芯片的整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。基于自研的TSP架构,Groq利用机器学习工作负载的并行性对推理进行加速,并支持通过PyTorch、TensorFlow等标准机器学习框架进行推理。

Groq公司在演示中展示了其芯片的强大性能,支持Mixtral8x7B SMoE、Llama2的7B和70B等多种模型,并可直接体验Demo。不仅如此,Groq还喊话各大公司,扬言在三年内超越英伟达。该公司的推理芯片在第三方网站上的售价为2万多美元。

Groq公司以其创新的LPU方案和超越性能的大模型推理芯片,成为大模型推理领域令人瞩目的新兴力量,引领着技术的飞速发展。

Groq产品的特色亮点如下:

1. API访问速度极快:Groq提供了API密钥,可以访问世界上最快的开源大型语言模型(LLM)推理速度。他们的实现在Anyscale的LLMPerf Leaderboard上展示了相较于云服务提供商高达18倍的推理性能。

2. 支持开源LLM模型:*Groq支持Llama2-70B和7B,这两个由Meta AI创建的领先的开源基础LLM模型。这些Groq实现使用4096的上下文长度。

虎牙一年营收

3. 支持其他模型:*除了Llama系列外,Groq还支持Mixtral8x7B,由Mistral AI创建,可根据请求提供。其他模型如Mistral和CodeLlama也可根据特定客户请求提供。

4. 免费试用期: 提供为期10天的免费试用期,可以根据请求进行刷新。在试用期间,用户将获得100万免费令牌,并且API与OpenAI API完全兼容。

5. 价格保证: Groq保证以击败任何已发布的相应模型的百万令牌价格。他们的定价相对较低,可以提供更具竞争力的服务。

6. 早期访问计划: Groq提供了Alpha版本的API的早期访问计划,免费供研究和开发目的使用。公共可用性计划于2024年第二季度。

7. 高性能硬件支持: Groq引擎(LPU™ Inference Engine)在性能上优越,通过硬件支持实现了18倍于云服务提供商的LLM推理性能。

Groq产品以其出色的推理性能、对多种开源LLM模型的支持以及具有竞争力的价格政策等特色,成为一个引人注目的选择。

 


返回网站首页

本文评论
《无主之地》开发商大规模裁员_无主之地公司背景
《小缇娜奇幻之地》开发单位Lost Boys进行大规模裁员,涉及各类岗位,包括游戏制作人这样的高级人才。Lost Boys工作室作为协作单位参与了《小缇娜奇幻之地》的开发工作,后于2022...
日期:01-13
B站要做大开环「b站大开大合」
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:彦飞,授权转载发布。在B站交出2022全年成绩单后,资本市场总算松了一口气。3月2日,B站于美股盘前发布2022年第四季度及全...
日期:03-06
恒天然董事会主席出席首届世界奶业大会 强调可持续发展重要性「恒天然旗下的牛奶品牌」
2023 年 8 月 4 日至 7 日,备受行业关注的首届世界奶业大会在内蒙古自治区呼和浩特市举行。作为全球最 大的乳制品出口商、可持续发展领域的领 导者,新西兰恒天然亮相本次大会...
日期:08-10
联通呼吁运营商成立操作系统联盟 将沃Phone移植到其他终端(联通沃运营苹果客户端下载)
  借鉴苹果、谷歌的成功,我国电信运营商近年来相继推出了自有操作系统,以抵御移动互联网对其主导地位的挑战。飞象网获悉,在此基础上,中国联通正在计划将沃Phone操作系统逐渐...
日期:07-28
荣耀X40 GT官宣 号称战神「荣耀x40处理器」
中关村在线消息:今日,荣耀官方放出了新机荣耀X40 GT的预热海报图,海报的标题是性能跃级标杆,号称战神登场。荣耀X40 GT可能是一台主打性价比的中端性能机,更多相关消息,还请等待后...
日期:10-08
曲面屏也卷起来了,真我10系列新机正式发布「旗舰机都用曲面屏」
中关村在线消息:11月17日下午,真我realme举行主题为“卷出一块好曲屏”的真我10系列新品发布会,正式推出全新一代科技越级代表作真我10系列的三款新品以及真我Buds Air 3S。其...
日期:11-19
戴尔发布新款32寸6K显示器:剑指苹果Pro Display XDR「戴尔显示器23.8寸」
戴尔在今年CES上发布了新款6K分辨率的UltraSharp 32显示器,型号为U3224KB。从定位来看,这款显示器的目标也很明确,就是剑指苹果的Pro Display XDR显示器,定位为设计用途的专业显...
日期:01-22
共享未来,释放无限新机遇 诺基亚贝尔工业元宇宙实验室正式启动
通信世界网消息(CWW)6月29日,在2023上海世界移动通信大会召开期间,由诺基贝尔与全球移动通信系统协会(GSMA)联合主办,中国欧盟商会及芬兰国家商务促进局协办的“聚力工业元宇宙”论...
日期:06-30
不仅支持毫米波,网速还拿下全球第一!联发科M80 5G 基带来了_5G毫米波技术
  近日,联发科正式发布了第二代5G基带M80,相较于上一代的M70,加入了对毫米波技术的支持,完整支持了毫米波(mmWave)和Sub-6GHz两种5G频段。M80基带在5G网速表现上也相当给力,最...
日期:07-10
英特尔建新厂遭遇劳动力短缺:7000名建筑工难招(英特尔工艺工程师倒班)
  讯 北京时间8月23日早间消息,据报道,今年早些时候,英特尔宣布将在美国俄亥俄州首府Columbus投资200亿美元建两座芯片厂,但现在它却发现有一个问题难解决:当地缺少建筑工,而英...
日期:08-23
z9小天才电话手表图片「开学礼物开箱:小天才Z9少年版手表新配色、新系统、超实用!」
(原标题:开学礼物开箱:小天才Z9少年版手表新配色、新系统、超实用!) 今年暑期想着送孩子一份假日礼物,同时也是新学期的开学礼物,...
日期:08-25
任天堂日本总部发生火灾,消息称是由正在充电的电子设备引起的
IT之家 8 月 15 日消息,据报道,日本当地时间 8 月 15 日下午 1 点,任天堂日本京都总部开发大楼的三楼一间房间发生火灾,房间内桌椅在大火中被部分烧毁,没有人受伤。   发生火灾...
日期:08-16
Creatify:用AI做视频广告 便宜且高效
12月20日 消息:Creatify是一个使用人工智能技术生成高质量营销视频的应用程序。用户只需输入产品链接或上传相关描述和图片,Creatify即可生成引人注目的视频广告。与传统UGC...
日期:12-20
亚马逊将首次向第三方卖家收取假日物流附加费_关于亚马逊物流配送费用
据美国消费者新闻与商业频道(CNBC)8月16日报道,为了应对飙升的通胀,亚马逊计划在假日期间提高物流费用,将增加的部分成本转嫁给依靠其网站销售产品的数百万商家。   据报道,亚马...
日期:08-19
5G+北斗”协同创新,中国联通荣获中国卫星导航定位奖科技进步一等奖!
通信世界网消息(CWW)2023年9月19日,中国卫星导航定位协会发布公告,公布2023年度卫星导航定位科学技术奖评审结果。由中国联通牵头,国家授时中心、司南导航和大普通信联合申报的项...
日期:10-28
俞敏洪:曾靠100元游遍了半个中国 没钱了去帮农民插秧_俞敏洪曾因落榜被劝好好在农村干活
快科技7月20日消息,近日,俞敏洪在录制节目中透露,自己在大学期间就游遍了半个中国,并且还是穷游。俞敏洪称,有人说他游遍中国,是因为你财富自由了。其实不是这样的,他在大学一穷二...
日期:07-21
“科目三”摇出圈,海底捞为什么总能站上流量风口?_为什么海底捞里面有空座位还要排队
声明:本文来自于微信公众号 营销看克(ID:yingxiaokanke),作者:来生,授权转载发布。近日,海底捞凭借店员跳舞蹈“科目三”多次登上微博热搜,相关话题和视频内容在各大社交平台持续...
日期:12-04
印度储备银行与麦肯锡、埃森哲合作开发人工智能系统以改善监管
本文概要:1. 印度储备银行选择麦肯锡和埃森哲解决方案来开发人工智能和机器学习系统,以改善监管。2. 印度储备银行已经在监管流程中使用人工智能和机器学习技术,现在计划扩大...
日期:08-15
蔚来开启降价促销 降幅最高超10万 官方回应:没这么夸张「蔚来会降价吗?」
2月3日 消息:2日中午,有媒体报道指出,蔚来发起降价促销,2022款ES6和ES8最高可降价超过10万元,然而据易车报道,这个消息有夸大事实的嫌疑。报道指出,蔚来北京地区工作人员表示:“最...
日期:02-03
合肥云数据中心股份有限公司刘胜军_合肥数字化转型高峰论坛,华云数据助力合肥万家企业上云
  2019年5月31日,合肥市企业上云及数字化转型高峰论坛召开,华云数据作为合肥市企业上云联盟成员受邀参会。与此同时,作为云计算独角兽企业,在企业上云征集活动中,华云数据入...
日期:01-17