您的位置:首页 > 互联网

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资_ar together

发布时间:2023-12-21 16:29:23  来源:互联网     背景:

声明:本文来自微信公众号“阿尔法公社”(ID:alphastartups),作者:阿尔法公社,授权转载发布。

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic,而这两家公司最大的投资者分别是微软和亚马逊,他们投资的很大一部分不是资金,而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。

在闭源大模型之外,还有另一个阵营是开源大模型,MetaAI的llama系列就是其中的代表。Meta还牵头组建AI联盟(AI Alliance),旨在推进人工智能领域的开源发展,对抗AI闭源巨头如OpenAI和英伟达。

使用开源大模型做应用的创业公司,大部分也希望保持自己的独立性,会使用多云策略,而一个能力强,成本低的AI云平台就非常需要。

together.ai就是一个为AI创业公司提供训练,推理服务云平台的公司,事实上,它也是一个拥抱开源生态的全栈AI公司,拥有自己的模型和数据集,在AI底层技术方面有很深的积累。

近日,together.ai获得Kleiner Perkins领投的1.025亿美元A轮融资,NVIDIA和Emergence Capital等投资者也参与本轮,其他的投资者还包括NEA、Prosperity7、Greycroft、137Ventures和Lux Capital、Definition Capital、Long Journey Ventures、SCB10x、SV Angel等Together种子轮的投资者。

它的种子轮投资者除了机构外,还包括IronPort联合创始人Scott Banister、Cloudera联合创始人Jeff Hammerbacher、Oasis Labs创始人Dawn Song、OpenSea联合创始人Alex Atallah等。本轮融资是公司之前融资规模的五倍,累计融资额1.2亿美元。

together.ai的联合创始人兼CEOVipul Ved Prakash表示:“如今,训练、微调或产品化开源生成AI模型极具挑战性。当前的解决方案要求企业在人工智能方面拥有重要专业知识,同时能够管理大规模基础设施。together.ai平台一站式解决了这两大挑战,提供了易于使用和获取的解决方案。我们的目标是帮助创建超越封闭模型的开放模型,并将开源作为整合人工智能的默认方式。”

如果您对人工智能的新浪潮有兴趣,有见解,有创业意愿,欢迎扫码添加“阿尔法小助理”,备注您的“姓名+职位”,与我们深度连接。

苹果前高管和大学教授打造AI开源云平台

together.ai创建于2022年6月,联合创始人包括Vipul Ved Prakash、Ce Zhang、Chris Re和Percy Liang。

Prakash此前创立了社交媒体搜索平台Topsy,该平台于2013年被苹果收购,随后他成为苹果的高级总监。

Ce Zhang是苏黎世联邦理工学院计算机科学副教授,领导“去中心化”人工智能的研究。

Percy Liang是斯坦福大学计算机科学教授,指导该校的基础模型研究中心(CRFM)。

Chris Re共同创立了多家初创公司,包括SambaNova,该公司为人工智能构建硬件和集成系统。

ar together

Prakash表示:“去年Chris、Percy、Ce和我聚在一起时,我们都清楚地感觉到,AI基础模型代表了技术的一次代际转变,而且可能是自晶体管发明以来最重要的一次。

与此同时,过去几十年在人工智能创新中领先的开源社区在塑造即将到来的人工智能世界方面的能力有限。

我们看到这些模型趋向于在少数几家公司中心化(OpenAI、Anthropic、Google),这是由于训练所需的高端GPU集群的巨大开销。

这正是together.ai试图改变的,通过创建开放和去中心化的替代方案,来挑战现有的云系统(如AWS、Azure和Google Cloud),这对未来的商业和社会将是'至关重要的'。

随着企业界定义其生成式人工智能策略,他们正在寻找隐私、透明度、定制化和部署的便利性。目前的云服务,由于其封闭源模型和数据,无法满足他们的需求。”

华人学者携FlashAttention技术和Mamba模型加入团队任首席科学家

今年7月份,Tri Dao作为首席科学家加入公司团队,Tri Dao在斯坦福大学获得了计算机科学博士学位,导师是Christopher Ré和Stefano Ermon,他还即将成为普林斯顿大学的助理教授。他的研究曾获得2022年国际机器学习大会(ICML)杰出论文亚军奖。

Tri Dao还是FlashAttention v2的作者,这是一个领先且开源的大语言模型工具,可以加速大语言模型的训练和推理速度。

FlashAttention-2将大型语言模型(LLMs)的训练和微调速度提高了最多4倍,并在NVIDIA A100上实现了72%的模型FLOPs利用率。

FlashAttention-2在核心注意力操作上实现了2倍的加速,在端到端训练Transformer时实现了1.3倍的加速,鉴于大型语言模型的训练成本高达数千万美元,这些改进可能节省数百万美元,并使模型能够处理两倍长的上下文。

目前各个大语言模型公司,包括OpenAI、Anthropic、Meta和Mistral等都在使用FlashAttention。

最近,Tri Dao还参与了一项叫“Mamba”的研究,并提出了“选择性状态空间模型(selective state space model)”这个新架构,Mamba在语言建模方面可以媲美甚至击败Transformer,且随上下文长度的增加实现线性扩展,性能在实际数据中可提高到百万token长度序列,并实现5倍的推理吞吐量提升。

Mamba作为通用序列模型的骨干,在语言、音频和基因组学等多种模态中都达到了SOTA性能。在语言建模方面,无论是预训练还是下游评估,Mamba-3B模型都优于同等规模的Transformer模型,并能与两倍于其规模的Transformer模型相媲美。

在强大的技术团队支持下,together.ai在推理方面的屡有创新,除FlashAttention-2外,他们还利用了如Medusa和Flash-Decoding等技术,已经形成了Transformer模型最快的推理技术堆栈。通过Together推理API,这个堆栈允许快速访问超过100个开放模型进行快速推理。

关于这次融资,Kleiner Perkins合伙人Bucky Moore如此评论:“人工智能是改变我们开发软件方式的新基础设施层。为了最大化其影响,我们需要让开发者在任何地方都能使用它。我们预计,随着开源模型性能接近闭源模型,它们将得到广泛采用。together.ai使任何组织都能在其基础设施上构建快速、可靠的应用程序。”

Together AI的种子轮投资人Lux Capital的Brandon Reeves在接受采访时说:“通过提供跨计算和一流基础模型的开放生态系统,together.ai正在引领人工智能的‘Linux时刻’。together.ai团队致力于创建一个充满活力的开放生态系统,让从个人到企业的任何人都能参与其中。”

不仅有推理速度最快的开源AI云平台,还有自己的数据集和模型

together.ai不仅有AI算力云平台Together GPU Clusters,而且有专门优化的推理,训练和微调服务,还能用自己的数据集为客户定制AI模型,也推出了自己的示例性的开源AI模型。

Together GPU Clusters:训练速度比标准PyTorch快9倍

Together GPU Clusters(原名Together Compute)为AI模型训练专门优化的GPU算力集群。它拥有极快的模型训练速度和极高的成本效率。客户可以在平台上对模型进行训练和微调。

together.ai为这个集群配备了训练软件堆栈,这样用户可以专注于优化模型质量,而不是调整软件设置。

在速度方面,使用了FlashAttention-2的它比使用标准PyTorch快9倍,在成本方面,它比AWS成本降低4倍。它使用的都是NVIDIA的A100和H100高端GPU。

梭子蟹的做法大全窍门

ar together

此外,它还具有极佳的扩展性,用户可以选择16个GPU到2048个GPU的算力规模,对应不同大小的AI模型。对于客户,它也提供专家级别的支持服务,目前它的续订率超过95%。公司已经在美国和欧洲建立了初步的数据中心网络,数据中心合作伙伴包括Crusoe Energy和Vultr。

Together Fine-Tuning:使用私有数据微调

together.ai还提供了模型微调服务,客户可以使用自己的私有数据以微调的方式定制开源模型。together.ai让用户在微调时对超参数拥有完全控制,它的平台还与Weights&Biases对接,让客户的模型微调更加可控和透明。

最后,当模型调优完成后,客户可以在平台上托管自己的模型,并进行推理。

Together Inference Engine:比TGI或vLLM快3倍

Together Inference Engine(推理引擎)基于NVIDIA的CUDA构建,并在NVIDIA Tensor Core GPU上运行。Together的团队使用了包括FlashAttention-2、Flash-Decoding和Medusa在内的一系列优化推理性能的技术(基本是开源的),优化了推理的性能。

Together推理引擎的速度优于其他推理的加速框架或服务在相同硬件上运行时,它的速度比TGI或vLLM(大模型推理加速框架)快达3倍,这意味着,基于大模型的生成式AI应用现在可以提供更快的用户体验,同时效率更高,成本更低。

例如,都使用相同的硬件,利用开源的LLM Perf基准测试工具对Llama-2-70B-Chat模型进行推理(500个输入Token,150个输出Token),测试结果如下图。

此外,在速度超快的同时,Together推理引擎也不会牺牲任何质量,下表显示了几项准确性基准测试的结果。Together推理引擎的结果与参考的Hugging Face实现保持一致。

Together Custom Models:使用自由数据加开源数据集训练

对于企业用户,together.ai还推出了Together Custom Models ,他们可以帮助企业从从零开始构建模型,这本质上是一种咨询服务。

他们拥有专家团队,帮助企业为特定工作负载设计和构建定制化的AI模型,这些模型基于together.ai的RedPajama-v2数据集(30T的Tokens)和企业自有的专有数据训练。

据悉,开源的RedPajama-V2数据集已被下载120万次。

together.ai会提供训练的基础设施,训练技术(FlashAttention-2等)和模型架构(基于Transformer的和不基于Transformer的)及训练配方选择,模型训练好后,还提供调优和对齐服务。

当模型训练出来后,其所有权完全归于客户企业,这对于数据安全很重要的行业大企业来说,具有吸引力;在OpenAI此前的DevDay上,它们也推出了基于GPT模型的模型定制服务,正是看中了这一点。

事实上together.ai在开源模型上已经有不少积累,除了RedPajama-v2数据集外,还包括GPT-JT(一个基于研究小组EleutherAI发布的开源文本生成模型GPT-J-6B的分支),以及OpenChatKit(类似于ChatGPT的聊天机器人)。

在客户方面,除了近日获得5500万美元融资的Pika Labs外,还有Nexusflow、Voyage AI和Cartesia等知名创业公司。

开源生态打破闭源模型的封闭和权利中心化

目前在AI大模型,尤其是基础模型的发展上,工业界(大厂,创业公司)已经明显领先于大学和学术研究机构,而闭源的大模型,也在性能上全面领先开源大模型。

造成这种差距的原因主要在于训练大模型需要的巨量成本(算力成本,人力成本,时间成本),这使得学校和研究机构只能用规模很小的模型(6B或7B)参数去做一些相对边缘的研究;或者去卷基础理论,试图颠覆现有的格局。

闭源大模型超越开源大模型是一个现实,但是这种趋势持续下去,会让AI的权利变得越来越中心化,形成几家巨头(微软、Google)+几家新巨头(OpenAI+Anthropic)的格局。这并不利于整个AI的创业生态向前发展。同时这也是llama2发布时造成那么大震撼的内在原因。

这也就是together.ai的意义所在。一方面,它们搭建算力平台,为企业提供便宜和快速的模型训练和推理服务,一方面也帮助企业打造自己的定制模型,给了企业第三方的选择空间。

在开源方面,它们也提供了自己的数据集,自己的训练和推理技术栈,以及示例性的开源模型,这些努力都是在打破“垄断”。

而together.ai之所以具有这个能力,也和它自身的技术实力分不开,连续创业者和大学教授的组合让他们既清楚企业的痛点在哪儿,又有能力从底层去解决和优化。

其实这也是一个很好的示例,大学教授拥抱创业,利用社会资本做研究,让自己的研究成果影响更多的人。我们也期待更多教授/学者+产业人/连续创业者的创业团队出现。


返回网站首页

本文评论
腾讯将减持美团?知情人士辟谣:没有计划_腾讯持美团多少股份
  原标题:媒体称腾讯将减持美团,知情人士辟谣:没有计划  陌陌2020年营收爱奇艺首席运营官 王湘君  36氪获悉,有媒体报道称,腾讯控股计划出售其所持美团的全部或大部分股份...
日期:10-04
电池集成车身!小米汽车新专利出炉:能提高车辆续航_小米造车 电池
快科技11月28日消息,从天眼查官网获悉,小米汽车科技有限公司申请的电池及车身一体化结构、车辆”专利今日公布。专利摘要显示,该电池及车身一体化结构包括车身和动力电池包,车身...
日期:11-29
iPhone 14关键时刻能救命!男子从峡谷坠落:奇迹生还
快科技7月25日消息,据MacRumors报道,一名男子在洛杉矶附近的威尔逊山地区驾车途中坠入400英尺峡谷,触发了iPhone 14的车祸检测功能,iPhone 14通过卫星通信向外界发出求救信号,当...
日期:07-25
并非永久关停!天涯社区官方:会回来的「天涯社区怎么样了」
快科技4月26日消息,今天早些时候,有网友发现天涯社区的网站和App都已经无法打开,不少人在社交平台上掀起悼念潮”:天涯关了,咫尺天涯,永不再见。但在网站与App无法打开的同时,天涯...
日期:04-26
Chrome网络商店_谷歌今年将在70个国家推Chrome网络商店
  5月20日消息,据国外媒体报道,谷歌周三向开发人员展示了Chrome网络商店,允许消费者通过Chrome浏览器购买游戏、杂志等各项应用。   谷歌产品管理副总裁桑达尔·皮查伊(Su...
日期:07-29
实力彰显 思岚科技斩获2020年度「AI 最佳成长榜」(思岚科技上市进程)
  8月6日,雷锋网发布了「2020 AI 最佳成长榜」,经过专家评审团长达一个月的集中评审,最终评选出60家在产品能力、技术能力、商用价值、数字化改革以及新基建背景下最具成长...
日期:07-15
8人端3600个硬币给结婚好友随份子引围观:网友直呼太会玩
总是有人喜欢在份子钱上别出心裁,比如之前的打白条等等,现在又到硬币。10月25日,河北衡水一对新人婚礼上新郎相交多年的8位好友将份子钱合在一起,换成了3盆硬币,端去了婚礼现场随...
日期:10-26
终于来了,OpenAI发布iOS版ChatGPT,支持语音提问「open chat」
5月19日消息,当地时间周四,OpenAI发布iOS版ChatGPT应用,美国的iPhone用户可以通过苹果应用商店免费下载安装。OpenAI承诺,未来还计划将ChatGPT应用登陆Android设备。iOS版ChatGP...
日期:05-19
国产车型大降价 新款特斯拉Model X/S售价公布:超100万_特斯拉model x国产后会降价么
1月6日,据特斯拉官方,国产Model 3、Model Y迎来大降价,其中前者起售价仅22.99万元,史上最低!同时,特斯拉宣布新款Model S、X在国内正式开售,两款车均提供双电机和三电机版本,至于价...
日期:01-06
新表情包?腾讯申请新狗头图形商标「腾讯注册狗头商标」
10月9日消息,天眼查App显示,近日,腾讯科技(深圳)有限公司申请注册多个狗头形象图形商标以及“微信创意表情”商标,国际分类含广告销售、教育娱乐、通讯服务等,当前商标状态均为申请...
日期:10-09
微动天下教你玩转微信流量 看「稳健集团」有何秘诀?
  摘要:微动天下助力稳健集团进军微信互联网,“小程序+公众号+微商城”或成商家必经之路。   在微信里做运营最困难的一件事就是流量问题,对于企业来讲,获取流量的成本变得...
日期:09-20
2019 AIIA开幕:一“桨”激起千层浪 百度飞桨推动中国产业智能化
  深度学习技术能让文化底蕴浓厚的老茶馆换上科技的“新装”,也能让原本1周的工作量缩短为1个小时,且效果更佳……这些看似稀奇的事已经随着深度学习技术的发展成熟逐渐普...
日期:02-28
网易邮箱大师“邮件群”功能,提升团队邮件协作效率_网易邮箱大师如何群发邮件
  作为职场人士,日常办公中一定少不了需要多人邮件协作的场景,在团队邮件协作上,很多职场人士经常出现这样的问题:   1,收件人太多:需要给团队的人发邮件,由于人太多,一个一个...
日期:09-19
运营23年的易趣宣布关停背后,藏着一个关于商业的真相_易趣为什么会退出
作者/陈根   近日,易趣网运营主体上海盈实信息技术有限公司发布公告称,由于公司调整运营策略,决定停止易趣网络平台运营,关闭易趣网站。2022年8月12日24时前,易趣网将关闭网站...
日期:07-31
天玑9200处理器发布 联发科股价起飞「联发科天玑 900 芯片」
联发科日前发布了新一代旗舰处理器天玑9200,不仅发布时间比去年更早,而且上市更快,vivo已经确定首发,X90系列预计本月份就会第一个用上天玑9200处理器。天玑9200升级了工艺、CPU...
日期:11-16
宝马MINI重现“华人与狗”闹剧,冰淇淋引发的热搜_mini 宝马 关系
还记得“华人与狗不得入内”吗?114年后的今天,居然出现了类似的区别对待。这一次,是宝马MINI。今日网上曝光了一则宝马MINI展台工作人员派发限量冰淇淋区别对待的视频,瞬间引发...
日期:10-02
人魔网全国招聘游戏测试  日薪3000待遇丰厚(网络游戏测试招聘)
  神秘的幕后团队,大热的CTO,震撼的广告,邪恶的概念,万众的期待……这就是在本周吸引众人眼球的人魔网。各专家预测:不管20号发生什么,人魔网本身已经成为2011年经典营销案例。...
日期:07-23
百度发布医疗大模型“灵医大模型”
9月19日消息,百度正式发布“产业级”医疗大模型——灵医大模型,并宣布面向大健康上下游产业开放灵医大模型测评、试用。百度集团资深副总裁、大健康事业群总裁何明科表示,灵医...
日期:09-19
重装上阵怎么造擎天柱_重装升级 擎天一柱 暗影骑士 · 擎不止能打!
  “又卡了!”   “这电脑是用来煎蛋的吧!”   “不行这屏幕帧数太低跟不上枪。”   “什么鬼,暗部细节完全看不见”   “网不好,丢包了!”   上面类似的吐槽,熟...
日期:11-05
NASA计划部署飞机来发现埋藏在美国西南部的关键矿物_nasa发现不明飞行物
美国宇航局(NASA)和 美国地质勘探局(USGS)计划部署飞机来发现埋藏在美国西南部的关键矿物。他们将在天空中绘制矿物地图,这些矿物对拜登政府建立美国清洁能源产业的计划至关重要...
日期:10-05