您的位置:首页 > 互联网

四面出击的智谱:这家最像OpenAI的中国公司在干什么

发布时间:2023-10-12 11:34:04  来源:互联网     背景:

声明:本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:薛良Neil,授权转载发布。

最像OpenAI的中国公司

位于清华科技园中的Ricci睿奇餐厅提供了从披萨到意面的各种西式简餐,午餐时段这里熙熙攘攘。

除了就餐,提供了类似于第三空间职能的Ricci还成了许多合作最初开始的地方,比如投资人来公司实地探访会选择在这里吃午饭,而如果你看到两个人在Ricci面对面正襟危坐,那么他们大概率是在面试,2023年以来,面试的主题几乎都是大模型。

之所以选择Ricci,是因为对坐落于清华创业园中的大模型公司来说,它的地理位置实在是很方便。比如智谱AI,它的两个办公地分别位于Ricci北面的赛尔大厦和一条马路之隔的搜狐网络大厦。

在Ricci,冲着智谱而来的人很多,因为哪怕是在高手林立的清华科技园,智谱都是明星。

举个例子来说,智谱的GLM-130B模型是少见的可以和GPT-3175B掰掰手腕的模型,用CEO张鹏引述斯坦福模型评测的结果来说,GLM-130B的准确性、恶意性与GPT-3持平,鲁棒性方面甚至更胜一筹。8月31日,首批获网信办批准向公众提供大模型产品服务的公司中,智谱占有一席。

另一个例子是,尽管是一家成立于2019年的创业公司,智谱已经在涉及大模型链路的许多方面推出了许多产品,这里面不仅有各种尺寸的通用大模型,还有基于通用模型而来的对话产品智谱清言,基于华为MindSpore框架的代码模型CodeGeeX,文生图模型CogView以及多模态对话模型VisualGLM,甚至还有硬件。

根据公开资料,就在9月,超云联合英特尔与智谱AI推出了大模型训推一体机,这台采用异构加速架构,搭载了英特尔至强处理器的一体机预装了智谱的定制模型和标准商用模型。

从软件到硬件,从算法到产品,智谱不仅一手打造了一个人工智能产品系列,更重要的是从数据到训练集群运维再到核心算法,智谱都实现了完全的自研。这看上去完全不像一个初创公司的,甚至有些奢侈的做派倒是和大洋彼岸的OpenAI做法十分类似,眼花缭乱的模型和产品始终围绕着AGI通用人工智能这个一致的目标,基于这个目标来组织各种技术和人才资源,并果断All In其中,也无怪乎有人说,这家清华系背景的大模型公司是中国最像OpenAI的公司之一。

清华的实力

智谱所在的清华创业园毗邻清华,从某种意义上说,这座中国最著名的高等学府给了智谱全自研架构的底气。

智谱成立背后的主导人物唐杰,他是清华计算机系的教授,也是中国在人工智能和大模型领域颇具话语权和声量的学术领军人物,彼时全球最大的万亿级超大规模预训练模型悟道2.0正是由唐杰主导开发的。

在智谱团队中,清华系占据相当比重,从网上公开的清华大学知识工程研究室团队中我们能看到,智谱的CEO张鹏、董事长刘德兵和总裁王绍兰的名字都位列其中。

因此当我们回顾智谱成立的来龙去脉,或许会对那句官方介绍中“源自清华技术成果”有更深的理解。智谱不是一家试图抢占这一波人工智能浪潮身位的,匆忙成立的公司,而是在产学研这条链路上走的最快、最紧密的清华计算机系在技术实力发展到一定程度的时候,自然而然的结出的果实,翻开智谱的官网,在公司发展历程介绍中的时间点不是从2019公司成立,而是从2006年算起的,那一年,这支团队发布了名为AMiner的产品用以“科研情报挖掘”,据说正是这项技术让智谱积累了最早的一批客户,换而言之,这家估值超过10亿美金的AI独角兽,在技术沉淀上并不能算做一家初创公司,而智谱从诞生之初就始终保持着和清华强有力的联系,在大模型人才颇为短缺的中国成为了一种不容忽视的优势。张鹏曾表示过,GLM模型训练和开发阶段,智谱和清华大学一直在“联合研究”。

“三有公司”

2020年OpenAI发布了GPT-3,这个时间点恰逢智谱AI成立一周年,根据公开采访,一直紧盯着全球人工智能进展的智谱几乎立刻就意识到了它的潜力,在公司生日的庆祝活动上,张鹏已经开始和周围的人探讨GPT-3所代表的技术方向,一个稠密的、有千亿参数规模的超级大模型,或许会带来人工智能的突破。在此之前,张鹏的团队尝试过各种方法提高模型的参数量和准确性,但效果都不够理想。

GPT的出现最终让智谱决定All In超大规模参数大模型方向,一年之后,智谱的百亿参数大模型发布了,在当时绝大部分人还根本不知道这意味着什么,又过了一年,GLM-130B诞生。

先发优势显著的智谱最终打造出的不止是一个通用大模型,更是一个全新的预训练模型框架,GLM是 general language model 的缩写,翻译过来就是通用语言模型,在这个框架里智谱试图结合GPT和谷歌Bert等各种预训练模型框架的优点,2022年8月,也就是ChatGPT发布前三个月,千亿参数的超大规模预训练模型GLM-130B发布。它不仅在综合性能上和GPT-3有一战之力,还可以在更便宜的服务器上进行推理——由于采用了和GPT不同的架构,GLM-130B甚至可以在四张24G显存的RTX3090显卡上运行。

如果把百度发布文心一言当做国内百模大战正式开打的标志,那么智谱领先了所有人整整7个月,实际上就在文心一言发布的前两天,ChatGLM-6B ——基于GLM的双语对话模型就率先发布了,由于参数量小,ChatGLM-6B 仅靠消费级显卡就能运行,在今年7月,智谱更是把它和它的迭代升级版ChatGLM2-6B开源。

playstation now官网

chatgpt是马斯克做的吗

模型的强劲实力成了智谱对外合作的敲门砖,在相当一段时间内,客户甚至没有什么别的更好的的选择。从360到美团、金山,智谱的模型在客户中的受欢迎程度就像它的模型在huggingface trends排行榜的位置一样高,自然而然的,智谱的融资也异常顺利——某种程度上讲,是智谱在挑选投资者,而不是相反。

这造成了一个很有趣的现象,智谱刚刚完成的B-4轮融资中,腾讯和阿里巴巴据悉都是参投方。能让历来王不见王的阿里和腾讯同时挹注,足见智谱的实力不仅得到广泛认可,而且某种程度上甚至具有一定的排他性——市面上找不到和智谱旗鼓相当的对手让腾讯和阿里分别下注了,要知道上一次这两位巨头投资同一家公司还得回溯到2016年的滴滴,当时的滴滴已经确立了自己在移动出行领域的绝对优势。

清华系背景、强大模型性能还有客户的认可共同形成了外界对智谱的评价:有人、有技术、有客户的三有企业。

百模大战的下一个阶段是?

在2023年下半年,行业中对百模大战下一阶段是什么的回答大多聚焦于用行业数据训练垂直大模型,然而智谱看上去垂直大模型不太感冒。

或许在智谱看来,大模型带来的智能涌现还远未到达尽头,其潜力还有很多可以挖掘的空间,这个时候的主要任务应该是进一步提升大模型的能力,至于垂直行业大模型,那完全可以通过微调实现。

被誉为AI天才,目前正在大模型创业的杨植麟也曾表达过同样的看法——行业模型最终还是要回归到通用大模型上去。巧合(或许也没那么巧合)的一点是,杨植麟本科毕业于清华大学计算机系,他的老师之一,正是唐杰。

与他们的思路不谋而合的还有OpenAI,尽管我们还不知道GPT-5的开发进度(甚至开发有没有开始),但下半年来OpenAI的动作没有一个和所谓垂直大模型有关,相反,OpenAI在竭尽全力提升通用大模型的能力与实用性,比如引入Code Interpreter代码解释器,把新升级的文生图模型DALL·E3和ChatGPT结合起来,甚至允许用户通过图片和实时语音与大模型互动。

许多人把8月31日第一批大模型应用向全社会全面开放作为一个节点,但同ChatGPT带来的破圈效应相比,全面开放的国内大模型应用似乎没有激起太大的水花,这背后同样也反应了通用大模型能力不足的问题,换而言之,推动通用大模型能力持续提升依旧是目前这个阶段中国大模型竞赛玩家的首要任务,百模大战还在继续,但大家的能力差距正在逐步展现。

资本整合背后的技术整合?

6月底,清华大学人工智能研究院新成立了基础模型研究中心,它的首任主任正是唐杰。

清华大学官网视频截图:清华大学校长王希勤(左)、唐杰(中)、中国工程院院士、清华大学人工智能研究院院长张尧学(右)

在这场成立仪式上,智谱AI的CEO张鹏也出席并致辞,他的发言就在唐杰介绍研究中心的发展规划之后。另外两位致辞的人分别是清华大学智库中心的主任和计算机系主任。

值得注意的是,研究中心的两位副主任都是来自计算机系的教授,分别是黄民烈和刘知远,而就在9月,同智谱B-4轮融资消息一同传出的是智谱全资收购了另一家大模型公司聆心智能——它的创立者正是黄民烈。

事实上,尽管是一家初创公司,但智谱在大模型领域出手的次数并不少,聆心智能的天使轮和Pre-A轮智谱都有参与,而智谱还曾投资过另一家清华系的大模型公司的种子轮和天使轮——面壁智能,而它的联合创始人正是基础模型研究中心的另一位副主任刘知远。

有关对聆心智能的全资收购随后被证明不准确,但毋庸置疑的是双方正在进行紧密的合作。这可能与聆心智能自身在通用大模型性能上进展不顺利有关,聆心智能一直在试图打造中国版的CharacterAI,也就是帮助用户创建和定制AI角色并进行对话,去年聆心智能的首个产品“AI乌托邦”基于自研中文对话大模型OPD,但今年,AI乌托邦悄然改名为AiU社区,背后的大模型也变为了名叫CharacterGLM的超拟人大模型,从这个名字我们就能看出,它是由聆心智能联合智谱合作打造的,本质上还是基于GLM-130B模型能力。

从上面的例子中我们看到了大模型赛道上的整合趋势。特别是资本整合背后意味着的是技术上的整合,每个参与百模大战的人都需要证明自己的真正实力,在这一点上,初创公司和巨头之间并不存在本质性差异。

过去的一种比较普遍的观点是,大模型在技术上并不存在绝对的瓶颈,卡脖子的领域主要集中在算力领域。这种略显简单的观点实际上是在说,得算力者得天下,而技术能力和人才储备的重要性被选择性的忽视了。

智谱的例子很好反驳了这一点,无论是针对单卡算力还是国产GPU,智谱的模型都有很好的适配性,最终这导致了成本的大幅度下降,背后依靠的还是技术积累与工程能力上的突破——大厂在这方面并不格外占优,也就是说,胜利的天平最终会向技术领先的那一方倾斜,而智谱也许是这场比赛最终留在牌桌上的几位玩家之一。


返回网站首页

本文评论
网上车市冲刺港交所今起招股,老虎证券打新通道即将开启(老虎证券港股打新)
  12月31日,网上车市启动公开招股。知名美港股券商老虎证券即将开启网上车市的线上申购通道,支持散户打新。   公开资料显示,网上车市拟发行2.04亿股股份,其中公开发售2040...
日期:07-16
百度文心一言已完成 4 次技术版本升级 大模型推理成本降至原来的十分之一
4月26日消息:据 e 公司消息,在 25 日举行的百度智能云文心一言技术交流会获悉,文心一言开启内测一个月以来,已完成 4 次技术版本升级,大模型推理成本降为原来的十分之一。实例解...
日期:04-26
卢伟冰:“Note系列将再次改写千元影像新大门”
Redmi Note 13 Pro系列在天猫官方旗舰店开启了1元权益预定活动,消费者只需支付1元即可获得价值188元的新品礼盒,其中包括电动牙刷、小米背包、有线耳机等。目前,已有超过4000人...
日期:09-18
高德自研惯导增强定位技术,推出智能手机隧道导航解决方案_高德最新导航技术
3月30日消息,针对隧道内定位不准确这一行业顽疾,高德地图宣布已于近日推出全新的智能手机隧道导航解决方案,基于自主研发的VDR惯性导航增强定位(以下简称VDR惯导增强)技术,可大幅...
日期:03-30
爱回收科技资讯:红魔6R骁龙888 5月27日正式发布
  5月24日努比亚手机CEO倪飞曝光了红魔6R的发布会倒计时海报,搭载高通骁龙888芯片!5月27日下午15点正式发布。   根据官方发布的消息,红魔6R拥有高通骁龙888+满血版LPDD...
日期:06-13
因心电图功能涉嫌侵权 部分苹果Apple Watch可能在美禁售_心电图apple watch中国
2月22日消息,据外媒报道,美国政府支持美国国际贸易委员会(ITC)的一项裁决,该裁决可能导致部分苹果Apple Watch被禁止进口到美国,原因是这些Apple Watch侵犯了医疗设备制造商AliveC...
日期:02-22
易信与网易新闻达成战略合作 接入海量优质内容(易信公众号网易用户中心)
  (网易传媒副总裁田华与易信CEO胡勇现场签约)   12月26日,易信与网易新闻在北京举行战略合作伙伴签约仪式,易信CEO胡勇与网易传媒副总裁田华出席现场活动并致辞。据...
日期:11-16
这就是默契!长沙双胞胎兄弟同校同班高考同考688分「湖南双胞胎兄弟考上清华完整视频」
6月25日消息,湖南长沙长郡中学一对双胞胎在家人的见证下查分,二人先后查询高考分数,竟都取得了688的高分。家长抱着孩子惊呼:同校同班,一模一样的分数,神奇。在接受采访时,这对兄弟...
日期:06-26
iphone14上市了吗「又有报告再次确认上周发布的iPhone 14 Plus销量"低于预期"」
在iPhone 14 Plus发布后不到一周,又出现了一份关于iPhone 14和iPhone 14 Plus销量意外下降的报告,表明苹果可能最快在本月主动减少设备的库存和部件订单。DigiTimes的付费报告...
日期:10-18
热血青春 发现更好玩,vivo游戏节正式启动_vivo游戏中心2018
4月15日,vivo游戏中心正式官宣本年度“vivo游戏节”活动强势回归,并公布“嗨个够”指南,涵盖了此次游戏节的三大赛道赛事介绍、决赛预告以及线上互动福利玩法。今年,vivo游戏节...
日期:04-15
毫米波5G速度_不仅支持毫米波,网速还拿下全球第一!联发科M80 5G 基带来了
  近日,联发科正式发布了第二代5G基带M80,相较于上一代的M70,加入了对毫米波技术的支持,完整支持了毫米波(mmWave)和Sub-6GHz两种5G频段。M80基带在5G网速表现上也相当给力,最...
日期:07-16
B站播25年前电视剧《真命小和尚》被起诉侵权:索赔10万
11月14日,华策影业公司起诉B站侵权播放其25年前出品电视剧《真命小和尚》,要求B站下架侵权作品并赔偿10万元。据天眼查App显示,日前,华策影业(上海)有限公司与上海宽娱数码科技有...
日期:11-15
创维X8系列要第三方软件?当贝市场来教你!_创维32x8安装第三方软件
  创维电视作为一家老牌民营电视品牌企业,其生产的电视也广受好评。无论是销量、还是硬件配置、内容数量,都位居同行业前列。许多人电视到手后,都会问怎么安装第三方软...
日期:06-05
iPhone13价格暴涨!Pro断货供不应求_iphone13pro一直缺货
中关村在线消息:10月10日,据相关爆料,自iPhone14系列上市后,iPhone13系列新机以及二手的产品的价格均上涨11%左右,尤其是Pro以及Pro Max版本价格更是迎来近半年新高。由于iPhone1...
日期:10-24
Redmi Note 12R正式开售:1099元起_红米note12最新消息
今天上午10点整,小米商城宣布新机Redmi Note12R正式开售,起售价1099元。Redmi Note12R诚意十足,带来了许多同级产品少有的规格。双面玻璃机身明显提升质感,正面6.79英寸LCD屏分...
日期:06-30
长安汽车通过百度Apollo接入文心一言_长安汽车互联网软件下载
3月8日 消息:2月27日,长安汽车正式成为百度文心一言(英文名:ERNIE Bot)首批先行体验官。苹果13pro发布价长安汽车将通过百度Apollo融合文心一言的全面能力,携手打造基于智能汽车...
日期:03-08
健康保护眼睛 激光电视越来越受宠(激光电视有护眼功能吗)
  眼睛是人类心灵的窗户,基本成为了全人类的共识,但还是有越来越多的人因为不当使用,从而导致各种眼睛问题,尤其是学生。据2020年教育部对中小学生视力情况抽样调查结果显示,2...
日期:07-16
新生态、新发展,天猫星选618创新模式带来破亿成交
  当直播领域成为红海市场,如何通过直播更高效的实现生意达成,甚至让直播为品牌长期营销做出贡献,成为了品牌商家在直播营销中的重要关注点。今年,天猫星选作为阿里巴巴...
日期:04-04
i9 10900k和amd3950x「英特尔酷睿 i9-13900K(350W)跑分强于 AMD R9 5950X 约 67%」
IT之家 8 月 8 日消息,随着英特尔 13 代 Raptor Lake 系列 CPU 发布日期的临近,酷睿 i9-13900K 也频频出现在各大基准测试平台上,不过大都表现平平。现在,@OneRaichu 放出了一份...
日期:09-14
iQOO Z8 手机更多参数曝光:LCD 高刷直屏,搭载 64MP OIS 主摄
IT之家 8 月 21 日消息,iQOO Z8 手机此前已经现身 Geekbench 6 跑分平台,确认搭载天玑 8200 处理器以及 12GB 大内存。现在,这款新机的更多配置被曝光。据博主 @数码闲聊站 爆...
日期:08-21