您的位置:首页 > 互联网

8个月238个大模型,中国AI 奔向何处?

发布时间:2023-12-06 20:12:20  来源:互联网     背景:

图片来源@视觉中国

文 | 光锥智能,作者 | 郝鑫、黄小艺,编辑 | 刘雨琦

2022年11月30日,是ChatGPT面世的第一天。至今整整一年的时间,“人类与AI的未来”撕开科幻的外衣,正式踏入现实。

在商业世界,新技术一路狂奔,引发百模大战,一批创业公司如雨后春笋,退入幕后的大佬们纷纷下场,激烈的竞争中兴奋、迷茫、挫败相互交织;

而在普通人的生活中,既有AI模特、AI画师等“新职业”引发下岗潮的恐慌,也有靠AI知识培训月入一套房的弄潮儿,就连萧山丈母娘,也知道该瞄准大模型工程师。

然而,伴随着OpenAI的宫斗闹剧,摆在所有人面前的是当AI作为新物种出现,生而为人数千年,巨变之下,何为我们?

美国物理学家费曼曾说,“我们每个人都有一把开启通往天堂的钥匙,很不幸,这把钥匙同时能够开启地狱之门。”

害怕AI不够强大,又害怕AI太过强大,是人类心中一道永远在摇摆的天平。

在《流浪地球》的电影中,在极度不稳定的现实中,人们依赖于从MOSS身上得到确定性,而后又因恐惧MOSS失控,启动“隔离计划”,将其封存在北极与空间站。

人工智能究竟如何改变了人类社会?有哪些具体而又深刻的影响?是否将重塑我们的世界?巨变之中有哪些机遇与风险?在全球的科技竞赛中,中国的位置在哪?优势又在哪?一个个看似遥远而又宏大的问题,突然迫在眉睫。

炒作与机遇齐飞,理智与理想并存,关于大模型的答案之书,需要每个人的回答。

2023年,大模型完成三级跳

八个月内就诞生了238个大模型,每隔一天中国就会官宣一个新的大模型,这是2023年的中国速度。

回顾这一年,ChatGPT火爆后不到一个月的时间,阿里、华为、腾讯、京东、字节、360、商汤、科大讯飞等一众大厂纷纷下场,或官宣入场或亮相大模型。

百模大战一触即发,数据显示,战事最胶着之际,国内一个月就能冒出30多个大模型。截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所达到了254家,从“一百模”升级至了“二百模”。

但混战只是短暂性的阶段,仅三个月后,大模型行业就迎来了过滤分层,泥沙俱下过后,行业格局也逐渐变得明朗起来。

“高校和研究者关注基础研究,培养人才;大厂提供算力支撑、基础设施建设和MaaS服务;创业公司做大模型应用开发”,复旦大学计算机学院教授、Moss系统负责人邱锡鹏在2023腾讯ConTech大会上总结道。

底层是高校,中间层是大厂,最上面一层是大模型创业公司,分工清晰,各司其职,构成了当下的中国大模型版图。

IDEA研究院、智源研究院、中科院自动化研究所、上海人工智能实验室、复旦大学、清华大学等高校和研究所,最早在技术路径发展上关注、跟随OpenAI的步伐。基于先一步市场的洞察,这些研究院所发布的论文、开源大模型、数据集和工具,都为中国大模型的诞生、迭代打下了基础。

此外,这些高校也在源源不断地向市场上输送人才。清华系创业团队撑起了国内大模型创业的“半壁江山”,王慧文、王小川等互联网大佬高调入局,智谱AI、面壁智能、月之暗面等公司创始人师出同门。据不完全统计,近期活跃的AI大模型创企中,拥有清华背景的创始人至少有17位,涉及11家企业。

中间层的大厂,进一步划分有两类。一类是腾讯、百度、阿里、华为、字节等互联网大厂,凭借着在云计算和技术方面的积累,一方面可以自研通用大模和行业大模型,把现有的产品全部重做一遍,结合已经打透的行业,落地大模型解决方案;另一方面也可以给企业客户和创业公司提供模型训练的算力支撑,以MaaS的形式提供一站式的大模型服务。

第二类是AI1.0时代的科技公司,如商汤、云知声、科大讯飞等。结合在语音、CV方面的优势,在此基础之上研发大模型,商汤继承在CV方面的优势,发布了“日日新”大模型;云知声延续其在语言方面的优势,发布了山海大模型,展现在医疗问诊方面的能力。

随着大模型地基的进一步稳固,基础能力走向成熟,今年下半年,创业从想法落实到了行动,开始涌现出一批“黑马”创业公司。

名校、技术、行业经验三重背景拉满,一出道就奔驰在了大模型的快车道上。

百川智能以平均28天的速度迭代大模型,探索医疗问诊,预计明年推出第一款AI应用,剑指超级App;智谱AI今年累计获得融资25亿元人民币,一举成为国内公开融资最高的大模型创业企业之一;MiniMax海外推出的AI角色扮演类应用Talkie,增速一度跑赢国外同期明星产品Character AI;月之暗面从长文本技术切入,未来瞄准C端应用,正在探索AI角色扮演、对话等场景。

vivo x fold 折叠屏真旗舰

各类黑客马拉松和路演现场,座无虚席、人声鼎沸,创业者、投资人、观众挤破头只为拿到一张入场券。创业者们激情澎湃,“超越字节”,“打造下一个抖音”,“我就是下一个张一鸣”,一番豪言壮志响彻路演大厅。

最小00后,普遍95、90后,几个搞技术、产品的人想法一碰,临时组个小团队就开始了创业之路。大模型俨然成为了香饽饽,奇绩创坛刚结束的路演数据显示,在AI方向,就有51家大模型公司,更有超过一半集中在应用层面。

至此,中国大模型已经完成了从基础能力到应用层的三连跳,在近一年的摸索中,大模型创业者们逐渐意识到了一个事实:中国大模型“先天体弱”,中国创业机会不在基础能力层,而在应用层。

中国大模型核心竞争力在哪儿?

中国大模型的“体弱”之症,还要追溯到“根”上,构成大模型有四要素,分别为数据、模型、算力和场景,根基打得不牢,大模型自然也就走得慢。

目前,大模型训练数据主要来自于公开的文档、资料和数据。从数据总量来看,公开的粗加工数据仍以英文居多,占主导优势,中文数据开放得还远远不够;从数据质量来看,由于国内在数据产业的投入和精细化程度不足,导致了中文语料不仅少且能用得也不多的现状。数据质量直接与模型训练效果挂钩,比如ChatGPT虽然只有1.5%的中文语料,也能达到比较好的效果,但国内却恰恰相反。

在模型层面的积累,短时间内,中国有着无法跨越的鸿沟。OpenAI自2015年成立,在大模型领域的技术积累和投入,已长达七年之久,而国内才仅仅一年的时间。而在中国马不停蹄追赶过程中,OpenAI还在加速度,百亿美金、顶尖人才、超级计算都在源源不断地输送进名为“GPT”的大模型引擎中。

在算力层面也不容乐观,一面要面临着算力资源短缺的共同问题,一面还要活在美国的层层封锁之下。

在2023腾讯ConTech大会上,百川智能创始人、CEO王小川在硅谷调研中了解到,OpenAI正在尝试把1000万块GPU连在一起训练一个大规模的模型。

王小川对此感到十分震惊,“英伟达一年大概生产100万块GPU,训练GPT-4要2.5万块,国内对标GPT-3.5训练需要4000块。要中国拿出1000万块GPU去训练大模型,目前从资源层面还远远达不到”。

小米是咋死的

据邱锡鹏判断:“我们离OpenAI算力的差距太大,能保持紧密跟随已是不易,但要谈到赶超,还是得结合当前我国具体的实际情况。”

有经验、有方向,更要正视差距和不足,正如王小川所言,当下大模型公司需要思考的问题是,如何用一个稍弱的大模型做出一个好的AI原生应用。

“国外会做大模型,但并不代表着会做应用”,不少创业者向光锥智能反馈道,在应用方向,国内与国外目前处于同一起跑线上。

国外AI应用起步虽早,但发展仍处于早期,类型主要集中在效率对话助手、情感类对话助手、绘画、照片、游戏几个领域。

以美区苹果商店为例,大热的效率工具中,OpenAI的ChatGPT有47万个评分;微软的Bing Chat有18万个评分;大火的C端应用代表,Character AI有14万个评价,Pi有1336个评价;风靡一时的AI生成相机Lensa AI有39万个评价。作为参考,TikTok在美区苹果商店有1634万个评分;YouTube有3370万个评分;Snapchat有196万个评分。

(图源:美区苹果商店截图)

大模型的技术能力再强,也要落在产品中被实际应用起来,而这恰恰是中国最核心的优势。

“理想上慢一步,落地上快三步。”

这是王小川对当前中国大模型机会的诠释,“理想”对应着大模型基础技术能力,“落地”则对应着场景应用,“我们中国大模型的机会,不在技术科研,应用才是我们跑得更快的地方”。

回顾互联网时代,中国曾经诞生了淘宝、微信、抖音等超级App,在产品体验、市场运营、用户需求洞察等方面都积累了大量的经验,与此同时,繁荣的互联网产品生态还培养起了一批产品经理。如今,上个时代的积累将沉淀为大模型应用诞生的肥料。

王小川认为这里面有两个核心的难点需要去解决,如果能解决好两个问题,中国的应用或许就能走在美国的前面。

首先是要有大模型,模型效果差一点也没关系,可以通过开源技术、端到端的模式、人的聪明才智,与做应用公司共同研发等途径来弥补大模型本身的缺陷。

重要的是要把大模型用起来,有大模型应用创业者告诉光锥智能:“实际做AI应用,对大模型能力的要求远没有想象中那么高,GPT-3.5基本就能达到一个还可以的效果。”

其次是,传统意义上的产品经理需要转型和提升。王小川指出,大模型创业跟互联网创业最大的区别在于,大模型是科技创业,以技术为主要驱动,故而进入壁垒极高;而互联网是创意创业,几乎不存在卡技术的环节,换而言之,只要有好的想法就能实现。

”大模型创业的特性,就要求产品经理,需要懂得什么样的AI产品需要匹配什么样的技术,甚至更进一步还能以产品需求为导向引领技术的发展。这里面可能涉及一些具体的问题,比如产品经理对技术的评测标准是什么,怎么去评价技术的好坏,怎么才能让算法工程师跟上产品迭代的步伐等等”,总而言之,王小川认为产品经理要对自己的技术有判断和评价。

漫长的技术发展经验告诉我们,这已经不是中国第一天面对基础科技能力不如国外的棘手问题。暂时的技术领先也并不代表什么,中国之所以能做大模型,一是因为本身市场就足够大和复杂,若大模型企业能占据一席之地,或许就已经拥有了十分可观的增长空间。

OpenAI的先进放在中国的环境中也会出现“水土不服”,一如多年前数据库行业,Oracle虽然先进,但数字化程度滞后的国内根本用不上,全靠中国数据库企业揽下脏活和累活,从搬运账本切入数据库赛道。

大模型亦是如此,国内企业生怕掉队,迫切想赶紧用上大模型,但远水解不了近渴,私有化部署、安全、价值观对齐、场景落地等诸多现实问题更适合中国大模型企业发挥。

人与AI的未来,在变革中共生

过去不可被改变,但是未来可以被创造。

每当新技术出现,都会有一部分人积极占据先机,获得技术红利。任何技术革命带来的技术变革都是由此开始的。

如今,在百模大战的比赛场上,所有人都试图寻找最终的天选之子,究竟是存量的竞争还是增量出奇迹,大厂和创业公司们,都不肯放过任何一个机会。

“从信息时代走向智能时代,一个大的时代,就像之前工业时代一样,会有新的公司起来。”正如王小川所说,尽管,大厂们有在互联网时代积累了数十年的资本,但普遍观点认为,小创新靠大厂,大创新仍然要靠小厂。

而在激烈的竞争之下,新公司又是否会像互联网时代的巨头们一样,创造一个新的时代,甚至取代目前的科技巨头,引领新的商业生态呢?

技术的变革总是周期性的,我们或许可以从历史的长河中寻找答案。

正如互联网时代,催生出了线上零售模式,成长出了阿里巴巴、京东等一批巨头企业,产业链上也有无数网店、工厂抓住机会,踩上了暴富的快车道。在这个过程中,没有谁取代谁,只有电商形态颠覆、重构了线下零售,同时也形成了线下、线上一体化的供应链、数字化云仓、新零售等物种。

相比新旧之间的取代关系,更多的是业态模式的创新、重构。

不过,新的AI业态究竟如何展开,仍在朦胧之中。正如曾经字节跳动给BAT的震动,在快手、抖音、秒拍、美拍、微视等一片短视频App之中,没有人知道,谁是最大的那匹黑马。因此无论大厂还是小厂,都在积极探索AI与业务的结合,等待爆发的奇点、为明天押注。

与此同时,不同于以往高新技术突破的漂浮感,AI的变革已经渗透进了社会中每一个人的生活之中。

“用孙正义的话讲,会用AI和不会用AI的人就是像人和猴子区别一样。”王小川说道,“我把ChatGPT放在我手机页面的底部,每天都会使用。在未来两三年内,我们工作方式、生活方式会有天翻地覆的变化,智能体到来之后,跟你工作的可能不只是人,也有机器。”

华为p60有5G吗

“虽然大模型成长速度快于年轻人,但年轻人是快于非年轻人的。在时代变革的时候,年轻人更有机会。”他补充道。

机会固然存在,但难题也随之而来——在畅想AI带来社会进步之时,我们又该如何规避AI带来的风险?

事实上,在几百年的文学创作中,人类就不断探讨着人与非人物种之间的关系,AI作为人造智能,更是游离在伦理的边缘。

要让AI与人和平相处,基于一个先决条件,价值观的对齐。正如《流量地球》里,MOSS被要求“保卫人类文明”,却认为“保卫人类文明的唯一办法,是毁灭人类”一样,AI强大的计算、判断能力与非人的认知,是恐惧的源头之一。

也正是如此,在今年大模型狂奔以来,安全性始终都是根本宗旨,正如OpenAI早在年初,就曾发布过《我们保障AI安全的方法》,回应外界对其AI模型安全性的质疑。

想要实现AI与人类价值观的对齐,一方面,依赖于技术,但更重要的是,人类自己先要形成一套一致的价值观体系。

然而问题是,自人类社会诞生之时,偏见就根植于思想、行为,如今自然也藏匿在AI训练的数据之中。换言之,当我们在探讨AI伦理之时,我们也在审视着自己。

AI的发展推着人类文明的车轮滚滚向前,当我们站在一个新周期的门外,门缝已经打开。

2024,或将是一个崭新的世界。


返回网站首页

本文评论
SpaceX星际飞船可能最早于下周进行首次入轨测试「spacex星际飞船原型sn15」
4月5日消息,美国联邦航空管理局(FAA)发布的一份通知显示,SpaceX星际飞船系统最早可能于下周进行首次入轨测试。据FAA网站周二发布的通知显示,星际飞船系统可能的发射日期为4月10...
日期:04-05
王小川上市「王小川新注册人工智能公司「五季智能」 曾表示正快速筹备中」
3月29日消息:3 月 24 日,「五季智能」(北京)科技有限公司成立,法定代表人为王小川,注册资本 500 万人民币,经营范围包括人工智能应用软件开发;人工智能双创服务平台;人工智能理论与...
日期:03-29
大疆Air 3无人机来了!正式官宣:双摄加持「大疆air3s」
快科技7月18日消息,今晚大疆官微宣布将于7月25日21点发布新品,主题是双摄就位,主角归位。”预热视频中,可以看到两个摄像头。不出意外的话,这款新品就是大家期待的大疆Air 3。大...
日期:07-19
魅族2020年销量有500万「全品牌销冠!魅族20系列成3000元档周线上销量第一」
快科技4月18日消息,魅族官方今天宣布,魅族20系列在3000元到4000元价位段的周线上销售额,已经成为了全品牌第一。同时,在4000元到5000元价位段,魅族20系列的周线上销售额,也已经成...
日期:04-18
美团优选发布服务规范强化安全保供(美团优选安全管理方针)
  2月3日,美团优选发布《社区电商防控保供配送服务规范》(以下简称规范),从供应商管理、分拨中心配送流程、交付环节无接触自提、退货流程等方面界定了社区电商在特殊时期...
日期:07-16
淘宝明星直播没有“活水”「淘宝直播水有多深」
声明:本文来自于微信公众号 卡思数据(ID:caasdata6),作者:卡思数据,授权转载发布。今年双十一,是淘宝十四年来第一个没有公开销售额的双十一,但也是淘宝直播最热闹的一个双十一。罗永...
日期:11-28
荣耀l100「疑似荣耀100系列新机已通过认证,或本月亮相」
疑似荣耀100系列新机已通过认证,或本月亮相作为荣耀旗下定位中高端市场的产品序列,数字系列机型近年来也一直凭借着在性价比以及产品端的出色表现,受到了众多消费者的青睐。日...
日期:11-10
电子结婚证来了(电子结婚证什么样子)
  (原标题:支付宝:全国5省市上线电子结婚证)   8月6日消息 支付宝宣布,全国已有5省市上线电子结婚证。   据介绍,领取很简单,已经登记结婚的夫妻,上支付宝搜“电子结婚证...
日期:06-27
Twitter被收购_谷歌接下来将收购谁?AOL和Twitter上榜
  拉里·佩奇(Larry Page)一向目光远大。他曾经表示,谷歌应当招聘100万名工程师。自从他今年4月出任谷歌CEO以来,已经凭借Google+对Facebook发起进攻,并且斥资125亿美元收购...
日期:07-22
AMD宣布退出BAPCo组织 行业标准向英特尔倾斜
(小贝)北京时间6月23日消息,据国外媒体报道,芯片生产商AMD日前宣布,将退出BAPCo(商业应用性能协会)行业组织,这意味着PC性能测试标准向着有利于英特尔芯片的方向发展。BAPCo组织是S...
日期:07-30
InnAIO:几分钟创建专业的AI视频 提供图像/语音克隆功能_ai声音克隆软件
8月31日 消息:使用 InnAIO,您可以在几分钟内创建专业的 AI 视频,并将文本转换为语音。该软件还支持多种语言和口音,并可以在短短10秒内克隆出5分钟的音频。此外,InnAIO 还提供了...
日期:08-31
英特尔:Win12明年出 现有电脑硬件太老需要升级_因特尔更新
快科技10月8日消息,在上个月的花旗分析师会议上,英特尔首席财务官David Zinsner透露了明年Windows更新的消息,暗示消费者可能会因为Windows的新版本而升级他们的个人电脑。苹果...
日期:10-08
小米 MIX Fold 2 评测:折叠手机的“轻薄革命”_小米MIX FOLD2
一年半前,小米首款折叠屏 MIX Fold 正式发布,在主流厂商的折叠屏手机中,这款产品拥有着当时最低的售价 ——9999 元,即便在当时这已经小米最贵的一款手机,但 MIX Fold 仍秉承着性...
日期:08-20
国家邮政局:双 12 全天行业共揽收邮件、快递达 4.6 亿件,再创新高
  12 月 13 日消息,根据官方消息消息,据国家邮政局、国家邮政局快递大数据平台实时监测数据显示,今年 12 月 12 日全天,邮政、快递企业共揽收邮(快)件达 4.6 亿件,同比增长超...
日期:07-17
程序员入侵网站_19岁黑客侵入最高检网等网站 称没学过编程
  凭网购的破解网址入口,两名仅初中文化的青年“菜鸟”,轻松入侵了约80家网站,其中包括最高检网站在内的多家政务网。两人入侵网站,仅是为了通过更改网站源代码为其他网站提...
日期:07-25
16家网约车平台被约谈:落实降低过高抽成比例要求_国家规定网约车抽成比例
7月29日消息,据新华社报道,近日,交通运输新业态协同监管部际联席会议办公室组织对滴滴出行、高德打车、T3出行、曹操出行等共16家网约车平台、聚合平台公司进行约谈。约谈指出,...
日期:07-30
sex.com:每年仅依靠域名停放就可获利百万美金
  1月6日消息,日前,美国知名互联网评论与科技博客techcrunch发表了一篇关于sex.com持有人的独家专访,作者罗宾·沃特斯称,sex.com的历史足以写成一部书,据了解,目前sex.com仅依...
日期:07-25
互动百科对百度发起的“垄断”调查申请 几乎没有获胜可能(百度垄断搜索行业)
  近日,国内互联网再起风波,国内中文百科网站互动百科宣布公司已正式向国家工商总局提交了针对百度的反垄断调查的申请书,请求依法对百度进行立案调查、责令百度立即停止滥...
日期:07-26
阿里云四大金刚简史_阿里云四化
声明:本文来自于微信公众号 新莓daybreak(ID:new-daybreak),作者:张芮白,授权转载发布。阿里集团分拆后,所有人都想知道,谁会成为最先上市的新公司。一定程度上,这代表业务独立性强...
日期:06-09
赛门铁克:Duqu蠕虫借助Windows内核漏洞传播
  赛门铁克安全响应中心近日再次警示了stuxnet蠕虫变种duqu的危险性,研究人员表示,一经发现伪装成Word文章的蠕虫来利用微软的Windows内核漏洞,使得有针对性的感染成为可能,...
日期:07-24