您的位置:首页 > 互联网

成立仅半年,Mistral估值暴涨七倍,开源重塑AI战局_开源中国官网

发布时间:2023-12-22 13:41:11  来源:互联网     背景:

声明:本文来自于微信公众号 机器之能(ID:almosthuman2017),作者:机器之能,授权转载发布。

烧钱的闭源,逆袭的开源。

当 LLaMA 被泄露出去、任何人都可以下载时,开源的命运齿轮已经开始转动,并在 Mistral AI 最新一轮融资中达到高潮。

七个月前,来自 Meta 和谷歌的研究人员在巴黎成立了 Mistral AI。短短六个月,这家拥有22名员工的初创企业在最近 A 轮融资中筹集了4.15亿美元,估值从2.6亿美元狂飙到20亿美元,涨了七倍多。

同时,公司也低调发布了大模型 Mixtral8X7B。

Mixtral8x7B 采用了一种独特的架构方法——专家混合 (MoE) ,可产生流畅的、类似人类的响应,与传统的 LLM 方法形成鲜明对比。

根据公司提供的数据,Mixtral8X7B 优于一些竞争对手,包括 Meta 的 Llama2系列和 OpenAI 的 GPT-3.5。

开源官网

成立仅四周,获1.13亿美元的种子轮融资,估值约为2.6亿美元。半年后,A轮融资后身价涨到了20亿美元。

与具有讽刺意味的名字 OpenAI 不同,Mixtral-8x7B 是开源的,这意味着它可以免费用于商业用途。开发人员还可以更改、复制或更新源代码,并将其与许可证副本一起分发。

不少网友积极为 Mixtral-8x7B 打 Call,夸赞它有多快、有多有趣。有研究者甚至称:闭源大模型走到结局了。

在此之前,他们在9月底发布的 Mistral7B 至今仍被称为最好的7B 模型,在每个基准测试中都优于 Llama-213B,并且在代码、数学和推理方面优于 LLaMA-134B。

有研究者称:闭源大模型走到结局了。

OpenAI 一直保持其最新 LLM 闭源,并因此引发外界一定程度的强烈反对。

OpenAI 和谷歌警告称,在开源领域发布如此强大的模型是非常危险的,因为该技术可用于传播虚假信息。

他们也倾向于防御性发布模式,以便严格控制模型的使用方式。他们花了几个月为自己的 LLM 开发安全护栏,确保不会被用来传播虚假信息和仇恨言论,或者对问题产生有偏见的答案。

Mixtral 专注于开源其所有 AI 软件,坚定站在了日益激烈的文化战争的另一边。

他们坚信,生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。

他们追求的轨迹也很明确:开放、负责任和去中心化的技术方法。

广泛分享 AI 的底层代码是最安全的途径,因为更多的人可以审查这项技术,发现它的缺陷,并努力消除或减轻它们。顶级风投 Andreessen Horowitz 普通合伙 Anjney Midha 在接受《纽约时报》采访时说,他领导了对 Mistral AI 的 A 轮投资。

没有一个工程团队能够找到每一个错误,他说。大型社区更擅长构建更便宜、更快、更好、更安全的软件。

国内大模型初创公司面壁智能也致力于开源 LLM 的商用落地。

面对市场竞争,开源软件的免费使用是非常有吸引力的获客手段,低成本试错也有助于加速创新。基于开源路线,可以更快触达潜在用户群体,降低企业认知和决策难度。联合创始人曾国洋曾告诉机器之心。

另外,LLM 涉及许多技术问题,单靠一家企业很难解决,可以通过开放技术,依靠社区力量共同解决,共享 IP,互惠互利。

这种集中与去中心化的博弈力量一直贯穿于现代计算机技术发展史中。

正如网友所言,开源不仅是未来,也是过去。

reddit上,网友也就 Mistral最新融资展开了一场关于开源与闭源的讨论,开源会是LLM的未来吗?

开源社区的主流思想之所以被人接受,更大的时代背景正是大公司对于软件业的垄断。推动现代计算的大多数主要技术都是开源的,包括计算机操作系统、编程语言和数据库。

Meta 从一开始也是站在开源大模型这一边,也被视为开源最大的受益者。

不过,谁能赢得这场博弈,仍然仁者见仁。

许多人工智能研究人员、技术高管和风险投资家认为,这场竞赛将由那些构建相同技术然后免费提供出去的公司赢得——即使这意味着没有任何护栏。

一份为人津津乐道、从谷歌内部泄露出来的备忘录(标题是《我们没有护城河》)质疑了东家对专有模型的坚定不移。

我们无法赢得这场军备竞赛,OpenAI 也一样。当我们争吵不休的时候,第三个派系(开源)却在悄悄地吃掉我们的午餐。

开源具有一些我们无法复制的显着优势。虽然谷歌的模型在质量方面仍略占优势,但差距正在以惊人速度缩小。

谷歌备忘录作者发现,自从 LLaMA 泄露后,立刻出现了大量的创新,比如羊驼、小羊驼等,都可以在智能终端上运行,重大开发成果之间的间隔也在缩短。Meta 是一个明显的赢家。他们有效地获得了整个星球的免费劳动力,大多数开源创新都发生在他们的架构之上,没有什么能阻止他们将其直接整合到他们的产品中。

开源替代方案可以而且最终会让它们黯然失色。当免费、不受限制的替代品在质量上具有可比性时,人们就不会为受限制的模型付费。

这一担心也部分得到了一些验证。

最近,Meta 首席 AI 科学家 Yann LeCun 转发了方舟投资(ARK Invest)制作的一张趋势图,描绘了开源社区与专有模型在生成式 AI 上的发展。

开源人工智能模型正走在超越专有模型的路上。他感概道。

大疆mini2发布时间

不久,方舟投资又更新了这张广为流传的图表,新增了一些模型,包括 Gemini 和 Mixtral Mixtral8X7B 。

散点图最近有更新,增加了一些模型,如 Gemini和Mixtral,我们可以看到,开源模型的性能在不断追赶专有模型。有网友甚至表示,我们正在接近一个临界点。以目前开源社区项目的发展速度,我们将在未来12个月内达到 GPT-4的水平。

我们可以从图中看到,领先的前沿模型在绝对能力上仍然具有优势,但开源社区研究人员正利用免费线上资源取得可媲美最大的专有模型的成果。

Meta 最初发布 LLaMA 时,参数量从70亿到650亿不等。这些模型的性能非常优异:

有130亿参数的 Llama 模型在大多数基准上可以胜过 GPT-3( 参数量达1750亿),而且可以在单块 V100GPU 上运行;

最大的650亿参数的 Llama 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。

Llama2开源再一次使大模型格局发生巨变。

相比于 Llama1,Llama2的训练数据多了40%,上下文长度也翻倍,并采用了分组查询注意力机制。

Falcon-40B 刚发布就冲上了 Huggingface 的 OpenLLM 排行榜首位,改变了 Llama 一枝独秀的场面。目前,最大的公开型号是 Falcon180B。

还有 Yi 模型,可以一次处理40万汉字、中英均霸榜。Yi-34B 也成为迄今为止唯一成功登顶 Hugging Face 开源模型排行榜的国产模型。

开源公司

Mixtral Mixtral8X7B 亮点在于模型规模和性能(击败GPT3.5)的性价比——未来,我们更加渴望有更多这样的开源 MoE 模型,而不是更大的模型。

散点图勾勒出一股创新大潮,正改写着大模型战局,开源力量可能在未来1~2年与专有模型分庭抗礼。

但并非所有人都认同这一点。

有分析师指出,开源和闭源,各有利弊,但在技术行业的大多数其他方面,例如基础设施即服务(IaaS)和平台即服务 ( PaaS ),开源已成为明显的赢家。

不过,情况并非总是如此,因为在软件即服务领域( SaaS )大多数领先平台仍然是专有(闭源)软件。所以,还是无法确定哪种方法会赢得竞赛。

也有网友认为,开源还是闭源并不是一场非此即彼的零和游戏。

LLM 也许会找到一个类似平衡——就像互联网是基于开源软件运转的,但我们也离不开 Adobe、Windows 这样的付费专有软件。

开源固然迷人,一些网友也在质疑 Mistral AI 这样的公司怎么赚钱?从收益回报上看,投资者为什么要如此重视 Mistral 这样的公司?

开源总是让人和自由分享和免费的互联网精神联系在一起,盈利好像与之天然相悖。但事实上,开源并不意味着公司不能赚钱,最典型例子就是开源软件公司 Red Hat。

被 IBM 收购之前,Red Hat 最后一次报告的收入是2018年的34亿美元。它的软件基本上是免费的,收入主要来自向企业提供支持服务。

比如,纽交所在用免费的 Linux 系统交易股票。每隔几年芯片硬件都会升级,纽交所也想采用新的处理器提升效率,这就需要部署新的系统和应用程序。

纽交所可以养一个团队自己完成所有系统维护、开发工作,也可以花钱请 Red Hat 来做。相当数量的企业用户都选择了后者。

Mixtral 其实也提供即用即付的 API 访问,迎合那些想要快速轻松地访问其功能而无需管理基础设施来支持它的用户,类似于 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 模型。

reddit网友猜想的开源的商业模式。就像当年的网景浏览器变身为流量入口,带动了广告、游戏等其他业务的兴起。

机器之心采访面壁智能时也曾聊过商业模式——他们形容为一种类似于数据库的生意:

公司负责提供模型库,就像现在比较常见的数据库企业;数据库的工作是打磨数据库性能,面壁智能的任务就是提升大模型性能。政府、企业、小型开发者甚至学生通过标准接口接入基础设施,根据自身需求实现业务所需能力。

不过,《经济学人》曾警告说,一部分开源公司可能是好企业,但投资者必须接受他们不会拥有传统软件公司的经营利润,更不用说微软那样的利润了。因为是开源,意味着它们是一种公共财产,不能像微软对 Windows 那样利用专利实施垄断,获得丰厚回报。

反过来,就像《经济学人》曾指出的,虽然短期内对拥有这样一个平台的所有者极其有益,但却违背了该行业中其他所有公司的利益,也拖累了整体技术的创新和发展速度。

无论如何,现在有一点很明确——和一年前相比,LLM 实现民主化使用的可能性大大提高了,技术被少数公司垄断的可能性也在减少。

这是计算领域里的又一个转折点。

参考链接

https://www.semianalysis.com/p/google-we-have-no-moat-and-neither


返回网站首页

本文评论
中国移动成立央企首个面向行业应用的量子计算实验室_中国移动 量子
通信世界网消息(CWW)8月30日,在中国移动“第四届科技周暨战略性新兴产业共创发展大会”论坛上,中国移动挂牌成立央企首个面向行业应用的量子计算实验室—“中国移动量子计算应用...
日期:08-30
《百度国潮骄傲大数据》揭示中国制造已成中国骄傲_《百度2021国潮骄傲搜索大数据》
  中国品牌正当时。2018年初,中国体育品牌李宁登上了纽约国际时装周,将中国传统文化与现代运动潮流相结合,直接推动了李宁的大热。时至今日,越来越多的中国品牌开始“焕发新...
日期:07-12
搜索营销的布道者
  3月16日,江苏泛亚信息技术有限公司总经理颜健鸥从百度公司副总裁史有才手中接过沉甸甸的荣誉——“业绩贡献最大奖”,这是江苏泛亚连续第三年荣膺此奖。在颜健鸥看来,此奖...
日期:07-27
华为p60像素「华为P60发布时间曝光 影像实力或更强」
中关村在线消息:今日,微博博主曝光了华为P60系列的发布时间为明年第一季度,此前传出出的华为P60渲染图真实性存疑。该渲染图显示,华为P60采用了与P50相同的万象双环设计,正面屏幕...
日期:10-10
技术打造下一代 RTC,融云一套 SDK 解决所有通信场景_RTC SDK
  日前,融云正式宣布对实时音视频进行全面升级,并率先提出了下一代 RTC发展新思路,即为开发者提供即时通讯与实时音视频能力融合的PaaS云服务,未来将以“IM+RTC+推送”的...
日期:07-14
机器人技术打破国外垄断 巨轮智能总经理意外去世:年仅45岁_巨轮机器人招聘
7月28日晚间,巨轮智能发布公告称,公司董事兼总经理、董事会秘书吴豪先生于7月28日在公司检查工作中不幸因公殉职,年仅45岁。资料显示,吴豪,硕士研究生,高级工程师、经济师、一级注...
日期:07-29
美妆博主定位和内容方向「多元化的美妆博主,如何与平台共同成长?」
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:大可,授权转载发布。近些年来,美妆内容的商业价值水涨船高,相关的内容创作者迎来了飞速发展。头部达人快速更迭,新的...
日期:08-08
瀚蓝举行2021年“创客广东”节能环保中小企业创新创业大赛决赛
  8月10日,2021年“创客广东”节能环保中小企业创新创业大赛决赛通过线上举行。经过一整天的角逐比拼,来自沃克福德环境科技(深圳)有限责任公司路演项目“高难度工业废水高...
日期:07-17
小米6平板电脑「小米平板6配置曝光 没用旗舰处理器」
中关村在线消息:近日,微博博主曝光了小米平板6的相关配置信息,据悉新平板搭载新一代骁龙8+处理器,没有用上最新的骁龙8 Gen2,屏幕为12.4英寸OLED屏幕,支持120Hz高刷。小米平板6的售...
日期:11-19
40万潜在用户谁买单?蔚来手机定价或与华为Mate60接近,将面临激烈市场竞争
出品 | 科技作者 | 梁昌均编辑 | 杨锦“买车送手机?还是买手机送车?”谈及即将发布的蔚来手机,蔚来车主王潜表示,可能不会买第一代手机,“不想当小白鼠。”自2022年初被爆出造手...
日期:09-19
奇虎360周四跌7.89%报16.69美元(奇虎360 股价)
  奇虎360周四股价走势图。   新浪科技讯 北京时间11月4日凌晨消息,奇虎360周四在纳斯达克下跌7.89%,报于16.69美元,盘中最低跌至16.51美元。   奇虎360今日小幅高开,早...
日期:07-24
喜茶×FENDI,联名生意卷到奢侈品牌?_喜茶联名产品
声明:本文来自于微信公众号 壁虎看KOL(ID:bihukankol),作者:三玖是天,授权转载发布。年轻人多久才能拥有一件奢侈品?现在这个问题的答案能够十分清晰的给出:一杯喜茶联名FENDI新...
日期:05-21
大疆全新无人机官宣:造型酷似UFO 穿越机真来了_大疆无人机空中翻转
大疆官方微博宣布,将于8月25日发布无人机新品,主题为“天生会飞”。从预热视频可以看到,新品无人机采用类似圆环造型,底部有三个垫脚,并没有看到飞机翅膀,猜测应该位于圆环中央,可...
日期:08-20
中概股周四收盘多数下跌 每日优鲜跌超18% 蔚来跌超10%_每日优鲜美国ipo首日开盘破发
  北京时间30日凌晨,美股周四收跌,标普500指数创年内最低收盘点位及2020年以来的盘中新低。英国央行紧急救市行动对市场的提振作用渐渐消失,避险情绪重新回归。投资者仍关注...
日期:10-04
美团一季度营收586.2亿同比增26.7%,净利33.6亿__美团一个季度营收多少
财联社5月25日电,美团第一季度营收586.2亿元,同比增长26.7%,预估574.8亿元;第一季度净利润33.6亿元,预估亏损2.104亿元。平板电脑市场萎缩iphone5s发售价华为开放平台 - 首页ipho...
日期:05-26
迎接AI时代下的管理变革
暴君熊为什么帮助路飞2023年,我们见证了AI带来的产业变革以及对业务的直接影响,不管是FOMO(FearofMissingOut),还是JOMO(JoyofMissingOut),技术决策者都面临新技术带来的直接挑战...
日期:09-25
中航信云数据有限公司是央企「中国航信与阿里云达成战略合作 推动大模型在航空旅游领域落地」
11月3日 消息:在2023云栖大会上,中国民航信息网络股份有限公司与阿里云签署全面战略合作协议。未来,双方将发挥在各自领域的优势,推动大模型、云计算等技术在航空旅游领域落地,...
日期:11-04
腾讯云小微虚拟人上线,让AI走进生活(小微ai人工智能)
  近日,用户只要将腾讯叮当智能屏更新到最新版本,就会发现,新增的腾讯叮当问答室里,出现了一个二次元动漫小姐姐,以虚拟真人的形象与大家互动玩耍。    消费级AI市场的定...
日期:05-10
苹果高管被指“投机”卖股 COO抛售2亿元股票_苹果高管收入
凤凰网科技讯 北京时间3月28日消息,苹果公司首席运营官(COO)杰夫威廉姆斯(Jeff Williams)在上周出售了价值3000万美元(约合2亿元人民币)的苹果股票。一位专家认为,威廉姆斯在...
日期:03-28
海外高增32%!海尔智慧楼宇广交会展全场景低碳方案_海尔展台
   4 月 19 日,第 133 届广交会第 一期展会在广州闭幕。本届广交会全面恢复线下展,是历史上规模最 大的一届。参展的企业也都拿出“硬实力”,对外推出一系列创新科技。从低碳...
日期:04-20