您的位置:首页 > 互联网

真假“长文本”,国产大模型混战_国产模型推荐

发布时间:2024-03-26 17:42:35  来源:互联网     背景:

声明:本文来自于微信公众号 光锥智能(ID:guangzhui-tech),作者:郝 鑫,授权转载发布。

Kimi有多火爆?凭一己之力搅乱A股和大模型圈。

Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi 智能助手。

网络安全的本质在人才

眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本” 的四国大战。

对标月之暗面Kimi 智能助手的200万字参数量,百度文心一言将在下个月开放200万~500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍;阿里通义千问宣布升级,开放最高1000万字的长文本处理能力;360智脑正在内测500万字,功能正式升级后将入驻360AI浏览器。

四家中国大模型公司把长文本能力“卷”出了新高度。作为参考,目前,大模型最强王者OpenAI的GPT-4Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。

但同样都是“长”,有人是孙悟空,有人是六耳猕猴。

一位大模型行业的人士向光锥智能表示:“确实有一些公司用RAG(检索增强)来混淆视听。无损的长文本和RAG,两项技术各有优势,也有结合点,但归根到底还是不同的技术……很容易就用‘长本文’来混淆视听。”

“百度、阿里、360,大概率都使用了RAG方案”,该业内人士表示道。

无论是RAG还是长文本,一味地“长”并不能代表所有。如同上一轮,大模型厂商“卷”参数,大模型参数不是越大就越好,文本长度,也不是越长,模型效果就越好。除了上下文长度,记忆能力、推理能力、算力都是共同的决定性因素。(详细观点请参考《卷完参数后,大模型公司又盯上了“长文本”?》一文)

薅羊毛侵犯公民个人信息

国产模型厂商

进入2024国产大模型落地元年,大模型应用千千万,为什么是长文本能率先掀起波澜?基于长文本的特性,又能解决哪些AI应用落地的实际问题呢?

长文本,真的越长越好吗?

自ChatGPT诞生以来,国外一直在持续不断地涌现出新的AI应用,产生流量的同时,也令人看到了商业化的可能性。

据风险投资公司a16z近期发布的《GenAI 消费应用 Top100报告》显示,用户月访问量最大的应用网站中,类ChatGPT的效率助手占据了榜单前十的大壁江山,ChatGPT的每月网络访问量接近20亿次,第二名Gemini的每月访问量约为4亿次。

但同样AI应用活跃而繁荣的场景却并没有在中国成功上演。在月之暗面的Kimi 智能助手凭借流量和人气出圈之前,国内能够达到一定体量的应用只有两个,一个是百度推出的文心一言App,另一个是字节跳动推出的豆包。

据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万;同年12月,字节豆包月活达到200万,2024年1月在此基础上翻了一番达到400万。

文心一言凭借百度的大模型先发优势和搜索流量优势,一度成为国内流量最大的AI应用;而豆包背靠抖音流量转化池,虽然发布时间稍晚一步,但在后期实现了反超。

在这样背景之下,Kimi的爆火显得尤为特殊,某种意义上可以说,Kimi是国内第一个靠产品能力和用户自来水破圈的AI应用。

月之暗面创始人杨植麟曾告诉光锥智能,其团队发现正是由于大模型输入长度受限,才造成了许多大模型应用落地的困境,这也是月之暗面聚焦长文本技术的原因所在。

站在用户角度来看,好不好用是检验AI应用产品最关键的指标,而这都依赖于Kimi背后的长文本技术。

若将长文本的能力进一步拆解,大致可以包括长度、记忆、理解、推理几个能力。

越来越长的文本长度,可以进一步提升现在AI应用的可用性和专业性。

对普通用户而言,与AI助手简短的闲聊能够引起兴趣,但不能解决问题,特别对于法律、医学、金融等一些专业领域,需要前期“喂”给大模型特定的数据和知识,才能精准地输出答案;对企业而言,更需要一个“专家型”的助手,大量的企业数据、行业数据都需要提前导入,没有损耗地输入和输出,从而保证最后的分析结果具有可参考性。Claude就是一个典型的例子,凭借长文本的优势与ChatGPT走出不同的路线,收获了大量的2B垂直行业的企业用户。

多轮对话和记忆能力可以直接应用到现在大部分的场景中,比如游戏场景中的NPC,通过长文本输入给予其角色设定,玩家每一次的对话都会被记录,并且能够生成个性化的游戏档案,避免了重新登录而需要反复唤醒的问题;在执行Agent(智能体)任务场景,能够增强记忆能力,辅助Agent形成清晰的行动步骤,避免出现Agent打架的现象。

长文本的理解和推理能力体现在两个方面,一类是对想象类的应用理解生成,一类是对逻辑类应用的生成。例如在对AI小说的应用中,长文本的能力体现在能够理解用户输入的prompt,对其想象性的扩写;在编程、医疗问答等领域,则需要调用其逻辑的推理能力,合理化地续写编程,根据用户描述推理病状。

月之暗面副总裁许欣然曾表示,大模型无损上下文长度的数量级提升,将进一步打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。

大模型公司卷“投流”

一天获客成本20万

流量狂飙、宕机后五次扩容;日活用户数达百万,月环比增长率107.6%;赶超微信、杀进App Store免费版应用第五名,月之暗面交出了一份漂亮的成绩单。

但这也只是一个开始,多位业内人士在今年刚开年曾向光锥智能透露,走过高速技术迭代的2023年,大模型来到了产业落地和商业化的下半场。

去年,各家已经相继亮剑,智谱、百川、面壁不同程度上都开启了商业化。月之暗面稍慢,目前还未公布商业化的方案,但急切地开始了商业化加速进程,B站、抖音等社交平台都能看到Kimi助手投流的广告。

尽管,各家都从未将2C的变现路线排除在外,但是延续2016年AI1.0时代的思路,多数还是将2B作为了首要的突破口。有了技术,去找技术和产业落地方向,探索落地方案似乎成为了理所应当。

月之暗面则是大模型公司的另类,去年10月份第一次公开露面后,就瞄准了2C的应用市场。杨植麟曾表示,长文本是月之暗面根技术,在这技术之上可以分裂出不同场景和领域的2C应用。

在Kimi效应爆发前,就有很多普通和企业用户反馈,“Kimi是国内最好的AI助手,没有之一”,从一开始就注重产品效果和用户体验的Kimi,现在爆发似乎带有一定的必然性。

商业化压力之下,大模型公司大概率会选择2B、2C两条腿走路。对比其他大模型公司,月之暗面则又提供了另一种商业化的路径参考,其他玩家从先2B再2C,以2B拉动2C,而月之暗面则属于先2C后2B,再以2C的产品拉动2B的单子。

毕竟,除了国外的ChatGPT,之前在国内根本看不到2C产品增长的案例。Kimi靠近半年的积累,凭一己之力在2C撕开了一道口子,众多大厂或许是看到了2C更多的可能性,才急于下场向市场证明自身具备长文本能力。

但回到商业化赚钱的本质,仍要思考如何将一时的流量转化成实打实的付费率。

光锥智能观察发现,现在大部分的大模型公司在推产品时还是互联网推流的那一套,旧瓶装新酒,抖音、B站、小红书投流推广,在线下的写字楼电梯、机场、地铁打广告。

一通操作下来的实际转化率有多少尚未可知,但为获客花出去的都是真金白银。据新浪科技报道,有投资人透露,目前Kimi用户获客成本达到12元~13元。根据下载量预估,Kimi近一个月来日均下载量为17805。按此计算,Kimi每天的获客成本至少20万元。

现在市面上大部分的AI助手都是免费下载使用,基于网络负外部效应,当用户越来越多的时候,其资源的耗损就越来越大。此次的Kimi宕机事件就是最好的例证,顺时暴涨的用户量给算力和服务器都造成了压力,与之带来的还有大量的token成本的消耗。

对大模型公司而言,规模化、付费率和成本的三方拉扯问题,短时间内无法得到解决,即使是流量吊打其他应用的ChatGPT也面临盈亏平衡的困境。

据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。OpenAI预测,对于压缩成本后的GPT-3.5模型和GPT-4模型,若月付费率每月提升0.25%或不能持续;若月付费率每月提升0.5%或能扭亏。

月付费率不断提升听起来很性感,但现实却是“未老先衰”,爆发性的增长还未迎来,增长停滞先一步到来。

对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。


返回网站首页

本文评论
百度智能云发布 11 款面向企业通用场景的 AI 原生应用「百度智能云工作怎么样」
IT之家 9 月 5 日消息,在今日的2023 百度云智大会上,百度智能云宣布发布“AI 原生应用 Family”,为用户提供 11 款适用于企业通用场景的产品,包括“百度智能云曦灵”“百度智能...
日期:09-05
小米6plus参数「小米6plus参数详细参数」
小米6 Plus是一款2017年推出的智能手机,是小米6的升级版,采用了全新的设计和技术,同时也带来了更强大的性能和新功能。下面是详细的小米6 Plus的参数信息。外观与屏幕: 小米6 P...
日期:05-31
真我GT5 Pro挑战最窄下巴曲屏:搭载第四代边缘防误触算法
快科技11月30日消息,真我GT5 Pro将于12月7日正式发布,号称挑战全行业最窄下巴曲屏”。据介绍, 真我GT5 Pro采用极窄下巴,搭配第四代边缘防误触算法,带来更好的观感、质感和手感体...
日期:11-30
天水的麻辣烫加盟店「天水麻辣烫爆火 快递员日发千斤辣椒:非常自豪」
甘肃天水的麻辣烫近日火爆异常,不仅在各大社交平台上频频亮相,更是引发了网友们的热烈讨论和疯狂点赞,纷纷呼吁将其推向全国。这一现象级的美食风潮,吸引了无数食客不远万里前来...
日期:03-15
帅丰集成灶:发挥领军企业标准引领作用(帅丰集成灶品牌创立时间)
  标准化是任何一个行业走向成熟的必经之路,也是行业保持高质量发展以及生命力的必选题。   5月12日,以“燃创生活 领跑未来”为主题的2021燃气具品牌峰会暨天猫厨热行业...
日期:05-24
FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法
划重点:⭐️ FreeControl 提供一种无需训练即可控制任何文本到图像扩散模型的空间控制方法⭐️ 支持多个条件、架构和检查点同时进行控制生成⭐️ 通过结构和外观引导,实现对生成图...
日期:02-21
余承东升任智能汽车解决方案BU董事长-华为汽车业务大调整_余承东能出任华为董事长吗
来源:中关村在线今天下午,有消息称余承东升任智能汽车解决方案BU董事长,引起了业界广泛关注。华为一直致力于打造全球领先的智能汽车解决方案,并不断加强在新技术领域的研发和布...
日期:09-22
TCL98X9C怎么看电视直播,TCL用这个可以免费看直播(tcl电视怎么看央视频道直播)
  TCL电视作为老牌电视软件,一直备受消费者喜爱,在今天TCL电视也发布了新品mini LED电视,不管是从外观还是硬件来说都是无可挑剔的。   到时候购买了TCL新品的朋友在赞叹...
日期:07-17
丢失300M数据企业损失50万 服务器安全不容忽视_5+25+9等于几
  尽管早就有朋友建议王强定期给公司的网站做数据备份,尤其对重要的数据要实施多点备份,但是对拥有5年网络经验的王强来说,他怎么也不会相信,这种服务器遭受攻击、客户数据丢...
日期:07-29
云erp系统是什么意思啊_浅析ERP系统:“ERP”和“ERP云”有什么区别?
  一切云化的今天,常常有朋友问我ERP是否应该选择SaaS,我把这几年参与企业ERP选型的所见所闻总结一下,来回答这个问题。   企业上ERP项目的时候,是选择SaaS版还是传统的本...
日期:07-13
马斯克删推特账号 新闻「马斯克要“大赦”推特:让被封账号都回归」
凤凰网科技讯 北京时间11月24日消息,推特新老板埃隆马斯克(Elon Musk)已经解封了美国前总统特朗普的账户,但是他似乎还不满足。周三,他再次发起线上民意调查,想要在推特上发布“...
日期:11-26
三六零第三季度财报_三六零公布 2021 年半年报:营收 56.19 亿,同比增长 13%
  三六零在昨日晚间披露 2021 年半年报。报告显示,三六零上半年营业收入达 56.19 亿元,同比增长 13.03%。其中,以政企安全为代表的安全及其他业务收入为 9.12 亿元,同比增长...
日期:07-17
价格不足一台手机,ELEGOO爱乐酷Saturn 3 Ultra土星光固化3D打印机评测!
上大学的时候就了解到3D打印机在科研领域帮助很大,一直觉得3D打印技术离我们的生活很远,甚至很难接触到。其实作为一个3D打印的小白,最多也就是好奇而已,从来没有想过3D打印机能...
日期:11-03
华为加速全球第三大手机系统更新:P50等升级尝鲜鸿蒙4.0「华为升级系统名单」
7月8日 消息:近日,全球第三大手机操作系统鸿蒙正加快推出新版本的步伐,一些机型已经可以提前尝鲜开发者版本。根据一些网友在社交媒体上分享的信息显示,华为Mate40、P50等系列...
日期:07-08
天玑8200 Ultra加持!小米Civi 3定档5月25日:支持5G异网漫游功能_小米用天玑820
小米宣布,旗下全新手机小米 Civi 3将于5月25日正式发布。据预测,这款号称“新潮流手机的黎明”、被称为“三年探索锐变之作”的手机将搭载联发科天玑8200 Ultra SoC处理器,并配...
日期:05-22
微信新增独立发送按钮 此前安卓已有该功能
10月31日,iOS微信升级到8.0.43版本,增加了一个换行键。升级后在【微信】-【我】-【设置】-【通用】-(新增)【使用独立的发送按钮】,默认是关的,手动打开后,键盘上的发送键就会变成...
日期:11-01
5G 流量套餐为什么贵?_5g流量套餐贵吗
  5G 究竟能带来什么?还没人能给出令人信服的答案。听惯了几秒下载一部电影的故事,不如看看正在发生的历史。   你们现在都在用什么 4G 套餐?   以我个人为例,我的两...
日期:08-18
突发!AirPods Pro 2出现“音频漂移”严重问题「airpods pro噪声控制失灵」
中关村在线消息:10月13日,据相关爆料,最近有用户表示自己的AirPods Pro 2出现了音频同步问题,具体问题表现为,音频无法与视频内容同步的情况。有不少用户猜测可能是开启了空间音...
日期:10-17
长安3万左右的车型有哪些「豆瓣8.2分爆款国漫!《长安三万里》成中国影史动画电影票房第五」
7月24日消息,7月初上映的国漫《长安三万里》最近成为大热电影之一,豆瓣评分高达8.2分,超26万人给出评价,其中5星好评占了39.3%,4星评价也有38.3,可以说是口碑极佳的国漫了。据灯塔...
日期:07-25
大妈坐无人出租车被两名老外狂追吓坏:原来是问这车没人怎么开
快科技12月28日消息,网友上传视频显示,湖北武汉,一位大妈日前在市区叫了一辆百度萝卜快跑”无人出租车,上车后发现有两名老外骑着共享单车一路追赶着她的车辆。并且,这两位老外一...
日期:12-29