您的位置:首页 > 互联网

大模型内心OS:聪明大脑如何匹配现实需求?

发布时间:2024-05-29 17:22:52  来源:互联网     背景:

声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:夏天,授权转载发布。

金属边框加玻璃后盖的手机

近两年,无论你身处什么行业,处于何种生活状态,相信大家对AIGC、大模型等热词并不陌生,从之前大火的AI作图、AI脚本、到AI恋爱,人工智能正在一步步地改变我们的生活方式。

插画师 月薪

与此同时,大模型行业也在不断地进行迭代升级。近日,随着阿里云一则直降97%定价策略的“横空问世”,成功地将大模型行业的竞争格局,从“百花齐放”推向了更为激烈的“百家争鸣”阶段。

据了解,阿里云把旗下通义千问GPT-4级主力模型——Qwen-Long的API输入价格,从0.02元/千tokens降至0.0005元/千tokens,相当于OpenAI——GPT-4的400分之一,而此举也被行业称为“击穿全球底价”的重磅“炸弹”。

紧接着,百度、科大讯飞、腾讯云等企业纷纷响应“号召”,宣布旗下部分大模型免费开放,进一步为这次“降价潮”注入了动力。

“烧钱”的大模型为何会集体降价?越来越多大模型免费开放后,能否替代搜索引擎?以及目前国内大模型中“谁”最聪明?又是如何实现商业化落地的?

“烧钱”的大模型为什么进入降价时代了?

“便宜到不需要犹豫”OR“羊毛出在猪身上”

“我们希望不断降低情报成本,让这些东西变得非常便宜,便宜到你根本不需要犹豫。”OpenAI首席执行官Sam Altman在新加坡管理大学演讲时,曾回答过关于大模型降价的问题。

他还进一步表示:OpenAI 每三个月左右就能将推理成本降低90%。从去年开始,OpenAI 一直在频繁降价。比如,在去年6月,OpenAI把当时最先进、用户最多的嵌入模型Text-embedding-ada-002降价75%,把当时用户最多的聊天模型gpt-3.5-turbo降价25%,还推出了gpt4-16k平替版——gpt-3.5-turbo-16k,降价95%。

今年5月,国内大模型纷纷跟进降价,加速了行业降价潮。5月6日,私募基金幻方量化旗下公司深度求索推出了DeepSeek-V2模型。据介绍,该模型在性能上比肩GPT-4Turbo,但API 价格只有GPT-4-Turbo 的近百分之一,引发行业高度关注。

之后,智谱 AI 、字节豆包大模型跟进降价。其中,智谱 AI 宣布将其 GLM-3Turbo 模型的调用价格下调80%;字节豆包大模型首次对外开放,就把价格单位从元变为了厘。以豆包通用大模型 pro-32k 版为例,其推理输入价格为0.0008元/千 tokens,较行业价格低了99.3%。

从目前参与降价或免费的大模型来看,大多都是各家公司的入门模型,并且降幅较大的都是有云服务的公司,而企业级的模型仍维持原价。因此,对企业用户影响有限。一般而言,企业对大模型的需求更加定制化、私有化,而要想实现这些需求,势必是需要花钱的。

据媒体不完全统计,截至今年4月底,国内共推出了约305个大模型。由此来看,国内大模型迎来“降价潮”是行业的必然趋势,这不仅仅是要从上百个模型中“优胜劣汰”,更重要的是要建立用户心智,也就是“教用户如何玩大模型”。

比如,除了对大模型的常规提问之外,用户还可以在大模型上创建自己的AI应用。

此前,OpenAI 上线GPT商店曾引发行业热议,在GPT商店里可以搜索到各种各样的AI相关应用,像是图标设计神器—— Logo Creator、学术助手Consensus等等,还可以按需自主创建GPT。现在,国内大模型也可以实现这一“玩法”,比如智谱清言GLM-4、字节的豆包、百度文心一言等,都在大模型界面设置了“智能体中心”窗口,不仅可以按类型搜索已有热门智能体应用,还可以自主创建新的智能体,通过复刻APP业态,大模型让用户和开发者实现了无缝切换。

来源:大模型截图

而这种现象也为大模型公司提供了另一种生存路径,即转型成为应用公司。顺福资本创始人李明顺对此也持相同态度,他进一步表示,“有一些大模型公司的创始人有Plan A和Plan B的双计划,就是一旦我的模型实在是拼不过前面的5家之后,就要被迫在一些垂直领域里面找到生存之地,它就会转型为一家应用公司。”

另外,此次降价也对大模型创业公司有一定的冲击。5月,跟进降价的大模型创业公司只有智谱AI,而零一万物、MiniMax、月之暗面等大模型创业公司并没有跟进。这主要是因为,这些大模型创业公司其主要模型的定价从一开始就维持在行业较低水平,所他们的降价空间相对有限。

这也是大模型初创公司和大体量模型公司之间的一个重要差异表现。猎豹移动董事长兼CEO、猎户星空董事长傅盛表示:“大公司通过大模型来获取云客户,羊毛出在猪身上。但大模型创业公司没有“云”这样的生态,必须另寻商业模式。”

与此同时,此次降价潮还会吸引更多开发者参与进来,尤其是中小团队的开发者,他们往往不缺想法,缺的就是“烧钱”的算力资源,甚至还有可能促成一些小团队之间的“强强联合”。这种合作不仅能够推动创新,加速大模型的开发和优化,还可能产生全新的应用和解决方案,为市场带来新的活力和机会。

聪明的大模型,

如何匹配现实中的日常需求?

在科技日益融入我们生活的当下,大模型技术已“随处可见”。而马斯克关于AI可能在两年内超越人类的预测,更是为这一领域注入了更多的期待和关注。

那么,在当前一众竞相“超越GPT”的大模型浪潮中,哪个国产大模型可以让用户实现“科技改变生活”呢? 据大模型开源开放评测体系司南(OpenCompass2.0)数据,在2024年4月大语言模型最新评测中,智谱 AI 的 GLM-4排名行业第4,位居国产大模型第一,紧随其后的是MiniMax的abab6.5。 值得一提的是,在4月的大模型榜单中,前十名里有6位都是国产大模型选手,这充分证明了我国在大模型技术领域的迅猛发展态势。像是私募基金幻方量化旗下公司深度求索的DeepSeek-V2-Chat、阿里云qwen1.5-110b-chat和百度的旗舰级ERNIE-4.0-8K-0329等优秀模型均位列其中。 那么,这些大模型在我们日常生活中到底好不好“用”呢? 为了回答这个问题,我们选取了五个(豆包、通义前问、智谱清言、Kimi、文心一言)业内口碑较好的免费大模型,进行日常测评。 接下来,我们将从用户的角度出发,基于实际使用场景,深入体验并评估这些大模型在实际应用中的表现。

以克劳锐编辑部为例,我们的工作场景是不停的和内容“打交道”,包括但不限于找选题、写文章等等。目前我们获取选题的方式来自于行业资讯、报告等,而找资料的方式则来自各种搜索引擎。

四川成都跨境电商产业基地

打开5个大模型,基本都有热点搜索功能,甚至还会推荐近期相关热点。但从实际使用感受来讲,除了智谱清言可以直接点开相关热点的原网页之外,其他的大模型回复仍以总结性文字为主,需要进一步核对文字的来源以及准确性,可参考意义不大。

来源:大模型截图

值得一提的是,在英文翻译方面,这五个大模型的体验明显优于搜索引擎自带的翻译功能。搜索引擎自带的翻译往往是实时进行的,当你需要翻译一份英文财报并频繁“翻页”时,常常会遇到长时间的等待和加载。然而,大模型在处理此类翻译任务时,由于其更高的计算效率和先进的处理能力,不会出现类似的等待情况,不仅翻译完之后,可随时查阅,还可以在历史记录中查询以往的翻译记录。

在编辑工作中,检查错字是一项至关重要的任务。然而,在对五个大模型进行“查找错字”功能测试时,它们却直接上演了一场“婆说婆有理”的大戏,各自给出了不同的结果和解释,甚至一些大模型无法理解我们上传文档中的“文字内容”,开始了“自我创造”。

我们在5个大模型中上传了一篇带有2处明显错误的文章,其中,豆包、通义千问、Kimi直接按照“自己的理解”,创造了一些新“问题”,比如,豆包建议我们把“透过618,平台想要什么?”改为“透过618,平台想要什么?”,改了个“寂寞”;Kimi建议我们把"店播" 改为 "店铺直播",走的是扩写风格;通义千问建议我们把“今年618,改为今年6.18”......而文心一言和智谱清言则直接表示:“经过仔细检查,并未发现明显的错别字”。

从提问方式来看,这5个大模型都喜欢“角色扮演”。如果首次提问没有得到满意的答案,可以用“假设你是一个......”来追问,得到的回答会比第一次问全面很多。在智谱清言中,我们针对首次没有发现错别字的文档进行二次追问,在假设该大模型一个电商行业专家的条件下,它给出了10条“改错”。比如,把文章中的“451改为415”。

来源:大模型截图

大模型在处理文本时,虽然能够展现出强大的语言理解和生成能力,但由于各种因素(如模型架构、训练数据、算法等)的限制,它们在某些细节和特定任务上的表现可能并不尽如人意。从我们测试的结果来看,这种不准确性可能源于多个方面,例如模型对语言规则的掌握不够全面,或者对特定领域和上下文的理解不够深入。

因此,目前大模型在提取信息的准确性方面仍有待观察和提高,并不能完全替代传统的搜索引擎。

大模型的商业化进程如何?

在降价潮和落地应用背景之下,大模型的商业化问题再次被摆在台面上。

目前,大模型的商业化类型主要可以分为两大类。一类是模型本身的订阅付费模式,这一模式允许用户根据自身的需求选择适合的模型,并按照使用量或时长进行付费。而另一类则是大模型机制下——AI落地的各种应用。在ChatGPT等先进模型出现之前,被公众广泛关注的AI模型往往专注于单一任务,如“阿尔法狗”(AlphaGo)等。

目前,其应用场景已经从最初的文本生成、语言翻译,扩展到如今的图像识别、智能推荐等领域,这种转变也为大模型的商业化提供了更多可能。

在电商领域,大模型的应用已经十分普遍。例如,淘宝自研的“星辰”大模型,京东的言犀大模型,都是通过数据学习为消费者和商家提供智能决策等多元服务,从而进一步挖掘平台用户的潜在需求。再往前还有各种品牌的数字人直播带货、元宇宙发布会等等。

而在汽车行业,AI大模型的引入更是重塑了人机交互场景,为新能源汽车赋予了新的魅力和卖点。在今年的北京车展中,能与“新能源”等热词“齐驱并驾”要数“大模型”了。不仅商汤绝影、腾讯等科技企业纷纷发布用于汽车的智能驾驶和智能座舱的垂类大模型,小鹏、哪吒等车企也纷纷宣布“大模型上车”。

然而,这些都只是大模型商业化道路上的冰山一角。随着科技技术的迭代和成本的降低,未来会跑通越来越多的大模型商业化场景。百度集团执行副总裁、百度智能云事业群总裁沈抖认为,现在是大模型企业勇敢创新、大胆尝试的绝佳时机。一旦某个应用场景“跑通”了,就可以“复制粘贴”,加速落地。

那么,你认为哪个领域将最早实现大模型的批量商业化?欢迎评论区留言讨论。


返回网站首页

本文评论
四相科技用高精度定位技术助力国产飞机C919生产智能化
5 月 29 日,国产大飞机C919 首 次搭载 135 名旅客从上海虹桥机场平稳地降落在成都天府国际机场,开启常态化运营。从 1970 年中国自主研制的“运十”飞机立项,到 2023 年C919 成...
日期:05-31
AMD下一代Zen 5 CPU在HWiNFO软件中获得早期支持「AMD zen」
AMD甚至还没有开始提供其Zen 4 CPU,就已经在监控软件HWiNFO中加入了对其下一代Zen 5 CPU的支持。AMD的第一个Zen 4 CPU系列,代号为Raphael,刚刚作为Ryzen 7000系列进入消费市场...
日期:10-05
恒大汽车公告:剥离地产业务因资金不足已暂缓生产恒驰5_恒大汽车破“冰”而出 量产已在眼前
快科技5月13日消息,今天上午恒驰官方公众号发布公告,称恒大汽车已宣布股东大会同意向中国恒大及其附属公司出售旗下47个地产项目。这意味着恒大汽车完成了地产业务剥离,成为一...
日期:05-13
日本火山时隔5年再次活动 火山灰喷到2400米高:已3级警戒
最近几天,日本多座火山开始活动的消息引发了关注,当地时间14日,位于日本鹿儿岛县樱岛的火山再次喷发,火山灰最高喷至距离火山口2400米的高度。watch series 7和watch nike7区别...
日期:02-15
马斯克火星移民视频「马斯克要送8万名地球人去火星 目前面临这些挑战」
4月20日晚,人类再次注视着SpaceX公司的Starship“星舰”试飞。这枚人类历史上最强大的火箭升空,但未能进入轨道,最终在坠毁前爆炸。美团股价上涨为了实现Starship“星舰”运输...
日期:04-23
生成式人工智能吸引公众眼球,但企业高管并不认为它已准备好投入商业应用
10 月 30 日消息:根据 Nash Squared 的年度数字领导力报告,虽然生成式人工智能(Generative AI)已经引起了公众的广泛关注,但这种激动人心的情感并没有让企业高管们相信它已经准备...
日期:10-30
运营商做云的优势「运营商做云:赚翻了还是累惨了?」
本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。新氧科技股价作者 | 李水青编辑 | 心缘要问今年国内云计算业务增长哪家强?答...
日期:09-02
微软紧急撤回最先进的AI大模型:居然忘了测试了_microsoft撤回
快科技4月21日消息,Meta发布超级彪悍的大语言模型Llama 3之后,微软也很快推出了自己的新一代WizardLM2 8x22B,号称迄今最强大,完全超越Claude 3 OpusSonnet、GPT-4等竞品,而且开...
日期:04-22
秀才消失、“中老年收割机”仍在,万粉账号也有“榜一大妈”打赏130万
出品 | 科技作者 | 潘琭玙大妈界“顶流”塌房了。近日颇受关注的主播“秀才”账号被封禁,相关词条冲上热搜第一。据知情人士透露,秀才近期被举报存在违法行为,已封禁账号。对于...
日期:09-08
百度输入法再同大热游戏“组CP”,游戏键盘嘉年华第二季上线
  就算关了游戏也能有所爱角色的“时刻相伴”是种什么体验?   最近百度输入法推出了游戏键盘嘉年华第二季活动,就要帮一众游戏玩家们时时“武装到指尖”。在第一季联合...
日期:01-15
到手的270多亿生意黄了 SSD主控一哥慧荣回应:收购需继续进行_固态慧荣主控怎么样
快科技7月28日消息,在中国反垄断部门限制性条件批准收购之后,美国半导体公司迈凌科技MaxLinear突然反悔,宣布放弃收购SMI慧荣,后者此前是SSD主控芯片份额一哥。迈凌在声明中指出...
日期:07-28
脉脉数据:平台纯互联网职位量同比减少50.4%,新能源汽车职位量增长近2倍
12月29日消息,12月28日,脉脉发布《抢滩数字时代·人才迁徙报告2023》(以下简称《报告2023》)。《报告2023》显示,2022年脉脉平台招聘岗位总量同比减少21.6%,尤其是纯互联网职位量...
日期:12-29
电竞级手游王者面世 国美零售开启iQOO Neo3新品预售
  ​4月23日,智能手机品牌iQOO召开以“生而为赢”为主题的线上新品发布会,正式推出旗下Neo系列首款5G终端——iQOO Neo3。作为iQOO品牌的重要零售渠道,国美宣布线上线下...
日期:12-05
哈佛研究表明打麻将可延长寿命:社交关系或决定寿命长短_打麻将对人有好处吗
据哈佛大学一项长达80年的研究显示,影响长寿的关键因素并非饮食和运动,而是一项意想不到的娱乐活动——打麻将。南极为什么会形成巨厚的冰层他们发现,人的社会关系是决定寿命长...
日期:01-17
乌三分之一国土布满地雷和集束炸弹,或需757年才能完成全境排雷
据报道,在俄乌冲突爆发近一年半后,乌克兰已经成为了世界上地雷最多的国家。根据斯洛伐克智库GLOBSEC最近的一份报告显示,乌克兰超17.35万平方公里的区域经历了严重冲突,受到未爆...
日期:07-25
强生不考虑召回涉毒洗发水 相关部门正安全评估(强生洗发沐浴露事件)
强生(中国)表示不考虑将相关婴儿产品下架。   “因爱而生”的强生正在中国市场遭受前所未有的广泛质疑,旗下的两款强生婴儿洗发精被美国“安全化妆品运动联盟”爆出“含...
日期:07-24
摩根大通已限制员工使用 ChatGPT
IT之家 2 月 23 日消息,据华尔街日报报道,一位知情人士透露,摩根大通公司已限制员工使用 ChatGPT 人工智能聊天机器人。这位知情人士表示,摩根大通并非因为任何特定事件而限制员...
日期:02-25
手机对比评测_手机对比评测平台
随着手机技术的不断发展,市面上的手机品牌和型号也越来越多。大家购买手机时常常会感到迷茫,不知道应该选择哪个品牌或型号。为了帮助大家更好地选择手机,下面将对几款市面上流...
日期:05-30
美股上周「美股周一:三大股指涨跌不一,美光跌近3%,知乎涨超10%」
5月23日消息,美国时间周一,美股收盘主要股指涨跌不一,纳指上涨。投资者等待周一收盘后开始的美国债务上限谈判。道琼斯指数收于33286.58点,下跌140.05点,跌幅0.42%;标准普尔500指...
日期:05-23
首款骁龙8 Gen3真全面屏旗舰!红魔9 Pro系列首日预售比上代大增3倍_红魔8g和12g区别
快科技11月25日消息,日前,红魔9 Pro系列发布,起售价4399元,目前已开启预售,将于11月28日10:00正式开售。根据官方战报,红魔9Pro系列首日预售同比上一代增长3倍。不过红魔官方并未...
日期:11-25