您的位置:首页 > 互联网

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

发布时间:2024-03-19 16:47:23  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了200万字上下文的无损压缩。

一个能读200万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要10000个小时的学习,但对于这个 AI 来说,只需要10分钟就够了。

将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及他们孩子的真相,堪比一个看了好几十遍电视剧的甄学家。

怎么护理卷发不毛糙

上传一份完整的近百万字中医诊疗手册,这个 AI 助手可以针对用户问题给出诊疗建议。

这是国内大模型创业公司月之暗面(Moonshot AI)刚刚官宣的新突破。他们打造的Kimi 智能助手目前已经支持200万字超长无损上下文,并于即日起开启产品内测。

Kimi 智能助手于去年10月份正式亮相,那时就已经能够支持20万字的上下文窗口,是当时全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度(参见《大模型开启长时代,杨植麟的新公司把对话框容量做到了世界第一》)。但令人没想到的是,仅仅过了半年,月之暗面就将这一数字提升了10倍。

为什么要死磕超长无损上下文这件事?创始人杨植麟曾经解释说,通往通用人工智能(AGI)的路上,无损的长上下文将会是一个很关键的基础技术。从 word2vec 到 RNN、LSTM,再到 Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度…… 上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。

在实际使用场景中,超长无损上下文带来的好处也是显而易见的。在支持20万字的时候,你就已经能够用它进行专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解 API 开发文档…… 如今,这个数字提升了一个数量级,你能拿它做的事情就更多了。

在媒体沟通会现场,月之暗面展示了一些超长无损上下文的使用场景示例。例如,你可以上传几十万字的经典德州扑克长篇教程后,让 Kimi 扮演德扑专家为自己提供出牌策略的指导。

丰巢向用户收费

上传英伟达过去几年的完整财报,让 Kimi 成为英伟达财务研究专家,帮你分析、总结英伟达历史上的重要发展节点。

上传一个代码仓库里的源代码,可以询问 Kimi 关于代码库的所有细节,即便是毫无注释的陈年老代码也能帮助你快速梳理出代码的结构。

也就是说,如果你有一份想要快读学习的资料,你可以把它上传给 Kimi,让它帮助你练习专业技能,或者启发新的想法。如此一来,快速学习任何一个新领域都会变得更加轻松。

不过,有时,这些文本是分布在不同的文档中的,这就需要 AI 助手具备跨文档处理的能力。据悉,Kimi 现在能够一口气精读500个,甚至更多数量的文档,帮助你快速分析所有文档的内容,并且支持通过自然语言进行信息查询和筛选,大大提高了信息处理效率。例如,公司 HR 可以基于业务需求,让 Kimi 快速从最近的500份简历中找出有某个行业从业经历,同时从计算机类专业毕业的求职者,更加高效地筛选和识别合适的候选人。

在技术上,由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走滑动窗口、降采样等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

基于这些突破,Kimi 在智能搜索场景也展现出了优于传统搜索引擎的能力。比如,你可以让 Kimi 主动去搜索和对比两家同领域上市公司的最新财报数据,它会根据你的问题,分析和总结最相关的多个页面,生成更直接、更准确的答案。这离不开其背后大模型的无损长上下文能力。具体来说,对于主动搜索得到的多篇资料,Kimi 会作为上下文的一部分交给模型去推理。正是因为 Kimi 大模型支持的上下文窗口足够长,窗口内的信息损失足够低,Kimi 智能助手才能输出高质量的结果,为用户带来截然不同的搜索体验。而传统的搜索引擎通常只能根据用户的问题,返回一些参杂着广告信息网页链接。

另一项与大模型的无损上下文能力息息相关的指标是指令遵循(Instruction Following)能力。指令遵循能力主要体现在两个方面:第一,模型在多轮对话中是否能够始终遵循用户的指令,理解用户的需求;第二,模型是否能够遵循复杂指令,有时候复杂指令可能长达几千、上万字。从产品推出以来的用户反馈来看,Kimi 智能助手的多轮交互和超长指令遵循能力,也同样具备显著优势。

我们相信,大模型无损上下文长度的数量级提升,也会进一步帮助大家打开对 AI 应用场景的想象力,包括完整代码库的分析理解、可以自主帮我们完成多步骤复杂任务的智能体 Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。月之暗面工程副总裁许欣然在媒体沟通会上表示,无论是内存、算力还是网络带宽,历史上每一次基础技术的升级,都会解锁新的产品形态和应用场景。我们对200万无损上下文的 Kimi 可以带来哪些超出想象力的创新机遇充满期待。

据 AI 产品榜(aicpb.com)的统计数据,Kimi 智能助手2月份的访问量已经突破300万。月之暗面也刚刚收获10亿美元的融资,成为估值25亿美元的 AI 独角兽。

htcvive或暗示将发布新一代头显

如果你也有对超长无损上下文能力的需求,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。


返回网站首页

本文评论
深度数科集团高级副总裁、CTO魏建华:数据应用领域的长期主义者_深度数智科技
(原标题:深度数科集团高级副总裁、CTO魏建华:数据应用领域的长期主义者) 华强北airpods支持ios14吗 “推动科技和产业进步的背后...
日期:02-07
卢伟冰称红米最强劲两亿像素镜头
Redmi Note 13系列发布会已经正式定档,将于9月21日举行。在公布了Note 13 Pro 这款Redmi首款曲屏手机后,官方也揭晓了Note 13 Pro直屏版的外观。 首先公布的是名为“星沙白”...
日期:09-15
红米K60硬件配置曝光,标配30W无线快充_红米k30s支持65w快充吗
中关村在线消息:10月8日,据相关爆料,即将在明年第一季度发布的红米K60系列详细参数已经曝光,新机共将为大家带来两款产品,一款为标准版一款为超大杯,二者均搭载骁龙8+处理器,但在续...
日期:10-17
Lama Cleaner:完全免费开源的AI图片修复工具 支持去水印、老照片修复等「ai修复老照片软件」
7月24日 消息:Lama Cleaner 是一个由 SOTA AI 模型驱动的图像修复工具。它可以帮助用户从照片中移除任何不需要的物体、缺陷、人物,或者擦除并替换照片中的任何元素(通过稳定...
日期:07-24
要求罚金30亿美元!Chatgpt涉嫌信息盗窃被起诉
据报道,美国一家律师事务所最近向加州北区联邦法院提起集体诉讼,指控OpenAI和微软使用互联网抓取的信息来训练ChatGPT时,严重侵犯了无数人的版权和隐私,要求公司赔偿30亿美元。...
日期:06-30
超强大模型DEJAVU 推理速度是FasterTransformer的2倍
要点:DEJAVU 是一个系统,采用一种经济高效的算法,结合异步和硬件感知实施,动态预测每一层的上下文稀疏性,从而提高大型语言模型(LLM)的推断速度。研究团队通过引入上下文稀疏性的...
日期:11-01
midjourney违禁词怎么绕过?Midjourney禁用词汇最全总结
我们知道,利用Midjourney 可根据文本提示生成艺术作品,不过有不少小伙伴在使用Midjourney的过程中,触发了禁用词,因此最好熟悉 Midjourney AI 的行为规则。如果不遵守,将无法再使...
日期:04-12
奥巴马对iPad和Xbox时代表示悲哀(xbox与ipad)
  美国总统奥巴马星期日对iPad和Xbox时代表示悲哀。他说,信息已经成为转移视线的东西,为民主增加了一个新的品种。这是奥巴马对现代媒体进行的最新的批评。   奥巴马经常...
日期:07-29
老硬盘格式化后就挂网上卖了:结果后悔莫及「硬盘格式化以后还能用吗」
快科技5月16日讯,硬盘产品难免有退休的一天,或因为质量可靠性,或因为速度容量落伍等。不知道你会如何对待不用的机械硬盘或者SSD,来自专业机构Secure Data Recovery的实测发现,最...
日期:05-16
Intel i7又把i9反杀了!多2个核心、性能领先22%「i9比i7强吗」
一般来说,产品档次越高,规格越高,层次分明,但有时候也有一些特殊的例外。GeekBench 5数据库内出现了一款i7-13700HX”,显然是Intel 13代酷睿HX系列移动版的一员,8大8小16核心24线...
日期:11-14
复盘2023年5G工厂:这些行业走在第一梯队_到2023年我国5g
通信世界网消息(CWW)炉火照天地,红星乱紫烟。一直以来,传统工厂给人们的印象是“三高”——高能耗、高污染、高风险,但是随着5G工厂的到来,这一切正在得到显著改善。数实融合让传...
日期:01-12
Win11 第三方 Files v2 标签式文件管理器已支持原生 ARM64
  11 月 17 日消息,Files(文件)是一款适用于 Windows 10/Windows 11 的免费的第三方开源文件管理器,它利用了 Windows 平台的最新功能,包括流畅设计、无缝更新和 API,实现了...
日期:07-17
盗版随意“洗白”:Win7/8.1密钥仍可免费升级Win10/11_2021盗版win7升级win10还免费吗
Windows 11推出已经快两年整了,虽然微软从未单独公布过Win11用户数,但从三方平台的数据如Steam、Statcounter等,Win11装机量一直在稳步增长中。请回答全球电子商务发展的现状和...
日期:04-08
诺基亚G310 5G和Raven手机现身宣传视频
近日据国外科技媒体Nokiamob报道,诺基亚移动公开的一段宣传视频中出现了一些保护套和手机新品。视频中展示了适用于诺基亚T10平板的儿童保护套,另有橙色和红色组合。该平板搭...
日期:06-21
包揽四大年度最佳游戏!腾讯正开发《艾尔登法环》手游:免费但支持内购
快科技2月6日消息,据媒体报道,有知情人士称,腾讯正在将广受好评的《艾尔登法环》改编成手游,游戏本体免费,但提供内购功能。报道中提到,腾讯于2022年就获得了《艾尔登法环》的手游...
日期:02-07
中兴光纤「建好网到用好网,中兴通讯深化千兆经营和光网发展」
通信世界网消息(CWW)6月4日,在第31届中国国际信息通信展览会的“未来城市千兆光网发展论坛”上,中兴通讯副总裁,有线产品MKT总经理胡俊劼以“建好网到用好网,深化千兆经营和光网发...
日期:06-06
上海迪士尼将于10月31日起暂时关闭「上海迪士尼将于10月31日起暂时关闭」
10 月 31 日讯:上海迪士尼度假区发布通知称,上海迪士尼度假区(包括上海迪士尼乐园、迪士尼小镇和星愿公园)将于 2022 年 10 月 31 日(周一)起暂时关闭,即刻生效。恢复运营时间一旦...
日期:11-03
专家建议取消中考给孩子减压:有更多时间去探索兴趣_取消中考的好处
近日,在“经济学家建言2024中国经济”访谈中,北大国发院经济学教授、中国经济研究中心主任姚洋就我国当前教育体系提出了深刻的见解。他指出,当前教育体系中的一些问题,特别是孩...
日期:02-22
三星 i8000_三星I8000如何连接蓝牙鼠标
三星i8000,是三星公司于2009年推出的一款高端智能手机,运行Windows Mobile 6.1操作系统。拥有高像素的摄像头、强大的硬件配置、宽大的屏幕以及多种有用的功能,受到了广大消费...
日期:05-30
周鸿祎:中小企业及创业者更适合打“侧翼战”(在创业道路上,周鸿祎认为有三点很重要)
  9月7日消息,奇虎360董事长周鸿祎近日在谈到企业发展战略时表示,中小企业及创业者的发展更适合定位于“侧翼战”,而非与实力强大的竞争对手正面对决。   周鸿祎认为,初创...
日期:07-22