您的位置:首页 > 互联网

百川pt「百川智能推大模型Baichuan2-192K:可一次输入35万字 超越Claude2」

发布时间:2023-10-31 01:15:20  来源:互联网     背景:



雷递网 乐天 10月30日

百川智能今日发布Baichuan2-192K大模型。其上下文窗口长度高达192K,称这是目前全球最长的上下文窗口。

百川智能指出,Baichuan2-192K能处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的 4.4倍,是 GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。Baichuan2-192K不仅在上下文窗口长度上超越Claude2,在长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现也领先Claude2。

华为鸿蒙os系统怎么恢复安卓系统

2023年9月25日,百川智能已开放了Baichuan2的API接口,正式进军企业级市场,开启商业化进程。此次Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户,目前百川智能已经启动Baichuan2-192K的API内测,开放给法律、媒体、金融等行业的核心合作伙伴。

10项长文本评测7项取得SOTA,称领先Claude2

据介绍,上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息,更好的捕捉上下文的相关性、消除歧义,进而更加准确、流畅的生成内容,提升模型能力。



此外,LongEval的评测结果显示,在窗口长度超过100K后Baichuan2-192K依然能够保持很好的性能。

松鼠ai教育的优势

iqoo天玑1100手机



LongEval是加州大学伯克利分校联合其他高校发布的针对长窗口模型的评测榜单,主要用来衡量模型对长窗口内容的记忆和理解能力,是业内公认的长上下文窗口理解权威评测榜单。

动态采样的位置编码优化,4D并行的分布式方案

扩大上下文窗口能有效提升大模型性能是人工智能行业的共识,但是超长上下文窗口意味着更高的算力需求和更大的显存压力。目前,业内有很多提升上下文窗口长度的方式,包括滑动窗口、降采样、小模型等。这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。

而本次百川发布的Baichuan2-192K通过算法和工程的极致优化,实现了窗口长度和模型性能之间的平衡,做到了窗口长度和模型性能的同步提升。

算法方面,百川智能提出了一种针对RoPE和ALiBi动态位置编码的外推方案,该方案能够对不同长度的ALiBi位置编码进行不同程度的Attention-mask动态内插,在保证分辨率的同时增强了模型对长序列依赖的建模能力。在长文本困惑度标准评测数据 PG-19上,当窗口长度扩大,Baichuan2-192K的序列建模能力持续增强。



(PG-19是DeepMind发布的语言建模基准数据集,是业内公认的衡量模型长程记忆推理问题的评测标准)

工程方面,在自主开发的分布式训练框架基础上,百川智能整合目前市场上所有先进的优化技术,包括张量并行、流水并行、序列并行、重计算以及Offload功能等,独创了一套全面的4D并行分布式方案。该方案能够根据模型具体的负载情况,自动寻找最适合的分布式策略,降低了长窗口训练和推理过程中的显存占用。

百川智能ipo

天猫双11过亿品牌名单

Baichuan2-192K正式开启内测

百川智能称,Baichuan2-192K现已正式开启内测,以API调用的方式开放给百川智能的核心合作伙伴,已与财经类媒体及律师事务所等机构达成了合作,将Baichuan2-192K全球领先的长上下文能力应用到了传媒、金融、法律等具体场景当中,不久后将全面开放。

全面开放API之后,Baichuan2-192K便能够与更多的垂直场景深度结合,真正在人们的工作、生活、学习中发挥作用,助力行业用户更好的降本增效。Baichuan2-192K能一次性处理和分析数百页的材料,对于长篇文档关键信息提取与分析,长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有助力作用。

百川智能指出,它可以帮助基金经理总结和解释财务报表,分析公司的风险和机遇;帮助律师识别多个法律文件中的风险,审核合同和法律文件;帮助技术人员阅读数百页的开发文档,并回答技术问题;还能帮助科员人员快速浏览大量论文,总结最新的前沿进展。

更长的上下文还为其更好的处理和理解复杂的多模态输入,以及实现更好的迁移学习提供了底层支撑,这将为行业探索Agent、多模态应用等前沿领域打下良好技术基础。

雷递由媒体人雷建平创办,若转载请写明来源。


返回网站首页

本文评论
重庆哪里买手机壳的多「万元手机低价卖你信吗?重庆男子花4000元网购手机收到手机壳」
随着电商的飞速发展,便捷的网购成为当下消费者最青睐的购物方式之一,不过,由于是线上交易,其背后也隐藏着不少隐患,如货不对板”等。据媒体报道,近日,重庆一位张先生在网上看到一款...
日期:10-16
二手iPhone14贬值速度是13两倍,新款用户哭晕「iPhone12贬值」
中关村在线消息:10月14日,据相关爆料,iPhone14机型的贬值速度将超过iPhone13,其中主要包含iPhone14与iPhone14 Plus这两款产品。有分析师称,生命周期和经济周期叠加,苹果创新又没...
日期:10-16
Infosys与NVIDIA合作,助力全球企业利用生成式AI提高生产力
通信世界网消息(CWW)下一代数字服务和咨询领域的全球领军者Infosys(NSE、BSE、NYSE:INFY)和NVIDIA(NASDAQ:NVDA)今日宣布扩大双方战略合作,旨在助力全球企业采用生成式AI应用和解决方...
日期:09-21
首批极氪X发往欧洲 预售35万起 外国用户:在中国买便宜很多
快科技9月17日消息,近日,我们从极氪汽车副总裁朱凌的微博账号了解到,首批极氪X正式登上了驶向欧洲的船舱。据悉,极氪在刚刚结束的慕尼黑车展式宣布了在德国的市场预售计划。极氪...
日期:09-17
Vision Pro入门版本:苹果基于iPhone的VR头显专利出炉_苹果vr功能
快科技6月20日消息,不久前,苹果公布了Vision Pro头显,但比起它强大的功能,更令人印象深刻的,或许是它夸张的价格。近日,苹果的一项新专利公布,该专利涉及一种头戴式显示器配件,可以...
日期:06-20
外媒:苹果更重视iOS 17的实用性 而不是带来新功能_ios14.2怎么样
  【手机中国新闻】在前不久的WWDC大会上,苹果iOS 17正式登场,带来了数百项更新,不过苹果并未承诺会立即推送某些新功能,只能后续慢慢推送。mate 40 pro拆解  有外媒认为,近...
日期:06-30
七大首创功能,蝰蛇全景声音质升级,酷狗音乐推出12.0版本_蝰蛇音效酷狗
(原标题:七大首创功能,蝰蛇全景声音质升级,酷狗音乐推出12.0版本) 近日,酷狗音乐正式发布12.0版本,向用户带来了四大创新交互手势,...
日期:10-16
新一代超光影影像手机即将面世!OPPO Find X7系列定档1月8日_光影optc
OPPO宣布将于2024年1月8日14:30举办Find X7系列全球旗舰发布会,新一代Find X7系列将搭载全球首款双潜望摄像头,实现科技突破,提升移动影像体验。该系列采用全新设计语言,通过拼...
日期:12-29
广汽本田“自信”海报引热议:自主免提 30年造车技术经验没法比
步入2023年后,国产自主品牌车企的销量增长势头不减,反观合资品牌,市占份额持续下降,即便是日系车中的本田、丰田,也难逃下滑局面,日系车在国内也没此前几年那般香。为此,日系车企也...
日期:06-15
消息称传音将推出Infinix GT10 Pro手机
7月17日 消息:最近有消息指出,传音正在研发一款名为"Infinix GT10Pro"的手机,主要面向游戏玩家。Infinix GT10Pro的后壳采用了半透明的设计,并在后壳下点缀有LED灯带。这种设计...
日期:07-17
以太坊“大合并”使得区块链能耗与加密代币价格双双暴跌「以太坊区块链技术」
随着以太坊主区块链完成从 PoW 向 PoS 模式的转型合并,网络能源成本也迎来了大幅下降。与此同时,ETH 的币价也迎来了暴跌。作为全球第二大加密代币,以太坊并未在向 2.0 版本大...
日期:09-25
别上当!小米官方辟谣:节日送小米礼品的都是非官方活动「小米2021年的礼物」
6月25日消息,最近,小米官方通过其品牌安全微博账号(小米集团法务部维权组官方微博)发布帖子进行澄清,指出所谓的节日赠送小米礼品的活动都是非官方的,这些活动是假的!请大家牢记不...
日期:06-26
特斯拉希望Avanci 5G汽车专利池费用从32美元降到10美元
2024年1月3日,根据IP Fray报道,其获得了来自英国法院有关特斯拉起诉InterDigital和Avanci的法庭电子文件显示。特斯拉的律师希望根据竞争律师撰写的一份文件,将专利池费率从32...
日期:01-04
任天堂switch之后最新掌机「1 季度推出 Switch 2 游戏掌机 「消息称任天堂明年第」」
IT之家 7 月 9 日消息,根据财经网站 MoneyDJ 报道,在一篇针对鸿准精密工业股份有限公司的报道中,表示任天堂计划 2024 年第 1 季度推出新款 Switch 游戏掌机。此前爆料称 Switc...
日期:09-10
女子无人区遇乞食狼下车投喂 浑身瘦骨嶙峋感觉没危险:网友吐槽无知
7月6日,孔女士与丈夫自驾西藏,途经可可西里时遇到一只乞食的狼,便拿出放在车上喂狗狗的牛肉干喂给了狼。据孔女士讲述,这只狼浑身瘦骨嶙峋,毛发也非常凌乱,看着像是很久没有吃东西...
日期:07-08
完成国内首次端到端智驾大模型路测,千挂科技实现弯道超车
(原标题:完成国内首次端到端智驾大模型路测,千挂科技实现弯道超车) 2023年,由ChatGPT所掀起的大模型风潮正在席卷科技圈,它充分展...
日期:01-20
李佳琦双十一首日卖出95亿 虽有下滑但粉丝忠诚度较高
知名美妆博主李佳琦的直播间在“双十一”预售首日推出了约 400 种商品,价格范围从几十元到几万元。根据商品页面的售价和销量初步统计,本次直播的GMV(成交总额)为 95 亿元,与去年...
日期:10-26
别了!Win7/8.1将于本周彻底退出历史舞台
按计划,本周二(1月10日),Windows 7操作系统将结束ESU(付费外延扩展支持),也就是对于企业用户来说,即便是想再掏钱,微软也不会再下发安全补丁了。微软建议用户尽快升级到Windows 10或...
日期:01-09
AI 换装新突破:经 100 万张照片训练,解构重建服装准确率 95.7%_ai服装设计图
IT之家 11 月 28 日消息,科研团队近日研发出 Sewformer AI 系统,在训练 100 万张服装照片之后,具备识别和重建图片中角色服装的能力。Sewformer AI 系统可以分析用户输入的单张...
日期:11-28
欧盟将出台新法规,要求苹果等科技巨头简化用户在线数据迁移流程
IT之家 6 月 29 日消息,欧盟正在制定一系列法律,旨在限制科技巨头的权力,其中最新的一项被称为《数据法案》。该法案将规定苹果等科技公司如何使用欧洲消费者和企业的数据,并保...
日期:06-29