您的位置:首页 > 互联网

智谱开源新一代多模态大模型CogVLM2

发布时间:2024-05-21 12:10:58  来源:互联网     背景:

5月21日 消息:智谱·AI最近宣布推出新一代多模态大模型CogVLM2,该模型在关键性能指标上相较于前一代CogVLM有了显著提升,同时支持8K文本长度和高达1344*1344分辨率的图像。CogVLM2在OCRbench基准上性能提升了32%,在TextVQA基准上性能提升了21.9%,显示出强大的文档图像理解能力。尽管CogVLM2的模型大小为19B,但其性能接近或超过了GPT-4V的水平。

CogVLM2的技术架构在上一代模型的基础上进行了优化,包括一个50亿参数的视觉编码器和一个70亿参数的视觉专家模块,这些模块通过独特的参数设置,精细地建模了视觉与语言序列的交互。这种深度融合策略使得视觉模态与语言模态能够更加紧密地结合,同时保持了模型在语言处理上的优势。此外,CogVLM2在推理时实际激活的参数量仅约120亿,这得益于其精心设计的多专家模块结构,显著提高了推理效率。

在模型效果方面,CogVLM2在多个多模态基准测试中取得了优异的成绩,包括TextVQA、DocVQA、ChartQA、OCRbench、MMMU、MMVet和MMBench等。这些测试涵盖了从文本和图像理解到复杂推理和跨学科任务的广泛能力。CogVLM2的两个模型在多个基准中取得了最先进的性能,同时在其他性能上也能达到与闭源模型相近的水平。

代码仓库:

Github:https://github.com/THUDM/CogVLM2

模型下载:

Huggingface:huggingface.co/THUDM

三星98英寸8k超高清电视价格

同系列手机涨价上千元

魔搭社区:modelscope.cn/models/ZhipuAI

始智社区:wisemodel.cn/models/ZhipuAI

Demo体验:

https://modelscope.cn/studios/ZhipuAI/Cogvlm2-llama3-chinese-chat-Demo/summary

CogVLM2技术文档:

https://zhipu-ai.feishu.cn/wiki/OQJ9wk5dYiqk93kp3SKcBGDPnGf


返回网站首页

本文评论
大屏追剧更护眼!母亲节逛京东选购iPad限时优惠700元_京东ipad什么时候有活动
本周日就是母亲节,今年的礼物选好了吗?如果预算充足,想给妈妈带来不一样的心意好礼,推荐逛京东为她选购Apple产品,无论是性能流畅、拍照超强的iPhone,还是大屏护眼、轻巧便携的iPa...
日期:05-11
拉勾网和前程无忧哪个好「前程无忧联手拉勾招聘发布企业数字化升级人才培养解决方案」
【】6月7日消息,拉勾联合前程无忧共同发布《2023年企业数字化转型组织力报告》(以下简称《报告》)。《报告》调研了一线及新一线城市3789家企业,深度剖析企业数字化转型人才需求...
日期:09-24
图领域通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预...
日期:02-09
Adobe推出iOS版PDF阅读器Adobe Reader_adobe pdf reader app
  10月18日消息,据国外媒体报道,Adobe周一推出了iOS版PDF阅读器Adobe Reader,可以支持 iPhone、iPad和iPod Touch等苹果设备。这款应用从即日起可从iTunes免费下载。   iO...
日期:07-24
类 DC 调光来袭 realme GT5 内测招募开启_realme gt有dc调光吗
10月21日,realme GT5 手机开始招募类 DC 调光内测用户。只需在 realme 社区报名,即可获得体验资格。更新后的系统将支持类 DC 调光功能。如图所示,在开发者选项中添加了 "单脉...
日期:10-22
分类网站上市前掀资本战 58同城与赶集同步融资_58并购赶集
  随着互联网公司上市热潮的涌现,国内分类信息网站上市的步伐渐近,在经过5年竞争淘汰赛之后,分类网站即将迎来收获期。腾讯科技由此推出系列文章,就分类网站的当前现状和上市...
日期:07-27
葫芦岛三星手机售后服务电话「三星手机售后服务电话」
是指消费者在购买三星手机后,在使用过程中出现故障或需要维修时所联系的官方客服电话。对于消费者来说,更好地了解,可以有效地提高售后维修效率,解决更多问题。目前,已经成为广大...
日期:05-30
受网购影响,Bose决定关闭北美、欧洲、日本等共119家零售店
  1月16日消息 据外媒报道,目前越来越多的消费者进行在线购物,Bose公司计划在未来几个月关闭其在北美、欧洲、日本和澳大利亚的119家零售商店。   the verge报道称,Bose...
日期:04-19
一个时代的终结_Intel也开始淘汰DDR4内存-_ddr3被淘汰了吗
AMD Zen4锐龙7000系列毅然决然抛弃了DDR4内存,仅支持DDR5,给更新换代造成了不小的麻烦。漫步者听力耳机相比之下,Intel这次就良心多了,12/13代酷睿同时兼容DDR4/5内存,用户可以自...
日期:09-18
京东直播草莓音乐节出场顺序「京东3C数码登录深圳草莓音乐节 露营+潮电跨界融合燃爆夏日现场」
在5. 20 这样充满爱意的日子里,京东3C数码与草莓音乐节携手来到深圳大梅沙海滨公园, 24 组备受年轻人喜爱的海内外知名音乐人和乐队陆续登台献唱。同时,此次音乐节京东与电小二...
日期:01-05
苹果MR头显将支持iPad应用,苹果生态发力!_苹果mr头戴式显示器
据外媒报道,苹果即将推出的MR头显将支持数百万款现有的iPad应用程序,以及苹果自身开发的关键应用,如默认浏览器、音乐、电视、视频通话、新闻、文件管理、邮件、日历、地图等应...
日期:04-26
如何选一款好用的投影仪?高清高亮好用投影仪推荐_如何选择高清晰度的投影仪
随着科技的不断发展,越来越多的智能家居产品走进我们的生活,成为了提升生活品质的绝佳选择。家用投影目前越来越普及,但是一般的投影仪亮度低不说,画质还很差,今天小编就给大家推...
日期:08-24
锚定与锚定的区别「锚定“工业互联网第一品牌” 从“灯塔工厂”迈向“数字领航”」
2023/5/29 14:59 锚定“工业互联网第一品牌” 从“灯塔工厂”迈向“数字领航”   ——记河北联通5G+工业互联网行业解决方案部支撑总监张海军作为河北联通5G+工业互联...
日期:05-29
抖音电商发布羽绒服“品质甄选”质量标准「抖音预售羽绒服」
9月30日 消息:日前,抖音电商发布了关于新增《抖音电商羽绒服“品质甄选”质量标准》的意见征集通知,意见征集期2022年09月29日—2022年10月06日。本规则拟于2022年10月13日首...
日期:10-03
AI哨所 | AI不受约束或成“噩梦” 这八大风险不容忽视_aciv哨兵
凤凰网科技讯 北京时间4月16日消息,尽管人工智能(AI)技术的主流应用令人兴奋不已,但是如果不加以约束,一些科幻小说式的场景也会成为噩梦。AI安全专家、AI安全中心主任丹亨德里...
日期:04-16
助推教育融合创新!TCL亮相中国教育装备展示会
4 月 21 日,第 81 届中国教育装备展示会于南昌绿地博览中心盛大开幕,来自全国1000+教育装备领域头部厂商参加此次盛会。TCL作为行业领先的教育解决方案提供商,以信息技术与教育...
日期:04-23
真我GT5 Pro今日发布 配置基本清晰 只剩价格还未公布_真我gt5g手机值得入手吗
  【手机中国新闻】真我GT5 Pro将于今日也就是12月7日下午两点正式发布,关于这款手机的配置,基本已经被真我官方爆料的差不多了,就连手机的售价网上也有了消息。对于消费者来...
日期:12-07
淄博张店烧烤店「淄博张店烧烤倡议高考停业三天 车辆尽量绕开考点」
在高考即将到来之际,山东淄博张店区烧烤协会发布了《致全体烧烤经营业主的倡议书》。百度app元旦红包苹果新一代iphone降价传闻倡议书包括以下内容:从6月6日晚至9日晚,各烧烤...
日期:06-06
Adobe推出Premiere和Photoshop Elements 2023版「Adobe Premiere Elements 2020」
9月30日消息:Adobe公司今天推出了新版本的Photoshop Elements和Premiere Elements,该公司的这两款照片和视频编辑软件价格低廉,主要针对那些希望用简单的编辑工具来增强照片和...
日期:10-01
竞争环境不是决定因素 卢伟冰表示小米发展靠能力 不是靠外界环境
小米集团总裁卢伟冰近日在财报电话会上表示,他认为市场竞争和回归是常态,竞争环境并不是决定因素。卢伟冰强调,小米的发展还是要靠自身能力的提高,而不是外界环境。他透露,小米集...
日期:09-06