您的位置:首页 > 互联网

哈工大bert模型「哈工深发布多模态大模型九天 性能提升5%」

发布时间:2023-12-04 19:42:29  来源:互联网     背景:

要点:

  • 九天(JiuTian-LION) 是哈尔滨工业大学(深圳)发布的全新多模态大语言模型,通过双层视觉知识增强,在13个视觉语言任务上取得了state-of-the-art性能,特别在Visual Spatial Reasoning上提升了5%。

  • 视觉信息提取不足问题得到解决,九天模型通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效提升了视觉理解能力,减轻了MLLMs的幻觉现象。

  • 新方法框架包括分段指令微调策略和混合适配器,解决了图像级理解任务和区域级定位任务之间的冲突,同时引入了软提示方法以提高高层语义注入的效果。

哈尔滨工程大学模型机课设

12月4日 消息:哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在13个视觉语言任务上的state-of-the-art性能,尤其在Visual Spatial Reasoning任务上实现了5%的性能提升。

论文链接:https://arxiv.org/abs/2311.11860

蹦迪视频素材高清

哈工大bert模型

GitHub:https://github.com/rshaojimmy/JiuTian

诺基亚全景摄像机

项目主页:https://rshaojimmy.github.io/Projects/JiuTian-LION

哈尔滨工程大学模型机课设

传统的多模态大语言模型在视觉信息提取上存在不足,导致了视觉定位偏差和幻觉等问题。九天模型通过双层视觉知识增强策略,解决了这一问题。

其方法框架包括分段指令微调策略和混合适配器,首次分析了图像级理解任务和区域级定位任务之间的内部冲突,实现了两种任务的互相提升。通过注入细粒度空间感知和高层语义视觉知识,九天在包括图像描述、视觉问题、和视觉定位等17个视觉语言任务上实现了显著的性能提升,其中13个评测任务达到了国际领先水平。

与现有的多模态大语言模型相比,九天通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效地提升了视觉理解能力,生成更准确的文本回应,减少了模型的幻觉现象。总体而言,九天为多模态大语言模型领域带来了新的思路和性能突破,为视觉语言任务的研究提供了有力的支持。


返回网站首页

本文评论
男子挖下水道掏出钱币手表吊坠玉器:自己能留下吗?
据秒闻视频报道,10月27日,河南许昌,一男子在家挖下水道时,有了意外收获,挖出不少钱币、手表、吊坠玉器。视频显示,男子和小孩在下水道里掏出了一大堆硬币,还有手表和玉器首饰。清洗...
日期:10-29
多平台纷纷入局!携程宣布接入百度文心一言「携程百度系」
2月15日 消息:近日,国内多个平台纷纷宣布接入百度文心一言,携程也宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴,标志着对话式语言模型技术在国内在线旅游服务场景的...
日期:02-15
华为官宣开发者大会 7月7日见:全球第三大手机系统鸿蒙4.0要来了
快科技5月29日消息,今天华为正式宣布了新的开发者大会时间,而HDC.Cloud2023将于7月7日在东莞拉开帷幕,同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共同探讨...
日期:05-29
“飞马”间谍软件如何入侵手机?「墨西哥调查“飞马”间谍软件的购买是否经过授权」
墨西哥检察官在一份声明中提到,他们一直关注前律师工会以2300万美元收购“飞马”(Pegasus )间谍软件的事件。墨西哥律师检察院提到它正在调查“飞马”间谍软件的收购,以及它是否...
日期:10-19
巴菲特再捐7.58亿美元  累计已捐赠460亿美元「巴菲特再捐29亿美元」
11月24日 消息:一份监管文件显示,巴菲特于当地时间11月23日额外又捐赠了240万股伯克希尔哈撒韦B类股票,按收盘价计算价值约7.58亿美元。孩子学猿辅导有用吗其中,巴菲特向苏珊·...
日期:11-30
iOS 代码编写神器即将停用「ios 代码编写神器即将停用怎么解决」
声明:本文来自微信公众号“CSDN”(ID:CSDNnews),作者:王启隆,授权转载发布。AppCode 是由捷克的软件开发公司 JetBrains 开发的 Swift 和 Objective-C IDE 开发工具,截至2017年6月...
日期:12-17
杰尼亚 Zegna Triple Stitch,探索现代男性多元穿搭「杰尼亚男装风格」
得体的着装与穿搭风格会展示一个人的格调与品位,而好的衣品也会为我们的魅力大大加分。意大利百年男装品牌杰尼亚Zegna,自创立以来一直致力于为消费者带来更多高奢时尚灵感,如T...
日期:07-18
3299元起!小米Redmi K70 Pro发布:骁龙8 Gen3,12GB内存起步_redmi k40 旗舰骁龙870
在今晚的Redmi十周年暨K70系列手机新品发布会上,Redmi K70 Pro手机正式亮相,以其强大的性能和独特的设计吸引了全场目光。这款新机被命名为“全场景性能之王”,并以其出色的硬...
日期:11-30
华为本月底将召开发布会:折叠屏手机、手表将发布「华为折叠新品发布会的产品」
上个月华为Mate 50系列正式发布,燃起了不少用户的热情,而有消息称华为将在本月底继续召开新品发布会,其中将会上市华为P50 Pocket new手机,新机将以6000元左右的价格发布,再一次...
日期:10-16
蜜雪冰城害人「蜜雪冰城回应要将偷餐者绑天桥示众 系吓唬手法」
最近,广州一间蜜雪冰城店面引起了公众的注意。店里贴出了一张手写的警示牌,声称要对偷吃者实施“绑在天桥上公开羞辱8小时”的严厉惩罚。不过,店里的员工后来解释说,这只是一种...
日期:10-08
公有云市场格局重塑  运营商加速进军第一梯队_公有云趋势
  转自:中国经营网  本报记者 谭伦 北京报道  在以天翼云为代表的云巨头正式组建云“国家队”后,运营商在云市场的存在感已变得愈发强劲,并正向第一梯队发起冲击。  三...
日期:09-10
2022年国庆档总票房破13亿:《万里归途》档期票房第一_2021国庆档首日票房
灯塔专业版数据显示,截至10月6日15时06分,2022国庆档(10月1日-10月7日)总票房(含预售)突破13亿 ,当前档期票房前三影片分别为:亚信科技年会1、《万里归途》8.83亿(累计9.40亿);华为watc...
日期:10-08
网友称绿牌电动汽车不能乘轮渡 涉事公司回应:公告属实「绿牌电车可以上高速吗」
6月30日消息,近日有网友发帖称,大连到烟台的一轮渡禁止绿牌电车乘船。通过网络搜索后发现,大连港大连湾新港轮渡客运在平台公告中写明:所有航线禁止绿牌纯电汽车及绿牌插电式混...
日期:06-30
Meta高管 元宇宙能培训失业者再上岗-人工智能抢夺了饭碗怎么办?_元宇宙新式骗局
北京时间5月17日早间消息,据报道,人工智现在成为了科技行业的新宠儿,扎克伯格力挺的元宇宙似乎被冷落。日前,Meta公司对外展示了一种黑科技,即利用元宇宙技术充当职业培训工具,帮...
日期:09-28
全系标配超光影长焦镜头 「OPPO」-Reno10系列今日发布_oppo reno10倍光学变焦怎么样
不久前OPPO官方已经宣布,将于5月24日也就是今天14:30正式推出全新的OPPO Reno 10系列,这将是迄今为止拍照最强的Reno系列机型。随着发布会进入最后的倒计时,截至目前关于该机外...
日期:09-17
女生应聘被问是否单身 网友:这是招员工还是找女朋友_招聘问有没有女朋友
据九派新闻报道,广东东莞的任女士应聘行政岗,HR问任女士是否单身,令其觉得感到奇怪,于是便举报该公司,随后被曝光引发网友热议。对此,老板陈女士称,要求单身无构成骚扰,为了确保招进...
日期:02-08
京东零售云亮相世界5G大会 数智化解决方案引领行业变革新趋势_智慧零售峰会
  8月31日,2021世界5G大会在北京召开。作为全球5G领域的国际性盛会,本届大会以“5G深耕,共融共生”为主题,聚焦共建数字基础设施,探讨5G未来发展趋势,助力打造5G 与多行业领域...
日期:05-23
CPU性能激增20%!苹果M2 Ultra处理器Geekbench 6跑分出炉
快科技6月11日消息,不久前,苹果发布了最新的M2 Ultra处理器,在新的Mac Pro与Mac Studio中首发搭载。做完包皮手术能开车么上海地铁包被车门夹住目前,这颗处理器的Geekbench 6跑...
日期:06-11
“客厅社交”取代走亲访友,聚好看发布“史上最长春节”大数据
  “复工潮”的到来,为长达一个月的春节假期画上了句号。近日,海信旗下互联网AI公司聚好看发布了大数据:春节假期期间,平均每个家庭日均在线时长412分钟,近7小时,环比提升25.76...
日期:01-11
中国最火SUV实至名归!比亚迪宋PLUS车系今年销量破10万_比亚迪宋plusdmi2021款销量
4月3日,比亚迪汽车官微宣布,宋PLUS车系3月销量32510台,2023年第一季度累计销量突破10万辆,实力书写SUV市场新格局。宋家族一直是比亚迪汽车的销量担当,一个家族贡献了1/4的销量。...
日期:04-04