您的位置:首页 > 互联网

代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

发布时间:2024-04-15 19:49:16  来源:互联网     背景:

4月15日 消息:香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。

Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力而著称。模型能够结合图像推理和生成,提供了从2B到34B不同规模的版本,其中最强版本在多个指标上与Google Gemini Pro和GPT-4V相比毫不逊色。

moto防摔手机

项目地址:https://top.aibase.com/tool/mini-gemini

试玩地址: https://103.170.5.190:7860/

Mini-Gemini模型的代码、模型和数据已经全部开源,可以在Github、论文地址和模型及数据的Huggingface页面上找到。这一开放性的举措使得Mini-Gemini迅速登上了PaperWithCode的热榜,受到了广泛关注。

facebook技术总监兼总工程师

Mini-Gemini的图像理解和生成能力通过Demo形式得到了展示,用户可以在线与自定义图像进行对话。这一功能使得Mini-Gemini在实际应用场景中表现出色,尤其是在需要对高清图像进行解析并用图像形式展现的任务中。例如,Mini-Gemini能够根据图片内容对做面包的过程进行指导,也能根据电脑图片中的参数进行准确对比。

此外,Mini-Gemini在保留图像理解和推理能力的同时,还具备了图像生成能力,类似于ChatGPT与生成模型的结合。通过抽象的多模态指令,模型能够进行推理并生成合适的图片。例如,当用户提出两个毛线团能做什么时,Mini-Gemini不仅能识别图片内容并给出建议,还能生成相应的毛线小熊图片。

Mini-Gemini的技术背后,采用了名为Gemini的视觉双分支信息挖掘方法,通过使用卷积网络(ConvNet)对高分辨率图像进行编码,并利用Transformer中的Attention机制来挖掘每个低分辨率Query对应的高分辨率区域。在图像生成方面,Mini-Gemini结合了SDXL技术,通过LLM生成的文本链接两个模型,类似于DALLE3的流程。

闪光灯复古照片

在数据方面,Mini-Gemini通过收集和优化训练数据,实现了对图像理解、推理和生成的统一流程。即使在仅使用2-3M数据的情况下,Mini-Gemini也能在各种Zero-shot榜单上与大厂使用大量数据训练出的模型相媲美,展现了其高效性和实用性。这一成果不仅为开源社区带来了新的活力,也为多模态模型的发展和应用开辟了新的可能性。

乔布斯吐槽触控笔


返回网站首页

本文评论
5899元起 索尼新一代超广角变焦Vlog相机ZV-1 II发布「索尼zv1广角镜」
快科技5月24日消息,索尼正式发布了新一代超广角变焦Vlog相机ZV-1 II(型号名:ZV-1M2)。作为ZV系列新成员,ZV-1 II保持了小巧便携的机身设计,提供黑白双色可选,同时搭配相比ZV-1更宽...
日期:05-24
Google Assistant 将转向生成式人工智能:改造得更像 ChatGPT 和 Bard AI_google transalater
8月1日消息:根据 AxiOS 的报道,谷歌计划通过生成式人工智能为 Assistant 添加新功能。groupon创始人在 AxiOS 获取的一封电子邮件中,谷歌告诉员工,他们已经开始探索由最新大型...
日期:08-01
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开...
日期:04-10
爱国者起诉东芝两款笔记本侵权一审胜诉_东芝笔记本电脑案
  10月9日消息,爱国者电子去年开始起诉东芝惠普侵权usb plus技术上周获得初步结果。爱国者电子透露,最近西安人民法院一审判决判东芝侵权成立,判东芝支付20万元人民币的赔偿...
日期:07-23
小米智能门锁M20系列新品将于7月27日发布_小米智能门锁s2
7月26日 消息:小米智能生态将于7月27日发布新款M20系列智能门锁。这款门锁主打安全性能,并自带门铃功能,据传还可能支持人脸识别技术。三星s22新品发布会与小米之前推出的M20...
日期:07-26
一天卖出50万台,16GB+512GB+骁龙8Gen2,如今全系跌价800元_骁龙8g处理器
喜欢但又买不起华为手机的很多消费者,最终都入手了荣耀手机,因为荣耀曾经是华为子品牌,与华为是一家,并且这一子品牌走的是性价比路线,线下同配置机型比华为手机更为便宜,这也是之...
日期:12-26
2022元宇宙共享大会|元宇宙共创大赛暨产业风云榜合作启动「2021首届元宇宙高峰论坛」
央链直播报道, 2022 年 8 月 16 日,“开放与兼容” 2022 元宇宙共享大会暨《元宇宙十大技术》图书首 发仪式,及元宇宙产业委第 一届第二次全体委员大会,在北京西山国管局杏林山...
日期:09-12
大厂智商税?特斯拉限量酒杯530元开卖
中关村在线消息:近日,特斯拉于美国官网上推出了一款售价75美元(折合人民币530元)的玻璃酒杯,用于啜饮特斯拉龙舌兰酒。从产品页面上可以看到,杯子设计有棱角轮廓并刻有特斯拉标志,...
日期:11-16
高保真和沉浸感 三星Galaxy Buds2 Pro给你想要的好音乐_三星galaxy buds+2
坚定的信念,无畏的品质,这个时代的年轻人总被贴上诸如此类的独有标签。对于Ta们来说,美好的生活不仅要有更努力的工作,更要有诗、音乐和远方。而如果想要想做到让年轻人满意,诸如...
日期:05-04
iphone官网价格会降吗「抢手!iPhone平均售价还要涨?果链公司笑了」
  机构最新预测显示,由于iPhone 14 Pro系列机型畅销等原因,苹果iPhone平均售价将会在第三季度创下新高,达到892美元。  然而,iPhone 14标准版销售却遇冷。Sandalwood电商市...
日期:10-05
口腔护理刻不容缓,纳美科技助你“早晚”刷出健康牙齿!
  据第四次全国口腔健康流行病学调查显示,中国绝大多数的成年人正遭受口腔问题的困扰:97%的成年人患有牙结石,88%的成年人患有龋齿,85%的成年人有牙龈问题……口腔问题不容忽...
日期:07-15
2023手机颜值天花板?vivo S18系列新配色曝光,还有影棚级人像_2021年vivo最新款手机s10
今年的“手机颜值天花板”称号,将会花落谁家?临近年底,市场上新机频出,其中不乏高颜值手机,但在vivo副总裁欧阳伟峰公布vivo S18系列全新“花似锦”配色后,许多网友还是被这款手机...
日期:12-01
微软澄清不会从 Windows11 任务栏中移除新增的 Bing Chat
3月8日消息:微软在今年 2 月下旬推送Windows112023 年 2 月更新的时候,最值得关注的改进就是在任务栏直接集成了必应聊天功能。airpods2突然断连日前部分 Windows11 Dev 频道...
日期:03-08
小米双11狂赚84亿!干碎苹果夺销量王_小米手机销量超越苹果
中关村在线消息:11月5日,据相关爆料,从1号起今年的双11正式开始,截止到今天,各大电商平台的第一波双11大促也正式截至并即将开启第二波双11优惠活动。从预售到截至小米品牌包揽了...
日期:11-12
全品类消费客单价大增 京东到家携手品牌商家打造消费新阵地
  随着消费水平的提升,消费者愈发追求在生活方式上的全面升级,在京东到家平台的购物习惯正全面向全品类化发展。618销售数据显示,宠物用品销售额达到了去年同期的2.5倍,居家...
日期:12-10
真“生化武器”!女子闻刚脱下的袜子感染真菌肺炎:医生提醒
10月18日消息,闻臭袜子真的有可能会出事,强烈建议大家不要这么干!阿里巴巴国际站1000元以下平板电脑谷歌pixel4天体模式据媒体报道,近日河南新密的网友海燕”分享了自己闻了闻刚...
日期:10-18
Neo5 240W快充将“捅破天” 实在太快了_真我GT
不久前,真我推出了240W满级秒充技术,同时宣布全新的真我GT Neo5将首发搭载该技术,将于2月份正式发布。随着发布时间的日益临近,外界关于该机的爆料也更加密集,截至目前已经有非常...
日期:09-20
雷军做小米「打磨好了再展示 雷军称小米正研发一些有趣技术和产品」
小米CEO雷军微博发文谈大模型和AIGC。雷军称,小米在AI领域已经耕耘多年,有AI实验室、小爱同学、自动驾驶等团队。对于大模型,我们当然会全力以赴,坚决拥抱。我们正在研发一些有...
日期:10-03
周鸿祎:大模型写作不是搜索逻辑 提问需要得当且深刻
6月8日消息:在日前的以《创业之路·保持好奇坚定挺住》为主题的直播对话中,360 集团创始人周鸿祎在对话御风集团董事长、万通集团创始人冯仑时指出,大模型写作不是搜索的逻辑,...
日期:06-08
水滴步步宝用户突破500万  水滴筹、水滴互助持续完善健康生态
  2019年2月25日,水滴筹、水滴互助旗下健康工具小程序“水滴步步宝”正式对外宣布,其用户已经突破500万大关。   从当初上线刷屏朋友圈,到如今用户数据大量突破,其受欢迎程...
日期:03-14