您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-04 23:19:06  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

oppo find x3 x60

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

汪德嘉:通付盾已成为全球领先数字化安全服务提供商

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

surface最便宜多少钱

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

红米note12价格

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
奔驰广告事件「大众之后,奔驰车机被曝推送广告_网易订阅」
IT之家 9 月 28 日消息,如今广告真是无处不在,电视机有广告、手机有广告,现在连汽车都要推送广告了,而作为交通工具,安全性是最重要的,车机推送广告势必会对行车安全产生影响。百...
日期:10-02
土巴兔多维度赋能产业互联网 家装赛道“换挡提速”
  一个行业能否迸发出巨大的增长潜力,有两个很重要的判断标准,一个是规模,另外一个是价值。   在规模上,《建筑装饰行业“十三五”发展规划纲要》指出,“十三五”期间建筑装...
日期:04-17
合作与竞争并行,微软和OpenAI关系开始变得“尴尬”_微软与ipfs合作
6月15日 消息:虽然说微软是OpenAI背后的大金主,而据《华尔街日报》报道,由于紧张和混乱,微软和OpenAI之间的合作关系开始变得“尴尬”。华为保时捷rs手机壳价格Ars Technica报...
日期:06-15
折叠头盔专利_顺丰关联公司公开 “智能头盔”外观专利
  1月28日消息 企查查 App 显示,1 月 26 日,顺丰科技有限公司公开了一项 “智能头盔”外观专利,公开号 CN306294216S,申请日期为 2020 年 6 月。   专利说明显示,该外观设...
日期:07-10
苹果连续两个季度营收净利下滑 iPhone销量超预期_苹果1季度利润
苹果公司周四公布了第二财季的财报,超出了华尔街的低预期,主要是因为iPhone的销售强劲。苹果公司首席执行官蒂姆·库克告诉CNBC,这个季度的表现“比我们预期的要好。”然而,苹果...
日期:05-05
马斯克或计划最早本周末起在全公司范围裁员 50%「马斯克的员工」
10月31日消息:据《纽约时报》报道,在全面接管推特公司后,马斯克已经计划在推特进行裁员,最快于本周六开始。消息人士透露称,一些经理已被要求拟定好裁员名单。中国法制报广告部...
日期:11-10
网易入股张艺谋旗下XR公司当红齐天
12月28日 消息:据天眼查App显示,12月27日,北京当红齐天国际文化科技发展集团有限公司发生工商变更,股东新增网易传媒科技(北京)有限公司,同时,注册资本由约7831万元人民币增至约799...
日期:12-28
手机换机周期已高达51个月!李楠:旗舰机已性能过剩_手机换机寿命榜
快科技12月25日消息,今天分析机构TechInsights列出了全球2023年和2024年全球智能手机市场情况。消费法关于团购退款的规定其中提到,2023年,全球智能手机的换机率可能会跌至23.5...
日期:12-25
iPhone 15“没有王炸”,苹果下半年更难了?
从今年上半年开始,数码科技圈就持续聚焦苹果新一代iPhone 15系列,一度有观点认为苹果将一改前两年“挤牙膏微调”的迭代策略,势必在iPhone 15系列上将“牙膏挤爆”。“没什么新...
日期:09-13
首搭鸿蒙4.0智能座舱!华为智选车智界S7预售:25.8万起_华为智选 车载智慧屏 powered by huawei hicar
快科技11月9日消息,华为在深圳正式发布智慧出行解决方案新战略,华为智选车首款轿车智界S7也正式开启预售,预售价格25.8万元起,该车将于11月28日正式发布。余承东表示,关于智界S7...
日期:11-10
水滴屏 5000万像素主摄 小米Redmi-13C高清渲染图曝光_小米水滴镜头
来源:中关村在线zeekr极氪价格规范盲盒市场已成为当务之急华为再推新版鸿蒙OS系统据9月27日消息,小米Redmi 13C智能手机的高清渲染图近日在网络上曝光。这款手机采用水滴屏设...
日期:09-29
美团闪购:双11手机销售额增长800%、高端化妆品订单量增长426%_美团外卖闪购平台
11月3日消息,美团闪购发布了“11.11”成绩,在“数码家电品类日”期间,手机销售额同比去年增长800%,生活小家电增长300%,电视及洗衣机等大家电增长均超500%。“美妆个护品类日”当...
日期:11-03
湖北现购车狂潮 最高补贴9万已抢光:销售称所在门店4天2000单_2021年湖北买车政府补贴
近日湖北省政企补贴购车者部分车型最高9万元消费券,其中东风雪铁龙C6等车型最高补贴9万元。iphone13售卖量据红星新闻记者从湖北某东风汽车公司销售处获悉,目前最高补贴9万的...
日期:03-09
5天涨粉300万!“导游小祁”爆火,抖音旅游赛道起风?_抖音很火的导游小哥
声明:本文来自于微信公众号 新播场(ID:New_bc),作者 | 场妹 美编 | 鳅圆,授权转载发布。见过因1个视频涨粉300万的,倒还是第一次见因为别人的视频而涨粉300万的。最近,一个新疆导...
日期:07-05
为成功登月 SpaceX与NASA共享星舰飞行数据「登月 飞船」
4月27日消息,SpaceX计划与美国国家航空航天局(NASA)共享星舰飞船的飞行测试数据,从而继续推动阿尔忒弥斯3号登月计划的设计。NASA官员表示,“这有助于我们的风控管理。”NASA官员...
日期:04-27
人民日报批弹窗广告:有关平台应珍惜声誉
  12月4日消息 人民日报今日发文批弹窗广告,称“弹窗广告”肆意而为,不仅影响上网者的心情和工作效率,还会带来木马植入、信息诈骗、强制消费等问题。   文章称,治理弹窗...
日期:04-04
明年量产!小米汽车已试生产近一个月:每周50辆样车
快科技9月6日消息,小米汽车近期连连传出好消息,在工厂竣工招工后,已经开始生产了。据国内媒体最新报道,小米汽车现在正处于试生产阶段,这项工作开展不足一个月,目前每周生产大约50...
日期:09-06
2022年OpenAI因开发ChatGPT和GPT-4时损失约5.4亿美元
5月6日 消息:根据The Information的一份新报告,OpenAI公司去年亏损5.4亿美元,是前一年的两倍,其中一部分资金用于从谷歌挖走关键工程师。创新发布会主持词知情人士称,自几周前推...
日期:05-07
研究发现人在打盹时最具创造力:创造性比清醒受试者多78%
快科技5月27日消息,美国麻省理工学院(MIT)与美国哈佛医学院研究人员最近一项研究发现,人们在打盹”时最具创造力,尤其当被引导梦到特定主题时。具体来讲,一个人在游离于睡眠和清醒...
日期:05-27
iOS版Skype存在漏洞 可导致地址簿被窃_skype被盗号
  据科技博客Techcrunch报道,3.0.1及之前版本的iOS版Skype“聊天信息”窗口存在跨站点脚本漏洞,可导致用户的手机地址薄被窃。   该漏洞使得攻击者可以执行恶意JavaScrip...
日期:07-23