您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 20:34:37  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

斯凯孚将成为蔚来陶瓷球轴承的供应商吗

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

苏宁双十一悟空榜

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

荣耀magic 5系列发布时间

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

amdx27750跑分

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
小米集团Q2智能电动汽车等创新业务费用为6.11亿元(小米进军智能电动汽车行业)
讯 8月19日下午消息,小米集团(HK: 1810)今日发布截至2022年6月30日的第二季度财报。财报显示,小米第二季度营收701.7亿元,预估698.6亿元;净利润13.9亿元,预估15亿元;调整后净利润20....
日期:08-20
8K大屏亮相!海信商用显示助力杭州亚运会打造沉浸式观赛体验_海信8k春晚
9 月 23 日,第 19 届亚运会在杭州盛大开幕。会贵宾、叙友谊、谋团结、向未来,杭州亚运会点燃了普通民众对体育赛事的激情与热爱,也激发着人们对于祖国的浓浓自豪感。为了更好地...
日期:09-27
X开始向新西兰和菲律宾用户收费以对抗机器人账户
10月18日 消息:据国外媒体报道,X(前身为Twitter)最近宣布,它将开始向新西兰和菲律宾的新用户收取年费1美元,以减少这些地区存在的大量机器人账户。海信电视 欧洲杯这项名为“Not...
日期:10-18
百家明星企业率先完成安徽省信创适配测试,获权威报告和通用证书
  近日,经过安徽省信息技术应用创新适配验证中心(以下简称“安徽省信创适配验证中心”)高标准、严要求的适配验证,安徽省近百家重点企业正式获得省级通用的适配验证报告和...
日期:07-17
推特管理层大洗牌 马斯克需向三名被解雇高管支付逾2亿美元_马斯克与推特ceo
10月28日消息,据国外媒体报道,在马斯克27日晚间完成对推特的收购后,一上任就将管理层大洗牌,解雇多名推特原高管。据知情人士透露,推特原首席执行官帕拉格•阿格拉瓦尔(Parag Agra...
日期:10-31
红米k7参数「3299元起冲击高端!Redmi K70 Pro发布:2K国产屏 国产定制相机」
快科技11月29日消息,今晚Redmi带来了首次冲击高端的旗舰机型Redmi K70 Pro。该机代表着Redmi有史以来最强堆料水平,包括性能、外观、屏幕、影像等各方面,将开启Redmi下一个十年...
日期:11-30
高性价比智能手机推荐「高性价比智能手机推荐知乎」
在如今移动互联网发展的时代,智能手机已成为人们生活中必备的电子设备,但市场上琳琅满目的智能手机品牌以及各式各样的型号,令消费者选择困难。在这里,笔者推荐几款性价比较高的...
日期:05-29
抖音开卷即时零售!_抖音开卷即时零售怎么开
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:见实,授权转载发布。用户在哪里,大厂就卷到哪里。这一点在抖音身上体现的淋漓尽致。2022年,抖音开始测试推出即时零售服务...
日期:10-12
派美特耳机app_派美特新品蓝牙耳机PaMu Nano发布:主打随行HiFi
  在 2020 年的最后 1 天,国内知名音频品牌派美特(Padmate)推出了全新的真无线耳机产品-- PaMu Nano。这款耳机的市场定位是能够随身携带的 HiFi 耳机,搭配石墨烯扬声器,无感...
日期:07-16
滴滴:2023年一季度营收427亿元 同比增长19%「滴滴2021年盈利」
7月10日 消息:滴滴出行于7月9日公布了2023年一季度未经审计的财务业绩,这是其APP上架后首份季报。小米13天玑版财报显示,滴滴2023年一季度营收为427.12亿元,较上年同期的358.48...
日期:07-10
郭明錤:立讯预计最快在 2023 年第一季度开始出货苹果 iPhone14 Pro
10月31日消息:天风国际证券分析师郭明錤发布研报指出,最新调查显示,目前iPhone供应链出货预估,并没有因郑州厂区而有变化。预期鸿海数周内产能将逐渐改善且对4Q22iPhone出货影...
日期:11-01
二次机会:魅族5款手机又能免费换电池了!「魅族手机换电池活动」
不少厂商经常提供给手机低价换电池的福利活动,但免费换电池,还给二次机会的,魅族应该是第一家。在此之前,魅族已经三个批次,为不少旗下手机提供了免费换电池活动。苹果13上市苹果...
日期:10-03
提前半年完成全年任务目标  上海超52万电信用户免费升级百兆宽带
  2021年初,上海市政府发布10项为民办实事项目,其中“为困难家庭免费升级百兆宽带”成为推进上海市信息化建设的重中之重。中国电信上海公司(以下简称“上海电信”)积极响...
日期:04-06
比亚迪份额超1/3稳居第一!2023新能源厂商零售销量TOP10出炉_2021比亚迪新能源车销量
快科技1月10日消息,今天,乘联会发布了2023年新能源厂商零售销量排行榜,比亚迪以2706075台的零售销量稳居第一。铁甲小宝动画片国语完整版数据显示,2023年新能源乘用车国内零售销...
日期:01-10
曝realme 240W快充神机6月12日登陆全球市场_realmeq是多少快充
realme在2023年世界移动通信大会上发布了旗舰机型GT3,这款手机支持240W快速充电,并在4600mAh的电池上实现了9分30秒充满。爆料人士 @Paras Guglani 在 Twitter 透露,realme GT3...
日期:06-06
专业中英文翻译机推荐:讯飞双屏翻译机打破语言障碍(中英翻译机主推讯飞翻译机)
  在诸多通过语言传播知识的方式中,演讲是最常见、也是最直接的一种。虽然通过演讲传播知识很直接很高效,但是如果听不懂演讲者的语言,那么对演讲内容就会很难理解和领会,尤...
日期:07-17
成都富士康限电停产一周_富士康会停电吗
  财联社8月15日电,财联社记者从负责富士康招聘的中介处了解到,成都富士康从15日至20日限电,仅保留20%保安负载,全厂生产停止。生产线员工对财联社记者表示,已接到休息通知。(财...
日期:09-26
消息称谷歌将入局折叠屏手机市场,鸿海代工(折叠屏手机产业链)
IT之家 8 月 8 日消息,据中国台湾地区经济日报报道,在三星即将推出新款折叠手机之际,消息称谷歌也将加入折叠手机市场,由鸿海代工,也让鸿海的智能手机制造延伸至折叠手机领域。苹...
日期:08-19
开发者再次痛批Xbox Series S主机:迟早限制游戏开发
自从微软公布Xbox Sereis S这台主机以来,它就因为相较Xbox Series X和PS5明显羸弱的性能,成为了第九世代游戏主机中争议最大的一款产品。腾讯音乐娱乐集团百科虽然微软明确表...
日期:04-02