您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 12:04:29  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

iphone14新机发布

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
合众伟奇联手第一学习平台,构建AI数智化服务格局_合众伟奇上市
(原标题:合众伟奇联手第一学习平台,构建AI数智化服务格局) 近日,合众伟奇与百度飞桨宣布达成合作,双方的合作正如燎原之火般,点燃...
日期:09-16
小米pad6「待机时长达47.9天!小米平板6 Pro配备8600mAh电池」
小米近日发布了最新预热信息,即将推出的小米 Pad 6 Pro 配备 8600mAh 的大电池,待机时长有了大幅提升。此外,这款平板电脑还将首发深度休眠模式,休眠待机时长高达47.9天。值得一...
日期:04-15
智慧城轨建设落地难点及布局建议_智慧城轨发展方向
通信世界网消息(CWW)智慧城轨建设作为城轨交通行业绿色发展的主要驱动力量,可对城市交通运营效率、乘客体验等带来较大提升,且其关联市场正处在高速增长阶段。但智慧城轨在建设...
日期:12-15
36年前电脑用上AI:IBM 5155运行ChatGPT是什么样?
如果要绘制进一度时间科技新闻关键词词云的话,占据空间最大、最显眼的绝对是人工智能”四个字。2022年9月苹果发布的新款ipad那么,你是否能够想象,在一台距今已有36年历史,运行M...
日期:03-27
淘宝商城“治愈系”专场 双11抚慰光棍节的TA
  “光棍节快到了,小鸟恋爱了,蚂蚁同居了,苍蝇怀孕了,蚊子流产了,蝴蝶离婚了,毛毛虫改嫁了,青蛙也生孩子了,你还等什么?” 面对朋友这样开玩笑的短信,单身族还hold住吗?要练就抗高...
日期:07-24
iPhone 15 Pro跌落测试结果让人震惊 后盖直接分离_苹果2015pro
近日,一位国外视频博主不远万里飞往澳大利亚购买iPhone 15 Pro,为的是在第一时间向观众展示其跌落测试。 根据发布的视频内容,iPhone 15 Pro的钛合金中框,似乎并没有比iPhone 14...
日期:09-24
富士康为电动汽车业务挖来首位大人物 前东风汽车总裁加盟_富士康汽车行业总经理
凤凰网科技讯 北京时间1月30日消息,富士康周一任命日本电产前CEO、东风汽车前总裁关润(Jun Seki)为其电动汽车子公司的首席战略官。富士康希望借助电动汽车业务开拓新市场,这...
日期:01-30
Redmi Note 12系列入网:支持210W快充「红米note11pro多少w快充」
不久前,被称为2022年最美小米手机的全新小米Civi 2凭借极具辨识度的工业设计、强大的自拍实力和轻薄的外观受到了不少女性用户的期待,而与此同时,同属小米家族的子品牌Redmi也...
日期:10-03
腾讯安全:RDS漏洞危害堪比永恒之蓝 为企业提供免费无伤检测
  2019年5月,微软官方披露Windows远程桌面服务中存在远程代码执行漏洞,其危害堪比“永恒之蓝”,一旦触发可能导致类似WannaCry的蠕虫病毒爆发,造成不可逆转的严重后果。本月...
日期:09-04
明日起,全国统一取消高速公路省界收费站,实现ETC快速通行(高速取消ETC)
  12月31日消息 据北京日报报道,明天开始,全国统一取消高速公路省界收费站,实现电子不停车快速通行。在北京,高速路收费车道中ETC车道占比近7成,主线收费站只保留混合车道2到3...
日期:03-01
宠物“洗剪吹”,国庆档“Tony”难求「宠物洗剪吹多少钱」
声明:本文来自于微信公众号 锌刻度(ID:znkedu),作者:铲屎官Lily,授权转载发布。国庆将至,“铲屎官”姜姜眼下正为一件事发愁,家里的猫狗都到了该洗澡的日子,但因为忘了提前预约,家附...
日期:10-09
德州仪器(TI)2022年第三季度营业收入52.4亿美元 较去年同期增长13%「德州仪器财报2021」
10月29日消息,德州仪器公司(TI)近日公布其第三季度财务报告,营业收入52.4亿美元,净收益23亿美元,每股收益2.47美元。其中,每股收益包含未涵盖在公司原始计划的2美分。关于公司业绩...
日期:11-02
5G 问题_关于5G 你关心的问题都在这里了
  前不久,北京地铁16号线成为了北京首个实现5G网络覆盖的地铁线路,如果你目前有支持5G的手机,就已经可以在16号线地铁上体验了。   随着一些事件的发生,5G最近成为了非常...
日期:12-08
moto手机2023年推出新款moto将与潘通推出柔和桃限定版手机_1月上市
来源:中关村在线12月8日,联想中国区手机业务部总经理陈劲宣布,moto将与潘通合作推出一款名为moto razr 40 Ultra柔和桃限定版的手机。这款机型预计将于明年1月上市。根据预热海...
日期:12-08
赶集网品牌更名为赶集直招,定位企业直接招聘平台_赶集网变招聘网站了
  1 月 20 日上午消息,58 同城今日宣布,旗下“赶集网”正式重塑为专注招聘市场的“赶集直招”,以“企业直招”为核心特点,解决企业招聘难、求职效率低的痛点。   据介绍,赶...
日期:07-04
华为mate 50最新消息「华为mate 50系列获得harmonyos 3更新官方降价」
华为mate 50系列获得了harmonyos 3更新的新版本,在某些场景下提高了网络信号稳定性和互联网速度。另外,mate 50系列在华为官方商城上获得了高达八百元的官方降价。华为mate 50...
日期:04-29
王小川大模型首亮相!70亿参数霸榜,清北抢先用|独家专访_王小川ioi
声明:本文来自于微信公众号 新智元(ID:AI_era),编辑:好困 桃子,授权转载发布。【新智元导读】今天,百川智能正式发布70亿参数开源中英文大模型——baichuan-7B,一举拿下多个评测榜单...
日期:06-15
全球央行为何狂买黄金 去年全球黄金需求同比增加18%「全球黄金消费量」
据澎湃新闻报道,2022年全球黄金需求同比增加18%,达到4740.7吨,创下自2011年以来最高的年度总需求量。Exynos AMD报告显示,2022年,全球央行年度购金需求达到1136吨,较上年的450吨翻...
日期:02-01
Stadia关闭,谷歌把寒气传递给腾讯、网易
声明:本文来自于微信公众号新熵(ID:baoliaohui),作者:樟稻,授权转载发布。纵然早在预料之中,但谷歌突然宣布关闭旗下云游戏服务Stadia的消息,还是让人猝不及防。9月29日,Stadia副总裁...
日期:10-10
微软Surface Duo翻车:升级Android 12L有概率直接变砖「surface duo刷win10」
上个月,微软宣布了旗下手机Surface Duo系列的重大更新”,带来了基于Android 12L的系统版本升级。升级后的系统在UI设计上延续了Win11的设计风格,并能够更便捷的让用户在Win11 P...
日期:11-23