您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 01:13:16  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

日语电子词典特价

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
茶颜悦色,全靠演技?(茶颜悦色 明星)
  茶颜悦色南京开店,被质疑雇人排队。对此茶颜悦色回应说,大庭广众之下博出位,“再借十个胆子,也是不敢”。有人调侃说,这个回应“茶里茶气”;也有网友质疑,茶颜悦色每次开店都...
日期:08-21
睡觉不取耳环「女生睡觉不摘耳钉:直径4mm钻掉耳道 卡了半个月」
9月24日消息,陕西延安一女生称采耳时师傅在自己耳道内挖出直径4mm的耳钉钻引关注。LG新能源汽车零售MAC据悉,当事人小尤平时睡觉不会摘耳钉,之前耳钉钻脱落过,简单安装了下便继...
日期:09-24
“技术派”萤石下放硬核视觉技术,新品清洁机器人拥抱具身智能时代
10 月 12 日, 2023 萤石清洁机器人新品发布会在杭州举行。发布会上,萤石发布了扫拖一体机器人RS20 Pro和云视觉商用清洁机器人BS1,实现家用、商用清洁场景全覆盖,更丰富的产品...
日期:10-15
马化腾对内讲话:有些业务活都活不下去了,周末还打球
(原标题:【独家】马化腾对内讲话:留给某些业务的时间不多了,不要再跟我说买量的事) 图片来源:视觉中国记者|崔鹏12月15日腾讯在线上...
日期:12-22
喜欢麻辣爆炒却不愿吸入油烟异味?别急,厨房达人必备这款油烟机
  前两天,小编又被邻居家做饭时飘来的重重辣椒味呛出了眼泪。每次遇到这类情况,小编都有种冲动,想要向邻居喊一句:兄弟,你家真该换个油烟机了!   确实如此,要是没选对油烟机,...
日期:07-03
董宇辉建议俞敏洪拍《中国合伙人2》 网友:真·合伙人故事_中国合伙人人物原型
快科技1月22日消息,据国内媒体报道,日前,俞敏洪在一论坛上谈到,在新东方的30年,他经历了无数次的内部矛盾和斗争,各种风波以至于拍成了《中国合伙人》的电影。现在董宇辉跟我建议...
日期:01-22
炫彩办公,畅享无限   I Brother新一代“炫彩系列”打印机炫丽上市
深受行业用户青睐的Brother “炫彩系列”彩色数码多功能一体机家族,近日又添新成员。新一代“炫彩系列”囊括了HL-L3228CDW、HL-L3288CDW;DCP-L3528CDW、DCP-L3568CDW;MFC-L3...
日期:09-07
iPhone 13 5G基带「苹果15信号有救了!高通商用最强5G基带:全球首个支持Wi-Fi7商用方案」
伴随着骁龙8 Gen2的发布,高通也将要正式开始商用X70 5G基带了,当然下一代的iPhone 15也会用它,所以不用担心信号差了?需要明确的是,第二代骁龙8的X70 5G基带芯片是首个集成AI处理...
日期:11-18
创新之光:从无人工厂到智能穿戴,华尔科技引领中国纺织业转型升级
华尔科技集团股份有限公司(简称:华尔科技)位于浙江嘉兴,是纺织业的领军企业。勇于创新的企业家将公司由传统纺织转型为智能制造巨头,成功领跑工业4. 0 时代。华尔科技专注高端...
日期:12-07
熊猫界女明星!花花登上纽约时代广场大屏:靠卖萌坐拥百万粉丝
当地时间3月26日,四川画家手绘的大熊猫花花”登上纽约时代广场大屏,引发路人驻足。花花是熊猫界的女明星,年纪轻轻就已坐拥了数百万的粉丝,近期更是频频登上各大平台热搜,引得众...
日期:03-27
谷歌美国开推8千兆宽带服务 上下行同速:每月资费真不贵「美国国家宽带计划目标到2020年宽带上行速率为多少mbps」
快科技4月10日消息,每月8千兆宽带,而且是上下行同速,每月多少费用你会接受呢?美版iphone14取消sim卡槽三星galaxy a7 2018三星2029据悉,Google Fiber已经在亚利桑那州梅萨市推出...
日期:04-10
#iphone15pro#「iPhone 15 Pro机模曝光 外观定板开始量产」
外媒有博主iPhone 15 Pro的模型,和此前曝光的基本相近,iPhone 15 Pro机身侧面的按键进行了调整,在设备的左侧提示有一个细长的按钮,用户控制设备的音量。iPhone 15 Pro底部的端...
日期:04-16
Redmi Note 13 Pro 设计曝光 采用方形摄像头布局_红米note13pro
7月20日 消息:Redmi Note13Pro 的工业设计简化图曝光后引起了广泛关注。与小米13相比,它在整体设计上有着一些相似之处。首先,Redmi Note13Pro 采用了方形摄像头布局,这与小米1...
日期:07-20
奔驰二手车怎么折价「男子网拍二手奔驰车遇调表 拍卖公司退一赔三赔偿70余万」
买卖二手车,如果车主遭遇调表、火烧泡水、重大事故等故意欺诈行为,可拿起法律武器维权,如果销售欺诈成立,车商最高可被处罚退一赔三。据了解,陈先生诉称,2021年10月,自己从某拍卖公...
日期:03-25
2024,智能汽车走出独立曲线_2021年智能汽车
声明:本文来自于微信公众号商业数据派(ID:guangzhui-tech),作者:刘俊宏,授权转载发布。新能源汽车正在带领中国车市走向新的高峰。在2023年,新能源汽车的增速显著超越整体车市。...
日期:12-28
恒生电子怎么了「恒生电子:恒生大模型产品LightGPT已开启内测」
9月25日 消息:恒生电子宣布,恒生大模型产品已面向20家金融机构开启内测。据悉,恒生金融行业大模型 LightGPT 是专为金融领域打造的大语言模型,具有更专业、更合规和更轻量的特...
日期:09-25
华为Mate 60 Pro推送鸿蒙OS 4 132版升级:优化网络连接 系统更稳定_华为mate60最新官方消息
快科技11月12日消息,日前,华为Mate60Pro推送最新鸿蒙OS4.0.0.132版本升级,安装包体积0.91GB。根据升级日志显示,此次更新主要针对网络、蓝牙、系统三方面进行优化。iphone15基带...
日期:11-12
三星笔记本新款上市「三星推出Galaxy Book 3 Go笔记本:第三代骁龙7c 平台、45W快充」
快科技12月27日消息,三星推出了Galaxy Book 3 Go笔记本,安装了Windows 11 Home操作系统,并支持5G网络连接。据悉,新款笔记本与Galaxy Book 2 Go搭载了相同的处理器,都是第三代骁...
日期:12-28
彭博:传苹果定于9月7日发布iPhone 14,或16日上架_苹果官宣9月15日举行发布会,iPhone 13来了
8月18日消息,据知情人士透露,苹果公司计划在9月7日举行秋季新品发布会,推出最新款旗舰智能手机iPhone 14系列,这款产品销售额占苹果总营收的一半以上。新款iPhone将拉开苹果繁忙...
日期:08-19
ai电商作图「30秒出图,成本直省2万元,这类AI工具成电商领域“显眼包”」
声明:本文来自于微信公众号头号AI玩家(ID:AIGCplayer),作者:阿虎,授权转载发布。一个对摄影、布景、后期、甚至AI都零基础的小白,有没有可能零成本产出一套完整的商品大片?举个例...
日期:08-30