您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-04 20:17:15  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

amd苏姿丰发布会

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

国家邮政局:双11当天6.75亿件快件

IQOO6手机

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

2025年Windows11

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
魅族 20 今日再开售,12GB 256GB 仅 2899 元_魅族20t
魅族 20 在 618 期间优惠 200 元,12GB 256GB 发售价 3399 元,现在只要 3199 元。京东 PLUS 会员可以叠加满 3000 减 300 元优惠券,2899 元可以到手。此外,618 期间购机仍然可以...
日期:06-01
第二代骁龙7 太强了 小米1TB新机2599元 2年不卡「小米骁龙712的手机有哪些」
Redmi Note 12 Turbo已经正式发布,这款手机搭载全球首款高通第二代骁龙7 处理器,成为了史上最强的骁龙7系列移动平台。Redmi和高通联合定义了这款芯片。据业内人士透露,第二代...
日期:03-30
联想e530「联想E530」
联想E530是联想公司于2012年发布的一款商务笔记本电脑。该电脑采用15.6英寸高清液晶屏幕,搭载英特尔Core i5处理器,内存容量最高可达8GB,硬盘容量最高可达1TB。此外,该电脑还具...
日期:05-30
无锡一公司招聘要求60岁男性优先:网友质问为何歧视女性?「无锡50岁女工最新招聘信息」
如今很多公司招聘岗位都限制年龄不能超过35岁,但是你见过优先招聘60岁以上男性的吗?7月18日,据网友曝料,在江苏无锡有一家公司,招聘要求60岁左右男性优先,还发布了招聘简章。这家...
日期:07-18
苹果股价第一季度上涨22% COO套现3000万美元「苹果股价是多少」
3月28日消息,苹果最新提交给美国证券交易委员会的监管备案文件显示,该公司首席运营官杰夫·威廉姆斯(Jeff Williams)上周出售了价值3000万美元的苹果股票。在今年第一季度,苹果股...
日期:03-28
百度网盘共享文件夹全面解决在线办公文件传输问题_网页版百度网盘共享文件夹
  随着国内疫情得到有效控制,许多企业纷纷迎来复工复产。然而,办公族们远程办公形成的一些好的办公习惯,依然保留了下来。比如,许多人会将需要共享的资料上传至百度网盘的共...
日期:03-26
元宇宙4.0「玩法再升级,“元宇宙@双千兆”燃爆ChinaJoy」
玩法再升级,“元宇宙@双千兆”燃爆ChinaJoy 通信产业网|2023-07-28 16:31:01作者:通文来源:通信产业网【通信产业网讯】7月28日,备受期待的中国国际数码互动娱乐产品及技术应用...
日期:07-29
海尔电视怎么变彩色「海尔电视:一张色卡纸,画质无色差」
流媒体发展突飞猛进,让用户对电视画质的要求越来越高。然而,电视画面与真实色彩差别太大,不光观感虚假难以入戏,就连打游戏、看比赛等体验也大打折扣,引发用户吐槽。如何才能还原...
日期:04-13
消息称谷歌出40亿美元最高价竞购Hulu(谷歌2500亿收购)
  9月27日晚间消息,知情人士透露,在竞购视频网站Hulu的潜在买家中,谷歌和卫星电视服务商Dish Network的报价最高,让亚马逊和雅虎望尘莫及。   该知情人士称,Dish Network的...
日期:07-23
微短剧《完蛋!我被帅哥包围了!》备案:共60集
快科技12月5日消息,近日,国家广播电视总局公布了2023年11月全国重点网络微短剧规划备案情况。信息显示,11月共备案网络微短剧共305部、11245集。其中,中广天择传媒股份有限公司...
日期:12-06
飞猪:“五一”假期首日出行的国内游商品成交额创下历史峰值「飞猪旅行市场规模」
4月29日消息,飞猪数据显示,“五一”假期首日出行的国内游商品成交额创下“五一”历史峰值,国内机票、住宿、火车票、用车等成交额均已大幅超越2019年同期。其中酒店、民宿预订...
日期:04-29
英特尔高层「收购交易失败后,英特尔与高塔半导体达成代工协议」
IT之家 9 月 5 日消息,英特尔在两周前因为中国监管机构的反对而取消了 54 亿美元(IT之家备注:当前约 392.58 亿元人民币)收购高塔半导体(Tower Semiconductor) 的计划,但这并没有阻...
日期:09-06
华为手机贴膜可以免费换吗「华为7月服务日开启:手机免费贴膜 99元换原装电池」
7月8日 消息:华为推出了7月服务日活动,为消费者提供了六大专属权益。这一活动将在每个月的第一个周五、周六和周日连续三天进行。活动入口位于华为商城APP的“我的服务日”页...
日期:07-08
小米澎湃OS开发版全量推送:包括20款机型_小米搭载澎湃s1的是哪款手机
快科技12月15日消息,小米澎湃OS开发版第二批机型今天已全量推送,今日将有20款机型收到小米澎湃OS的开发版更新。根据小米澎湃OS发版节奏公告,开发版共有两批机型。苹果耳机airp...
日期:12-16
版权纠纷影响凸显:视觉中国股价下跌 市值蒸发超3亿_视觉中国股价怎么跌不到几块去?
凤凰网科技讯 8月16日消息,8月15日,摄影师吐槽“自己拍的照片被视觉中国告侵权”事件引发热议,受此影响,截至发稿视觉中国股价下跌3.3%,当前市值117亿,市值蒸发超3亿元。miui12.5...
日期:08-16
联想笔记本频繁遭投诉 电池寿命不足两年(联想笔记本频繁遭投诉 电池寿命不足两年了)
  从去年开始,联想笔记本电脑就一直频繁遭遇到关于电池问题的投诉,根据315消费电子投诉网的投诉显示,其中80%以上的投诉,都是对联想笔记本电脑电池问题的质疑。在消费者潘女...
日期:07-26
汇智汇众,共谋智库新篇章——中国联通智库发展研讨会成功召开
通信世界网消息(CWW)由中国联通研究院主办的中国联通智库发展研讨会顺利在京召开。会议以“做好新时代新型智库建设”为主线,组织交流国资央企在加快建设世界一流企业过程中构...
日期:06-13
iPhone15或大变样!Pro版取消实体按键改按压
中关村在线消息:10月28日,据相关爆料,即将在明年发布的iPhone15系列可以说是全面升级,不仅将会取消Lighting接口,换成全新的USB Type-C接口,新机还将采用全新的A17处理器,性能和功...
日期:10-28
OpenAI逐步恢复 ChatGPT Plus 会员注册 已向部分用户发出邀请_openicq
12月13日 消息:OpenAI 已经开始逐渐恢复 ChatGPT Plus 注册,已有部分用户收到邀请。OpenAI在邀请函中表示“感谢您注册ChatGPT Plus候补名单。我们开始开放等待名单,并邀请您...
日期:12-13
柏卡姿祛斑霜怎么样「柏卡姿毛孔清洁控油泥膜,净颜养肤,赋予肌肤清爽新体验」
在现代都市生活中,面对污染、压力等多重挑战,肌肤的清洁与调节水油成为日常护肤的重中之重。柏卡姿毛孔清洁控油泥膜,作为一款面霜级清洁产品,以其独特的配方和不错的效果,成为众...
日期:01-25