您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-07 03:15:20  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

amd出新显卡后老版显卡掉价多少

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

苹果13紫色和粉色

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
曝Redmi K70至尊版提前发布:天玑9300性价比神机_红米k30至尊纪念版天玑1000plus
快科技1月22日消息,小米接下来的两款重磅机型将是小米14 Ultra和Redmi K70至尊版,后者将是K70系列的超大杯机型,也是该系列的终极之作。今日,数码博主数码闲聊站”晒出了一款新...
日期:01-22
爆火的“追星神器”:一根赚1分钱,一年卖出5亿根_追星有钱赚吗
声明:本文来自微信公众号“天下网商”(ID:txws_txws),作者:王卓霖,,授权转载发布。“一根荧光棒卖140块,简直是‘天价’。”看到五月天演唱会荧光棒爆卖的消息时,30多岁的徐彬苦笑着...
日期:06-08
一块电池可供3600家用电一小时!特斯拉上海储能超级工厂开始招人
4月16日,快科技获悉,特斯拉官方日前宣布,特斯拉上海储能超级工厂开始招聘,岗位涵盖产品研发、智能制造、供应链、工业互联网研发等领域,工作地点均为上海临港。据了解,该工厂将规...
日期:04-16
mate40升级鸿蒙3.0「华为Mate 40等17款机型重磅升级全新鸿蒙OS 3!更流畅、更安全」
快科技7月5日消息,今日,HarmonyOS官方宣布,鸿蒙OS 3智慧新体验版本迎来更多机型升级。本次升级支持17款机型,包括华为Mate X2、Mate X2 4G、Mate X2典藏版、Mate Xs、Mate 40、M...
日期:07-06
从月球采回的一块岩石,它的年龄已有46亿年了「中国科学家首次在月球上发现新矿物“嫦娥石”」
【环球时报-环球网综合报道】9月9日,中国传统节日中秋佳节前夕,国家航天局、国家原子能机构联合在京发布嫦娥五号最新科学成果。国家原子能机构副主任董保同在发布活动上宣布,...
日期:09-13
消息称红米Note 13下半年推出 取消塑料支架「红米note3全网通拆解」
7月11日 消息:根据最新消息,红米Note13将在下半年推出,并且有两项重大升级。首先,红米Note13将取消塑料支架设计,从而提升整机的质感和视觉效果。这一改进可以让屏幕边框进一步...
日期:07-11
1TB会降到100多吗?SSD雪崩腰斩只是开始 供大于求巨头狂减产减支
作为行业晴雨表的存储芯片行情持续走低,迫使美光、三星、SK海力士等主要存储大厂持续调整业务。存储芯片的出货大头由DRAM(内存)和NAND闪存两大类芯片占据,多用于个人电脑、手机...
日期:10-17
红米gpu渲染「3种颜色!Redmi神机更多渲染图曝光」
据WinFuture报道,小米计划于下个月在欧洲市场推出Redmi 12手机,预估售价为199欧元(约合1516元人民币)。该机共有蓝色、黑色和白色三种颜色可选。华为mate20发布时价格Redmi 12采...
日期:06-04
飞猪:过去三年租车订单量年复合增长率超80% 2023年继续减免商家年费_
3月10日消息,飞猪表示,过去三年平台上的租车订单量年复合增长率超过80%,其中2022年同比2019年增长超5倍。疫情放开以来,租车需求继续保持高位增长,飞猪数据显示,2023年前两个月平...
日期:03-10
俞敏洪说想给董宇辉在北京买套房子 董宇辉调侃:看他能不能凑到钱吧
2月21日 消息:自从去年因“双语直播”火了之后,董宇辉就成了东方甄选的王牌主播。他的一举一动甚至已经能够影响公司的股票。为了留住这个人才,俞敏洪也是尽量在各方面条件上...
日期:03-01
清华、北邮等联合发布首个大模型时代下的文本水印综述
1月26日 消息:在大模型时代,清华、港中文、港科广、UIC、北邮联合发布了一篇文本水印综述,全面探讨了大模型与文本水印技术的交融。该综述首先回顾了文本水印的起源,随后聚焦于...
日期:01-26
硅基智能发布炎帝大模型
5月29日 消息:5月28日,硅基智能正式发布了大模型产品-炎帝,支持视频生成、直播生成、电影/电视剧生成、数字永生等多种能力。三星s8电池鼓包还可以用吗据悉,炎帝大模型的“数字...
日期:05-29
iFixit 拆解显示苹果 AirPods Pro 2 与上代一样几乎无法修复_airpods2拆机评测
9月29日消息:拆解维修网站iFixit今天分享了一段苹果第二代AirPods Pro的拆解视频,提供了对新耳塞和充电盒内部的近距离观察。拆解结果证实,AirPods Pro在很大程度上仍然无法维...
日期:09-29
2022年11月成功出海中国手游:《原神》获收入榜冠军_原神手游收入排行
12月15日 消息:今日,Sensor Tower商店情报平台发布了2022年11月中国手游产品在海外市场收入及下载量排行榜。在11月出海手游收入榜中,《原神》本期海外收入环比增长21%,蝉联11...
日期:12-15
广西烧烤竹签长1米8 主要是招待客人酒席时做的_烧烤竹签一般多长多粗的合适
近日,广西柳州,烧烤竹签就有 1 米 8 长,不仅气势惊人,做法还精细。拍摄者蓝女士介绍,这种烧烤主要是招待客人、办酒席时做的,其制作过程繁琐,需要腌制,还要用新鲜的竹签子串起来。全...
日期:06-06
空姐被甩到天花板 上海飞北京CA1524航班遇严重颠簸:国航回应「北京上海航班动态查询」
日前多位网友爆料上海飞往北京的CA1524航班,在空中遭遇了严重颠簸,空姐甚至都被甩到了天花板上。据当事人@邢立达介绍,这次总共经历了两次颠簸,第一次持续一两秒,不少乘客离座上...
日期:07-11
研发汽车10年,苹果认清现实,自动驾驶降级,推迟发布
1月24日消息,据彭博社记者Mark Gurman透露,苹果的自动驾驶电动汽车计划正在发生重大变化。原本计划推出一款具有L4级自动驾驶功能的电动汽车,现在却转向了更为实际的L2+级自动...
日期:01-26
iPhone14口碑下滑 缺少灵动岛是主要原因之一_灵动oby
你可能会认为,由于苹果第二财季iPhone的收入创下了该季度的纪录,相比去年,更多的消费者会对这款设备非常满意。但是根据产品评论网站perfectrec的数据,iPhone14系列遭遇了自2012...
日期:05-09
网友吐槽麦当劳牛奶1杯23元 客服:商圈不同 价格不同_麦当劳的牛奶多少钱
11月14日消息,据国内媒体报道,有网友吐槽麦当劳1杯热牛奶23元,对此客服表示,商圈不同价格也会不同。业内人士表示,同一产品出现价格差异很正常,因为供应商、仓储、运输、营销推广...
日期:11-14
华为宣布鸿蒙生态设备已突破 7 亿台,小艺将加强 AI 大模型能力「鸿蒙的小艺建议有什么用」
8月4日 消息:华为在华为 HDC2023开发者大会上透露,鸿蒙生态设备已达7亿台,HarmonyOS 开发者人数超过220万。通过盘古大模型的底层能力加持,鸿蒙 HarmonyOS 带来更进步的 AI,小艺...
日期:08-04