您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 07:27:40  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

电动车电池充满了不拔,对电有影响吗

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
Rambus指责海力士美光非法共谋 索赔129亿美元
(明轩)北京时间6月21日消息,据国外媒体报道,美国存储芯片制造商Rambus在周一加利福尼亚州开审的反垄断诉讼案中指出,韩国存储芯片制造商海力士和美国存储芯片制造商美光科技曾使...
日期:07-30
2021央视网络春晚惊鸿舞_小年夜一舞惊鸿,2021网络春晚跨次元联动演绎最美舞蹈
  2月4日,中央广播电视总台2021网络春晚如期而至。本届网晚以“新年开新局,就这么开新”为主题,在节目上大胆创新,其中就包括中国顶级舞者融合二次元虚拟人物公孙离演绎的创...
日期:07-16
多地用户反映小灵通信号差 客服称年底退市_多地用户反映小灵通信号差 客服称年底退市是真的吗
中广网北京5月13日消息(记者陆敏)据中国之声《新闻晚高峰》报道,半个月前,唐山、青岛等地多名听众拨打中央台新闻热线400 800 0088,反映当地小灵通信号变差,服务大打折扣,剩余费...
日期:07-27
女子拿驾照后首次开车致引擎盖冒烟 开出蒸汽车感觉:本人回应误操作 不会有阴影
快科技1月9日消息,据国内媒体报道称,江苏宿迁的李女士拿到驾照后第一次开车,因操作不当导致引擎盖冒烟,李女士称车被开出蒸汽车的感觉。随着这个消息的走红,也让李女士不得不出面...
日期:01-09
抖音新潮好物夜中的一匹黑马——高端音响耳机Cleer_抖音同款音响
  近日,抖音电商携手湖南卫视打造的电商晚会——抖音新潮好物夜晚会,圆满落下帷幕。自9号晚会官宣以来,官方已陆续发布了视觉海报、概念片、等等物料,围绕“潮”、“惊喜”等...
日期:05-10
Outfit Anyone官网体验入口 AI虚拟试穿软件app免费下载地址_ar虚拟试衣
Outfit Anyone是一款超高质量的虚拟试穿产品,使用户能够在不真实试穿的情况下尝试不同的时尚款式。这款工具通过采用两个流的条件扩散模型,能够灵活处理衣物变形,生成更逼真的...
日期:01-17
中国移动智能产品「中国移动完成“智冷”节能升级 助力数据中心绿色低碳」
通信世界网消息(CWW)近日,中国移动研究院联合中国移动安徽公司,在中国移动长三角(淮南)数据中心试点完成“智冷”节能升级,显著提高了空调系统能效水平。中国移动目前在用大型、超...
日期:01-31
创新摇篮海宁,孕育出纺织龙头华尔科技_海宁华尔袜业
作为中国纺织业的摇篮之一,浙江海宁一直以其卓越的纺织产业而著称。近年来,海宁正在迅速崛起,不仅仅因为其浓厚的历史文化底蕴,更因为在这片土地上崛起的企业,如纺织巨头华尔科技...
日期:12-22
荣耀的超高频PWM调光护眼?超四成网友认为没用「荣耀30pro pwm调光频率」
凤凰网科技讯 6月14日消息,日前,荣耀与华为两家公司高管因为手机屏幕调光一事公开互怼,引发网友热议。凤凰网科技针对此次荣耀华为高管互怼做了调查,截至6月14日9时,已有2870人参...
日期:06-14
Lisa及其后援会微博账号被封 或与此前疯马秀有关_lisa官微
Lisa的个人微博账号和另一个相关账号因被投诉违反法律法规和《微博社区公约》的相关规定,现已无法查看。这一情况或与Lisa在9月29日上演首场疯马秀表演有关,当时引起了广泛热...
日期:11-02
苹果系统ios7
苹果系统iOS7是苹果公司于2013年9月推出的一款移动操作系统。相较于之前的版本,iOS7在外观设计及功能上做出了很大的改进和创新。该系统的设计理念是简洁和纯粹,为用户带来更...
日期:06-04
消息称将瞄准电动汽车业务,富士康于郑州注册成立新事业集团_富士康郑州总部
6 月 26 日消息,据 CNA 通讯社报道,鸿海集团于近日成立了富士康新事业发展集团,业务涵盖电动车整车销售和换电设施销售、AI 软件研发等。韩国恶性通货膨胀报道称,富士康新事业发...
日期:09-22
当抖音进军世界杯,TikTok挖了NBA墙角
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:毕安娣,授权转载发布。错失双奥之后,抖音终于迎来一场“S级”大型体育赛事,成为本届世界杯获得中央广播电视总台授权的6...
日期:11-20
白宫或迫使 AWS、微软、谷歌云等:披露 AI 客户信息
据了解即将“颁布的 AI 行政令”的知情人士透露,白宫正考虑要求云计算公司向美国政府报告其客户的一些信息。微软 contractor这项条文将由美国商务部制定规则,从而迫使微软、...
日期:10-07
三星笔记本电脑_三星笔记本电脑怎么样
三星是一家韩国知名的跨国电子公司,有着悠久的历史和广泛的产品线,在电视、手机、数码相机等领域都有着一定的市场占有率。而在笔记本电脑领域,三星也推出了多款不同规格的产品...
日期:05-30
福布斯2023全球区块链50强:蚂蚁、百度、腾讯等上榜_区块链排名100
2月8日讯:今日,福布斯发布2023全球区块链50强,蚂蚁、百度、腾讯等中国企业上榜。诺基亚9发布时间曝光...
日期:02-11
ai前端开发「AI 入侵前端,哪类工程师最危险?」
声明:本文来自于微信公众号 CSDN(ID:CSDNnews),整理 | 何苗,授权转载发布。当 GPT-4向大家展示了如何用十秒把一个网站的手绘草图变成功能齐全的网站,包括一些炫酷的js链接按钮,技...
日期:04-30
Z1 Extreme APU加持 ROG掌机国行发布 「AMD定制锐龙」
6月13日晚20:00,ROG 2023夏季新品发布会上,国行ROG掌机正式发布及开售。作为全新的游戏掌机标杆产品,ROG掌机不仅硬件优秀,软件也进行了大量优化。搭载AMD定制锐龙 Z1 Extreme高...
日期:09-12
Meta版ChatGPT来了:Llama 2加持,接入必应搜索,小扎现场演示
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心编辑部,授权转载发布。杀死OpenAI,小扎这波稳定了吗?今天凌晨,一年一度的 Meta Connect 大会上发布了一系...
日期:09-29
淘特上线两款智能新品“微店铺”和“心动搜索”__淘特品牌折扣店
11月16日消息,淘特宣布上线两款智能产品:淘特“微店铺”和“心动搜索”。a10 7100据介绍,淘特“微店铺”和“心动搜索”基于淘特搜索逻辑研发出的体验新功能,通过商业创新和交互...
日期:11-25