您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 03:04:13  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

超融合市场占有率排名

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

短视频侵权问题

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

触动精灵支持ios14

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—

抖音的合作商是哪些


返回网站首页

本文评论
视频号直播屏幕怎么挂图片「视频号直播切片授权功能将于7月正式上线」
6月27日 消息:据报道,2022年三只羊网络的直播切片带货收入达到1.7亿元,有超过11000人获得了三只羊网络的切片授权,316个品牌通过切片带货销售额达到了百万元级别;而在2023年,三...
日期:06-27
浅析物联网行业发展,详解联发科布下的局
智能移动终端设备的发展速度远超大众想象,根据此前的调研显示,2018年全球IT终端设备(个人电脑、平......
日期:09-27
小米最美手机Civi 2正式开售:2399元起_小米civi手机多少钱
全新的小米Civi 2已经在27日下午15点全渠道正式开售,8GB+128GB 2399元,8GB+256GB 2499元,12GB+256GB 2799元。小米Civi 2,主打“仿生双眸氛围人像”,前置升级为3200万专业主摄+ 3...
日期:10-04
字节跳动入局游戏「字节跳入混战」
出品|虎嗅商业消费组作者|黄青春题图|视觉中国抖音之于电商格局的重塑,双 11 无疑是一个特殊切片。作为各大电商平台秀肌肉的重要节点,双 11 关系重大。知情人士透露,今年双 11 抖...
日期:11-04
苹果CEO库克年薪「今年将大幅减薪!苹果CEO库克在去年收入近6.7亿元」
根据苹果今天发布的委托书,苹果首席执行官蒂姆·库克 (Tim Cook) 2022 年的总薪酬为9940万美元(66711万人民币)。他的薪酬包括300万美元的薪水,大约8300万美元的股票奖励,以及1340...
日期:01-13
魅族20跑分曝光:12GB+512G 跑出125万分
今天安兔兔公布了魅族的一款新机跑分,知情人士称已经基本确定这就是魅族20系列手机,很可能是魅族20 Pro,新机搭载高通骁龙8 Gen 2移动平台,内置了12GB内存以及512GB存储,识别到的...
日期:02-25
蔚来在德国、荷兰、丹麦、瑞典开放ET7、EL7和ET5车型订阅服务「et7蔚来1000公里」
10月8日消息,北京时间10月8日0点,柏林当地时间10月7日18点,蔚来在德国柏林举办了NIOBerlin发布会。大会宣布,蔚来的三款最新车型:ET7、EL7和ET5,将通过订阅模式在德国、荷兰、丹麦...
日期:10-14
amd epyc处理器「AMD将在11月11日发布新一代EPYC处理器」
10月29日消息,AMD宣布将在现场直播活动“同超越,共成就_数据中心(together we advance_data centers)”上发布下一代AMD EPYC(霄龙)数据中心处理器。届时,AMD高管将与其他主要生态...
日期:10-31
正式定档4月26日!米哈游大作《崩坏:星穹铁道》公测官宣「崩坏:星穹铁道预约」
今天,《原神》开发商米哈游旗下新作《崩坏:星穹铁道》宣布三测正式结束,并进行了游戏的前瞻节目。智能手表展会在前瞻节目中,《崩坏:星穹铁道》官方宣布,游戏将在4月23日于PC、安...
日期:03-25
携程上线火车卧铺女性拼团 每人收费10元「携程卧铺怎么选座位」
7月25日 消息:近日,携程推出了一项新服务,在用户预定部分卧铺火车票时,增加了“全网拼团女性房间”功能,并收取10元/人的费用。该服务承诺在拼团成功出票时,同房间的乘客均为女性...
日期:07-25
蕉下在推的“轻量化户外”,资本会买账吗?
声明:本文来自于微信公众号 鞭牛士(ID:bianews8),作者:林小白,授权转载发布。随着天气温度逐渐上升,以防晒伞出名的蕉下已按耐不住内心的躁动,开始频繁活跃在大众视线里。只不过在...
日期:04-25
首次全大核CPU!天玑9300安兔兔跑分超205万分:刷新安卓天花板
快科技10月23日消息,今天安兔兔曝光了一款神秘新品跑分,其核心搭载了天玑9300,综合成绩突破了目前的安卓性能天花板,破天荒地达到了205万分。这是安兔兔V10版本有史以来第一次有...
日期:10-23
助力长沙打造“中国软件名城” 湖南云天励飞首批签约
云天励飞副总裁王磊(右六)上台签署合作协议   5月8日,长沙市软件和信息技术服务业促进会正式成立,将推动当地软件业发展,助力长沙打造“中国软件名城”。湖南云天励飞信息...
日期:04-07
中国电信研究院业界首发翼矩Wi-Fi 7终端测试系统,加速Wi-Fi 7终端成熟商用
通信世界网消息(CWW)Wi-Fi 7作为下一代无线局域网标准,相比Wi-Fi 6实现了更高数据传输速率、更低时延、更大用户容量和更稳定的连接。2023年初,TP-Link、小米、新华三等路由器厂...
日期:10-15
加拿大专利无效_加拿大专利授权公司Mosaid控思科专利侵权
新浪科技讯 北京时间5月20日凌晨消息,加拿大技术专利授权公司Mosaid Technologies(以下简称“Mosaid”)称,该公司已经向美国国际贸易委员会(ITC)提出了一项针对思科的专利侵...
日期:07-28
网银成钓鱼木马诈骗重灾区 风险多来自客户端(钓鱼木马常见的诈骗形式)
湖北日报讯 (记者谭亲璐、通讯员陈蓉)网银安全已成社会关注热点。13日,在“2011放心安全用网银联合宣传年”武汉站活动上,中国金融认证中心(CFCA)以及人行、工行、浦发行等银行...
日期:07-28
多款重磅新品及解决方案发布 中兴通讯看好云电脑发展前景_中兴通讯云计算发展前景
【网易科技4月13日消息】4月12日,2023年度中兴通讯云网生态峰会在深圳成功举办。峰会围绕如何加速行业数字化转型,拥抱数字化变革、探索数字经济发展新动能等议题展开深入探讨...
日期:04-13
美媒:Pro级产品将成苹果秋季发布会最耀眼明星_macbookpro新品发布会
9月5日消息,苹果即将于美国当地时间9月7日举办2022年秋季新品发布会,预计其将发布旗舰级智能手机、智能手表以及耳机等新品。不过,苹果资深分析师马克·古尔曼(Mark Gurman)认为,...
日期:10-30
LG 电子宣布将与汽车零部件公司麦格纳合作开发自动驾驶技术「麦格纳汽车技术上海有限公司」
1月5日消息:LG电子日前宣布,将与加拿大汽车零部件公司麦格纳合作开发自动驾驶技术,旨在向全球汽车制造商提供产品。苹果13隔空投送失败亚马逊物流工资LG电子一直在投资汽车零...
日期:01-05
2024年首次更新!微信iOS 8.0.46发布:手机空间清理更方便、看广告免费听VIP音乐
快科技1月16日消息,从微信官网获悉,日前,微信iOS版发布8.0.46正式版更新,这是iOS版2024年的首次更新。魅蓝2跑分泄露 28000分远超红米2销量更新日志还是熟悉的那几个字:修复了一...
日期:01-16