您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-04 13:49:58  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

影驰rtx4060 8g大将显卡

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
华为预计2022年全员分红每股1.61元:网友点赞任正非 钱全分了_华为今年分红
对于华为来说,虽然外部不断打压,但是他们依然斗志满满,当然这背后还是福利的支撑。据科创板日报,华为内部公布了最新的分红数据 ,2022年度工会虚拟受限股分红预计为人民币1.61 元...
日期:01-15
Arm申请在纳斯达克上市,上年营收26.8亿美元净利5.2亿「arm公司上市」
8月22日消息,周一,日本软银集团旗下英国芯片设计子公司Arm申请在美国纳斯达克证券交易所挂牌,准备在科技公司IPO历史低迷时期上市。该公司希望以“ARM”为股票代码进行交易。Ar...
日期:08-22
盒马调整免运费配送服务门槛:未达门槛收 6 元服务费(盒马配送收费标准)
  2 月 20 日下午消息,新浪科技获悉,盒马将在未来一周内,开始在不同城市调整免费配送服务门槛,单笔订单满一定金额方可享受免费配送服务,未达免费配送门槛将收取 6 元服务费。...
日期:07-16
usb-c接口可以给iphone充电_欧盟提议将 USB-C 作为通用充电口,苹果称会给 iPhone 用户带来不便
  9 月 25 日消息,本周欧盟委员会 (European Commission) 宣布了一项新政策,以减少电子垃圾为由要求所有智能手机都采用 USB-C 充电接口,这撼动了苹果 iPhone 智能手机生态...
日期:09-19
虚拟城镇AI Town开源 适用于可扩展的多人游戏
8月16日 消息:AI Town 是一个虚拟城镇,AI 角色在其中生活、聊天和社交。它是一个开源的、可部署的起始套件,用于构建和定制自己的 AI Town 版本。该项目提供了一个强大的基础...
日期:08-16
小米mix fold库存30万「用户体验再拉满,小米为MIX Fold 3新机用户推出多重权益礼包」
(原标题:用户体验再拉满,小米为MIX Fold 3新机用户推出多重权益礼包) 折叠屏市场再现强劲产品。8月14日,小米正式发布第三代折叠...
日期:08-15
技嘉推出外置液冷RTX 4090显卡盒,可让笔记本秒变游戏利器
IT之家 5 月 31 日消息,近日,技嘉发布了一款全新的外置显卡盒 ——Aorus RTX 4090 Gaming Box,该产品内置了一块液冷的 RTX 4090 显卡,可以通过雷电 3/4 接口与笔记本电脑连接,为...
日期:05-31
公益助渔,《一梦江湖》X象山旅游集团打造“元宇宙钓真鱼”玩法
9 月 2 日,网易游戏旗下的国民级武侠题材MMORPG游戏《一梦江湖》正式开启与象山旅游集团的活色生“象”联动活动,本次联动活动期间,玩家们可以在游戏中参与海钓玩法,领略海岛的...
日期:09-02
考研在即 大四男生割皮救母 网友感动:祝愿妈妈早日康复
11月3日消息,据报道,正在备考硕士研究生的大四男生小桑用自己的头皮、大腿上的皮救自己的母亲。 他的母亲做饭时被液化气烧伤,烧伤面积达89%,多为深二度、三度烧伤,伴有吸入性...
日期:11-04
自带线充电宝363元 安克推自带线充电宝 Nano「安克充电宝a1271」
近日,安克推出了一款名为Nano的自带线充电宝,目前已经在安克海外官网上市,售价为49.99美元,折合人民币约为363元。 这款充电宝型号为A1259,尺寸约为104×52.3×26mm,重量约为215g...
日期:09-02
IBM 宣布扩大与亚马逊 AWS 合作关系:为客户提供生成式 AI 解决方案和专业知识
10月19日 消息:IBM 今日于官网发布新闻稿宣布,扩大其与亚马逊云服务(AWS)的合作关系,以帮助更多共同客户实施生成人工智能 (AI) 并从中获取价值。最近网上说的二舅是什么意思图...
日期:10-19
自动驾驶车祸事件「世界首例自动驾驶致命车祸司机认罪:判处三年缓刑」
快科技8月1日消息,据报道,世界首起涉及自动驾驶汽车的致命碰撞事故日前进行了最终宣判,Uber自动驾驶汽车的安全员认罪并被判处三年缓刑。据此前报道,2018年3月份,在美国亚利桑那...
日期:08-01
iPhone 15屏幕维修费用公布 无AppleCare+最高自费超3千_iphone屏幕维修保内价格
9月18日 消息:iPhone15系列手机已开始预订,苹果也在官网公布了最新一代iPhone的维修费用。数据显示,如果没有购买AppleCare+保险服务,iPhone15系列手机屏幕维修的自费费用最高...
日期:09-18
保护人士点赞!韩国国会通过禁食狗肉法案:从2027年正式开始实施
快科技1月9日消息,据国外媒体报道称,韩国国会1月9日在全体会议上表决通过了《关于结束以食用为目的饲养、屠宰及流通犬只特别法》法案。法案主要内容为,禁止以食用为目的饲养、...
日期:01-10
淘金TikTok,“交个朋友”有些野心
图片来源@视觉中国文 | 电商在线,作者 | 王亚琪,编辑 | 斯问没有人不眼红Tiktok的流量,但第一批盯上“流量红利”的人,已经开始学会保持“警惕”。这种警惕来自过去一年多时间的...
日期:12-12
百度ai人脸识别入口「AI数字人看百度!IDC权威认证百度两大数字人」
AI数字人看百度!IDC权威认证百度两大数字人 通信产业网|2023-07-26 16:14:31作者:通产来源:通信产业网【通信产业网讯】近两年,大模型、AIGC的兴起不仅革新了内容生产模式与人机...
日期:07-26
中国汽车出口发达国家「日媒称中国今年将超越日本成为全球第一大汽车出口国」
  IT之家 7 月 31 日消息,据日本《东洋经济在线》报道,业内预计中国今年将超越日本成为全球第一大汽车出口国,这一历史性变化也在日本引发关注。陌陌主播跳槽抖音  根据两...
日期:07-31
“百度+春晚”成春节最强CP 将玩转全民AI红包?
  1月17日,中央广播电视总台与百度宣布达成合作,百度将作为央视2019年《春节联欢晚会》独家网络互动平台参与今年的春晚红包互动,至此春晚发红包集齐BAT。百度作为一家AI技...
日期:05-20
1688启动“暖春复苏”计划 支持源头厂商和新创企业抢订单「1688入驻企采商」
2月6日 消息:1688面向产业带启动“暖春复苏”计划。该计划也被称为“双保”,核心举措是“保获客保订单”,连保两个月。从2月6日至3月31日,每个入驻1688的源头厂商和成立不满一...
日期:02-06
苹果双十一销售数据「双十一数据显示 iPhone的销量同比下降了4%」
中国市场的双十一数据显示,iPhone的销量同比下降了4%,而同期华为智能手机的销量增长了66%。火车软座和硬座的区别图片智能机器人chatgpt体验据路透社报道,苹果在今年的双十一卖...
日期:11-25