您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 04:09:00  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

盲人可以玩电脑吗

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

华为mate40pro5g版本价格8加256

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

奥迪车钥匙电池型号是什么样的

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
特斯拉上海超级工厂9月交付量超过8.3万辆_特斯拉上海超级工厂年底正式投产
10月9日消息,据央视财经消息,9月特斯拉上海超级工厂交付量超过8.3万辆,再次创下月度交付的新纪录。乘联会数据显示,9月份国内新能源车销售依旧保持强劲态势。9月份,新能源乘用车...
日期:10-12
iphone17年发布会「苹果iOS 17发布:支持名单公布 iPhone X没发升了」
今天凌晨的WWDC 2023中,苹果首先带来了iOS 17的iPhone操作系统,开发者beta版本已经在今天天亮开始推送,而公测版将在下月全量推送,iPhone 15将在9月发布,这也是iOS 17系统首发的...
日期:06-06
苹果电脑笔记本「苹果电脑笔记本怎么样」
作为一个高端品牌,苹果电脑的笔记本一直备受关注。下面是一些关于的相关信息。最大的特点之一是操作系统。苹果电脑使用的是Mac OS操作系统,与Windows系统不同。Mac OS操作系...
日期:06-03
Midjourney V6开启alpha版本公测
声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:月山橘,授权转载发布。Midjourney在discord社区宣布开放V6模型的alpha版本测试。从“/settings”的下拉菜单中选择v...
日期:12-22
苹果se2刘海屏「配6.1英寸刘海屏!iPhone SE 4曝光」
据Macrumors报道,根据显示器供应链顾问(DSCC)分析师Ross Young的说法,第四代iPhone SE将配备6.1英寸LCD显示屏,并在显示屏顶部有一个“刘海”。Ross Young表示,他已经修改了对第四...
日期:10-16
女子上门代厨炒菜 4菜1汤66元被狂赞:帮买菜、洗碗等 还吃啥外卖?
10月25日,湖南。女子晒出代厨代炒菜的视频,引网友热议。她上门代炒菜、代做饭,一共做了一桌子菜,网友好奇如何收费。不少网友表示此项新兴服务很赞,章女士曝光收费标准:四菜一汤66...
日期:10-27
中图网“被困”上热搜  预计400多万册图书泡水报废:25年来遭遇的最具毁灭性打击
快科技8月3日消息,2日晚中图网通过官微发声,称这是中图网25年来遭遇的最具毁灭性的损失和打击”。Uber送餐中图网称,图书库房一层昨晚就已泡水,早上撤离时,库区水位已将近3米,恐怕...
日期:08-03
《5G应用创新发展白皮书》发布:5G行业虚拟专网已成为行业共识_5g行业应用解决方案
2023年是全面贯彻党的二十大精神的开局之年,为深入贯彻落实党中央、国务院决策部署,发挥5G在新基建的引领作用,促进消费场景与模式创新,推动实体经济和数字经济深度融合,助力新型...
日期:01-03
亚马逊用比 GPT-4 多两倍的参数训练 Olympus 人工智能模型_亚马逊的人工智能alexa
11 月 9 日消息:在大型语言模型(LLMs)领域,科技巨头之间的竞争愈发激烈,这些模型是像 OpenAI 的 ChatGPT 这样的工具的 AI 技术基础。根据路透社内部消息人士的消息,亚马逊正计划...
日期:11-09
高校禁快递入校 包裹堆积成山 校方回应:部分快递收费不合理
近日,成都一所高校拒绝快递进入校园,已经形成了堆积如山的局面,引起了人们的广泛关注。而校方回应称这些报道并不实,校方原本与多家快递公司都达成了快递进校的协议,但在2023年7...
日期:08-30
法院判决首例涉“虚拟数字人”侵权案 一公司被判赔12万_数字虚拟人有实体吗
4月26日 消息:近日,杭州互联网法院就首例涉“虚拟数字人”侵权案作出一审判决,认定被告杭州某网络公司构成著作权侵权及不正当竞争,判决其承担消除影响并赔偿损失(含维权费用)12...
日期:04-26
叠衣服的机器人「马斯克展示机器人“擎天柱”叠衣服 AI聊天机器人软件有哪些?」
近日,埃隆·马斯克展示的机器人“擎天柱”叠衣服的视频引发了广泛关注。这一创新不仅展示了机器人技术的进步,也为未来家庭和工业应用提供了新的想象空间。机器人叠衣服的功能...
日期:01-17
腾讯向股东派发9.58亿股美团股票,腾讯总裁刘炽平卸任美团董事_美团股东 腾讯
2022年11月16日消息,腾讯控股公告显示,将按合资格股东持有每10股股份获发1股美团B类普通股的基准,向于记录日期名列本公司股东名册上股东按彼等当时各自于本公司之持股比例,以实...
日期:11-18
又有近4000人加入,美国汽车业大罢工持续升级,参与人数逼近3万人!
UAW(全美汽车工人联合会)上周才首次不扩大罢工,但到了本周,又有一家车企工人加入了罢工行列。周一,沃尔沃集团旗下麦克卡车公司(Mack Truck)约4000名UAW成员工人拒绝了工会和公司在...
日期:10-10
输入关键词 AI 帮你画 美图秀秀-iOS 端新版本发布
今天,美图秀秀 iOS 端推出了 9.8.60 版本,新增多种 AI 玩法以及美图配方等功能,能够更细致地美化你的照片。2020年第四届全国大学生环保知识竞赛官网据更新日志介绍,在全新的 AI...
日期:10-02
微软Adobe等去年因盗版在欧损失135亿(盗版adobe和正版adobe区别)
  10月18日上午消息,由于去年因为盗版软件在欧洲损失了135亿美元版权费,因此微软和Adobe等软件公司正在努力推动欧盟立法者加大盗版软件的打击力度。   增加赔偿   美...
日期:07-24
智能网联汽车 有序融入百姓生活「智能网联技术在汽车上的应用」
  转自:经济参考报  2022世界智能网联汽车大会近日落下帷幕,智能网联汽车产业化发展成为各方关注的焦点。目前,自动驾驶出租车、无人巴士、自主代客泊车、干线物流,以及无人...
日期:10-02
苹果称 95% 的 iCloud 用户开启了双重认证_苹果icloud双重认证怎么开启
IT之家 8 月 28 日消息,随着今年秋季推出的下一轮软件更新,苹果 iOS 16 和 macOS Ventura 等将集成对 passkey 标准的支持。该标准被描述为独特的数字密钥,旨在通过简化的跨设...
日期:09-07
马斯克的"读脑"设备首次植入人体,科学家期待什么?担忧什么?
2月4日消息,埃隆·马斯克(Elon Musk)创建的Neuralink旨在改变我们对脑机接口的认知,让科幻变成了现实。1月29日发布的消息中,马斯克宣布Neuralink已成功将其“读脑”设备首次植入...
日期:02-07
智能手环市场规模「Canalys:第二季度全球智能手环出货量达到4170万台 同比增长2%」
10月8日消息:据Canalys的最新估计,2022年第二季度全球智能手环出货量将增长2%,达到4170万台,继第一季度下降3.7%后恢复增长。其中,基础手表和智能手表分别增长了46.6%和9.3%。印...
日期:10-09