您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 06:12:05  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

华为新品发布会mate50

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
王者荣耀游戏主播张大仙「观众超10万!张大仙抖音首播《王者荣耀》:半小时获赞390万」
快科技1月19日消息,日前,《王者荣耀》宣布将从1月21日起全面开放抖音直播。全面开放前,王者一哥”张大仙在1月18日至1月20日的主题直播期连播三天。18日晚,张大仙正式在抖音首次...
日期:01-19
OpenAI CEO:马斯克教会我投资科技领域 但对移民火星不感兴趣「马斯克要移居火星」
5月25日消息,当地时间周四,人工智能研究公司OpenAI联合创始人兼首席执行官萨姆·奥特曼(Sam Altman)在伦敦大学学院发表演讲,谈到了他与埃隆·马斯克(Elon Musk)的关系。奥特曼非常...
日期:05-25
理想汽车ceo李想简历「李想:理想汽车四季度月交付突破4万大关」
10月9日 消息:近日,理想汽车在官方微博上分享了一段央视记者探访其常州智能制造基地的报道片段。视频中,理想汽车制造负责人李斌表示,该厂的产能升级已经完成。随后,理想汽车CEO...
日期:10-09
快手一亿粉丝的主播_快手直播宣布拿出5亿现金30亿流量激励优质内容创作及主播成长
讯 7月29日下午消息,快手直播公会运营负责人顾北在2022快手光合创作者大会上透露,快手直播在2022年将拿出5亿现金和30亿流量激励优质内容创作及赋能主播成长。   顾北透露,包...
日期:07-31
开网页慢看视频卡 万元高配电脑为何慢如蜗牛?(打开视频网页很慢)
  英特尔i7四核CPU+ATI HD5850顶级显卡,总投资超过万元,号称秒杀《孤岛危机》等硬件杀手的神级电脑,却不知为何打开网页贼慢,看视频巨卡,这种离奇事就发生在我们身边。近日在...
日期:07-27
Android带动三星及HTC市占率成倍增长(三星安卓市场)
  Android平台智能手机增长迅速,生产Android智能手机的厂商全球市占率上季暴增,研究机构IDC的资料显示,三星电子的智能手机市占率飆升近2倍,台湾宏达电的市占率也增加近1倍。...
日期:07-26
工信部:加强通用人工智能、6G、量子科技等未来产业前瞻布局「工信部新一代人工智能产业创新重点任务揭榜单位」
7月25日消息:据工信微报公众号消息,全国工业和信息化主管部门负责同志座谈会 7 月 25 日在京召开。redmi k60会议强调,切实保障重点产业链自主可控,加强统筹调度和督促督导,压实...
日期:07-25
618教育投资新选择:讯飞AI学习产品销量高速增长!
  如火如荼的618年中大促刚刚落下帷幕,各大品牌纷纷亮出“战报”。作为国内人工智能领军企业,科大讯飞618成绩裴然:凭借AI硬件狂飙猛进,销售额同比增长108%。其中,讯飞依托广...
日期:06-24
保时捷手机「保时捷手机app名称」
,是由保时捷设计,并由中国厂商华为代工生产的智能手机产品。该手机于2018年发布,配备高端配置和独特设计,吸引了不少保时捷车迷的关注。外观设计方面,采用了保时捷跑车的设计灵感...
日期:05-30
realme 10真机外观被曝:这摄像头眼熟_realme新机曝光
今天realme真我在公开平台公布了realme 10系列手机的真机外观,该系列将有三款,分别真我10系列标准版,该系列还有真我10 Pro、真我10 Pro+等。真我10标准版采用90Hz OLED挖孔屏,...
日期:11-10
澜舟科技通过生成式人工智能备案 并发布孟子GPT-Code等模型_澜舟科技怎么样
12月28日 消息:12月26日,澜舟科技宣布正式通过国家互联网信息办公室颁布的《生成式人工智能服务管理暂行办法》备案。据悉,澜舟科技此前推出了多个大模型产品,包括孟子 GPT -...
日期:12-28
贝索斯将辞去CEO_雷军称贝索斯曾向其道歉:未照顾好卓越网
8月11日晚间消息,2022年雷军的年度演讲“穿越人生低谷的感悟”如期而至。此次年度演讲除了分享个人感悟之外,雷军还带了包括小米全新折叠屏手机MIX Fold2以及Redmi K50至尊版...
日期:08-20
看齐华为小米!曝苹果iOS 18升级大模型
快科技9月8日消息,据媒体报道,苹果计划在iOS 18中使用语言大模型,让Siri变得更加智能,苹果希望Siri能够理解用户的语音指令并执行复杂的任务操作。当前苹果已经发布了iOS 17,在iO...
日期:09-08
央视报道华为Mate60:突破技术封锁 取得绝对胜利
【手机中国新闻】自从华为Mate60系列开启“先锋计划”以来,央视已经多次报道过该机,并给出高度评价。近日,央视再次报道华为Mate60系列,称它标志着中国在突破美国技术封锁方面已...
日期:09-05
蔚来新款轿车ET7「蔚来在德国、荷兰、丹麦、瑞典开放ET7、EL7和ET5车型订阅服务」
10月8日消息,北京时间10月8日0点,柏林当地时间10月7日18点,蔚来在德国柏林举办了NIOBerlin发布会。大会宣布,蔚来的三款最新车型:ET7、EL7和ET5,将通过订阅模式在德国、荷兰、丹麦...
日期:10-18
中国信通院牵头的区块链性能测试国际标准于ITU-T SG16全会正式冻结_中国通信协会区块链专业委员会
通信世界网消息(CWW)2023年07月10-21日,国际电信联盟第十六研究组(简称ITU-T SG16)在日内瓦(瑞士)召开全体会议。来自中国、日本、韩国、印度、巴西、俄罗斯、以色列、加纳、美国、...
日期:08-15
iphone12十三香什么梗_iPhone 14爆料合集来了:然而十三香可能是真的!
对于数码爱好者来说,每次快到九月的时候,就能隐约感受到一股无形的力量在吸引着我们,因为。。。   果子哥每到这个时候就会发布新一代 iPhone。 姚劲波在58同城的股份   不...
日期:08-19
联想a320手机「联想a310手机」
,是联想集团旗下一款性价比较高的入门级智能手机。它于2017年上半年发布,主打其良好的性能和实用的功能。下面是对的一些相关信息的整理。性能方面,采用乐视联发科X23处理器和4...
日期:05-30
特斯拉异议特舒拉商标成功_特斯拉商标含义
10 月 11 日讯:因广州睿捷汽车用品有限公司申请的“特舒拉”商标已构成使用于同一种或类似商品上的近似商标,特斯拉对“特舒拉”商标提出异议,最终,国家知识产权局决定被异议商...
日期:10-28