您的位置:首页 > 互联网

图领域通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 22:01:46  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

抖音一个月涨粉十万

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

支付宝小荷包

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

华为mate50rs保时捷版5g

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
地球或变成无法居住的“地狱”!科学家最新模拟_地球监狱说百度百科
据最新一期《天文学与天体物理学》杂志刊发的论文,科学家模拟了“失控的温室效应”,即地球温度急剧上升,可能在短短数百年内将地球变成一个无法居住的“地狱”,就像我们的邻居金...
日期:01-02
15官方公布维修价格 iPhone 15换玻璃背板1298元 iPhone_苹果15寸换屏幕
来源:中关村在线随着iPhone 15系列的正式开售,苹果官方也公布了iPhone 15的维修价格。其中,iPhone 15/Pro更换玻璃背板的价格为1298元,iPhone 15 Plus/Pro Max更换玻璃背板的价...
日期:09-18
女子20岁称作「女子自称20天内“老了30多岁” 一瞬间变老让她难以接受」
近日,一位来自山东的 42 岁女子通过视频分享了她在短短 20 天内经历的“断崖式衰老”过程,让人们纷纷关注。视频中,女子的脸部皱纹明显增多,眼神憔悴,与 20 天前形成鲜明对比。女...
日期:12-04
被AI冲击的游戏公司,会上演“集体失业”吗?「游戏公司illusion」
声明:本文来自于微信公众号 DoNews(ID:ilovedonews),作者:李信马,授权转载发布。一年前,笔者曾采访过一位游戏领域的资深从业者,他讲过一个有趣的观点:如果要创业做游戏项目,先去找...
日期:06-09
去哪儿网推出用户注册赢取Jeep 指南者1年使用权活动
  “城市全路况典范”、Jeep 家族的生力军——Jeep 指南者,近日携手全球最大的中文在线旅行网站——去哪儿网(Qunar.com),推出“注册去哪儿网用户,赢取Jeep 指南者1年使用权”...
日期:07-26
印度夫妇为买一部iPhone:狠心卖掉8个月孩子 还想卖第二个_印度产的苹果卖给谁
iPhone 4 2010年发布的时候,全球掀起了换机潮,时年仅仅17岁的小王为此卖掉了自己的肾,身体被严重摧残,失去了正常生活。据印度媒体报道,印度西孟加拉邦警方透露,当地一对夫妇为买...
日期:07-31
李一男造车迷局:公司成立4年,新车交付的临门一脚,黄了!_李一男 造车公司
作者丨普子胥出品丨网易科技《态℃》栏目组“我起起伏伏的人生,如同过山车一样。”2015年6月1日,风光无限的李一男曾在小牛电动首款车型N1发布会现场上感慨万千。这一天,是他45...
日期:12-12
和解后 微念退出李子柒公司股东_李子柒和微念怎么了
凤凰网科技讯 2月1日消息,据天眼查App显示,近日,四川子柒文化传播有限公司发生工商变更,杭州微念品牌管理有限公司退出股东行列,新增股东蒲倩云,持股比例1%。目前,该公司由李佳佳(李...
日期:02-01
医生建议成人每天睡够7小时 11点左右睡觉:张朝阳曾建议大家少睡觉!
数据显示,睡不好,人身体的各项指标都会受到影响。医生建议,小学生要睡够10小时,初中生要睡够9小时,高中生要睡够8个小时,这样才能保证学生在白天能集中精力学习。医生同时建议,最好...
日期:10-11
AI生成马斯克婴儿照被疯传 本人回应 返老还童药吃多了
最近,一张用AI制作的马斯克婴儿照在网上火了一把,引起了网友们的热烈讨论,并且还得到了特斯拉的老板亲自回应。iphone xr屏幕是lcd还是oledX40骁龙888这张照片是由一个叫“Not...
日期:06-06
亚信科技董事长田溯宁:关于5G网络的共识、分歧与体会_亚信科技5G
  2019MWC世界移动通信大会已经结束,但5G作为最热门话题,被人们赋予的期待与讨论仍在持续。   「网络切片」如何实现?「边缘计算」价值何在?万物互联的雄心有赖巨量投资,...
日期:02-02
迪士尼三季度净收入同比增长53%,流媒体用户数量首次超过Netflix(华特迪士尼第四季度营收191亿美元,较去年同期上涨34%)
苹果首席架构师离职 查看最新行情   记者/谢亦欣   美东时间8月10日美股盘后,华特迪士尼公司(以下简称“迪士尼”;股票代码:DIS.US)公布2022财年第三季度...
日期:08-12
花小猪打车在全国超百城发放新年福利 低至5折起_花小猪打车价格便宜吗
为了让广大用户享受到更加实惠、安全、便捷的出行服务,2023年12月22日至2024年1月1日,花小猪“跨年5惠”打车福利活动正式启动,用户可在全国超百城享受花小猪打车的实惠出行服...
日期:12-27
红米note12pro「512G版卖1999 Redmi Note 12T Pro太香了」
小米集团卢伟冰表示:大家对Note 12T Pro太热情了,新机已经上架顶配版12GB 512GB到手价1999元。和同档位其它竞品相比,Redmi Note 12T Pro采用的是LCD材质,但这块屏幕不仅支持144...
日期:05-30
图片的切割「midjourney图片切割教程:用Chatgpt写程序轻松切分」
针对一些AI作图的素材玩家,我们提供了一些提升midjourney图片生成及处理的工具。之前有prompt生成表格工具、夜晚休息时候的relaxed跑图模式,以及这个新的四宫格切图工具,有需...
日期:05-19
软银宣布“日本版GPT”开发成功:将在明年推出产品「如何看待日本软银集团将暂停在中国开展新的投资?」
快科技8月4日消息,早些时候,软银集团CEO孙正义宣布,已经组建了100人左右的团队,准备开发日本版的ChtaGPT”。近日,软银集团电信部门CEO宫川润一宣布,日本版GPT”开发进度顺利,目前...
日期:08-05
50万内品价比最高SUV!零跑C10开启预售:15.18万起_零跑c11汽车报价
快科技1月10日消息,零跑汽车旗下全新中型SUV 零跑C10于今日正式开启预售,增程版预售价为15.18-18.18万元;纯电动版预售价为15.58-18.58万元。官方表示,零跑C10为50万内品价比最...
日期:01-11
小米我的智能设备「你有几件?超千万人拥有5件以上小米智能设备」
今天下午,小米集团正式发布了2022年第三季度业绩报告,其中显示总收入约人民币704.74亿元,环比增长0.4%。净利润约21.17亿元,环比增长1.7%。讯飞语音音箱360科技有限公司财报显示...
日期:11-28
“中关村硬科普平台”正式发布_中关村硬创空间科技有限公司
5月29日消息,昨日下午,2023中关村论坛-硬科普促进科技成果转化论坛现场,中关村科服和果壳联合发布“中关村硬科普平台”。据悉,该平台将包含科学家硬科普演讲、硬科普短视频、硬...
日期:05-29
平板电脑办公「平板电脑办公用」
随着数字化时代的发展,越来越多的人开始在日常工作中使用平板电脑。平板电脑的轻便、易携带、高清屏幕等优点,使得它成为了一种非常方便的工作工具。本文将就平板电脑在办公中...
日期:05-29