您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 09:07:55  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

红米k20支持65w快充吗

iqoo优惠券还有吗

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

iphone12型号销量

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

苹果一夜之间市值蒸发4000亿

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
永辉:将在全国范围门店中全面增设“正品折扣店”_永辉购物
10月10日消息,继8月发布首批调优门店进展后,永辉近日表示,将在全国范围的门店中增设“正品折扣店”,并同步在线上APP/小程序增设折扣专区,提供食品、用品惊喜折扣价。据介绍,在折...
日期:10-10
长城汽车:23款黑弹上市,售价25.88万元_长城黑弹2021款
8月25日消息,长城炮全性能家族亮相成都车展。其中,长城炮新品2023款黑弹,官方指导价25.88万元,用户可通过长城炮APP订购。现场,山海炮乘用版、2023款越野炮珠峰版-50万台纪念版,以...
日期:08-25
iPhone13即将发布,苹果却突然推出新品「苹果毫无诚意,iPhone14再度传来“坏消息”,果粉:不如iPhone13」
作为高端旗舰机手机领域的巨头之一,苹果每次召开发布会都会吸引很多果粉的关注,不管是旗舰手机还是其他产品,都得到了不错的口碑和销量。即使在近两年苹果针对iPhone并没有什么...
日期:09-04
观点_观点的英文单词
【网易科技11月9日报道】目前,人工智能技术尚未达到向手机一样的刚性、高频需求,各国和企业都在加大研发和应用力度,探索不同的技术路线和商业模式。亚马逊小家电马斯克一夜激...
日期:11-09
罕见:苹果状告Corellium侵权案输了,“虚拟iPhone”不侵权
  原标题:罕见!苹果状告 Corellium 侵权案输了,“虚拟iPhone”不侵权,以后安卓也能用上 iOS 系统?!   是谁触动了苹果的神经?   被苹果发起诉讼的这家公司名叫 Corellium...
日期:07-16
亚马逊将在土耳其投资1亿美元,启动当地物流中心、招聘超1000名员工
  @土耳其驻华大使馆 消息,亚马逊计划于2022年秋季在土耳其伊斯坦布尔启动其第一个物流中心。亚马逊打算在第一阶段投资1亿美元在土耳其国内建立办公场所,并在工程、人力资...
日期:08-31
索尼Xperia 5 V发布 影像素质媲美相机保留3.5mm耳机接口
索尼Xperia 5 V于2023年9月1日正式发布,该产品搭载了第二代骁龙8芯片,但目前在售的只有8GB 256GB一个版本,国航版售价为6499元,预计9月下旬将正式上市。 索尼Xperia 5 V延续...
日期:09-02
丰田章男:本财年盈利5000亿日元是必须达到的最低标准「丰田章男工资曝光:9.99亿日元丰田汽车史上最高!」
快科技7月1日消息,近日,丰田汽车在6月30日提交的年度文件显示,丰田汽车董事长丰田章男(Akio Toyoda)在截至2023年3月底的财年中获得的薪酬总额为9.99亿日元(合5000万人民币),较截至...
日期:07-01
一文看懂微信视频号双11狂欢节官方激励计划「微信视频号活动」
11月3日 消息:日前,微信视频号“11.11狂欢节”已经开启。即日起至11月11日24时,在视频号直播间开播或短视频带货,都有机会参与官方激励计划。移动 李跃据悉,视频号官方也汇总了...
日期:11-10
生成式AI已掀起浪潮,但还没能走出伦理困境_人工智能ai伦理
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,,授权转载发布。近来,AIGC(生成式人工智能)火了、而且是爆红。在《Science》此前发布的2022年度科学十大突破中,AIGC...
日期:02-02
国家数据中心密集开工 算力世界“神经网络”再进化_大数据算力中心
运力、算力、存力,缺一不可。   算力作为新型生产力,已经成为数字经济增长的重要驱动力。随着东数西算等工程的推进,全国的算力网络基建持续加速。   近日举行的世界5G大会...
日期:08-17
有创意!可食用无人机来了 用米糕做的机翼靠谱吗?「用雪糕棒做无人机」
11月18日 消息:试想一下,当你登山远足却遇到迷路、受伤又或者被困,在又累又饿的情况下会让人感觉相当绝望。一般等待救援队需要一段时间,在这期间你已经没有食物的情况下饥饿难...
日期:11-20
社交游戏商Zynga收购社交浏览器开发商Flock_社交游戏开发商Zynga的首席执行官更喜欢用什么说话
  北京时间1月8日消息,据国外媒体报道,社交游戏厂商Zynga周四宣布,它将收购社交网络浏览器开发商Flock。这是Zynga在最近几个月来进行的第8宗收购交易。   Flock首席执行...
日期:07-25
奇瑞公司员工「奇瑞汽车涉多起劳动纠纷案件 领导称周六是奋斗者正常工作日」
凤凰网科技讯 3月7日消息,据天眼查App显示,2月6日,奇瑞汽车股份有限公司执行副总经理高新华回复研发出勤统计的邮件称,“以奋斗者为本,周六是奋斗者的正常工作日”,以此要求所有部...
日期:03-07
特斯拉降价比亚迪会降吗「李想谈特斯拉比亚迪降价 汽车不是越贵越好」
3月3日 消息:在理想汽车2023春季媒体沟通会上,李想等高管接受了媒体采访。就造车新势力在今年1月和2月面临的交付量挑战,李想表示,今年第一季度确实比较困难。一方面是由于去年...
日期:03-03
小米14将采用超窄边框和新的snapdragon处理器_小米14是什么屏幕
小米14将采用华星屏幕和超窄边框和新的snapdragon 8 gen3处理器,使其成为业界最窄的5g旗舰智能手机之一。苹果芯片 英特尔芯片买手机选择128G内存还是256G内存小米14的超窄边...
日期:04-28
连麦增长黑盒:NFT爆火后,品牌营销是否找到新方向?
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:新榜和ta的朋友,授权转载发布。编者按:前不久,增长黑盒联合创始人刘方舟在“新榜和ta的朋友们”视频号系列直播中带来了主题...
日期:08-16
腾讯混元大模型已通过备案,将陆续对公众开放_腾讯混元大模型已通过备案,将陆续对公众开放吗
通信世界网消息(CWW)腾讯混元大模型已通过备案,将陆续对公众开放。据介绍,腾讯混元大模型是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超 2 万亿 tokens,已...
日期:09-18
三伏天晒背最佳时间表 建议晒背15分钟左右「三伏天晒背的注意事项」
今天是头伏第一天,有网友早早地准备好了早上9时的太阳,要晒晒背,补充阳气。对此,中医专家提醒,三伏天确实是一年中阳气最旺的时候,但是,并不是所有人都适合晒背,晒得不当,可能会影响...
日期:07-11
针对美国芯片封锁 新闻_经济日报:美国芯片法案拦不住“中国芯”!
近日,美国《芯片和科学法案》正式签署,美国拟投入500多亿美元推动芯片的研发制造和劳动力发展,给“美国芯”又加一把油。根据该法案规定,获得资金补贴的芯片企业,未来10年内将不...
日期:08-16