您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 02:00:27  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

小米12T Pro参数

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
惊艳!华为P60概念图曝光_华为P60最新消息
近日,数码博主@RODENT950在国外社交平台上曝光了两张华为P60的概念图,图片显示背部设计和P50基本一致,令人意外的是,概念图显示P60似乎配备的类似iPhone14Pro系列的灵动岛式药丸...
日期:10-14
协同创新网「“6G协同创新研讨会”成功举办并发布多项创新成果」
通信世界网消息(CWW)2023年9月26日,由中关村泛联移动通信技术创新应用研究院(以下简称“中关村泛联院”)与无线移动通信全国重点实验室(中国信科)、中国移动通信有限公司研究院、中...
日期:09-27
“聚焦区块链赋能,加速数字化转型”,2021苏州高新区区块链产业发展峰会暨万向区块链苏州研究院启动仪式圆满落幕
  6月22日,“2021苏州高新区区块链产业发展峰会暨万向区块链苏州研究院启动仪式”在苏州高新区狮山国际会议中心举行。苏州高新区党工委副书记、管委会主任毛伟,中国信息化...
日期:07-09
对标Redmi K60E!一加新机规格泄露:天玑8200、100W快充
据91mobiles消息,一加正在研发一款新机,定位依旧是超高的性价比,也更偏向于游戏平台。据爆料,这款新机正面采用了一块6.74英寸的1.5K高频调光柔性屏,配有直角中框。腾讯对美团持...
日期:01-31
首批核心先进设备,昆山友达二期项目 Nikon 曝光机入场
  3 月 7 日,昆山友达光电低温多晶硅二期项目首批大型设备正式进入厂区,11 辆装载着 Nikon 曝光机设备的大型温控集装箱汽车驶入。   ▲ 图片来源:昆山商务局   据昆山...
日期:07-18
甘肃怎么做到的:数字政府建设全国领先,14个省41个市学习取经_甘肃省数字政府建设总体规划(2021-2025)
通信世界网消息(CWW)甘肃,简称“甘”或“陇”,地处祖国西北边陲,是一个自然景观、矿产资源和人文历史都非常丰富的省份。近年来,数字经济发展的大潮深刻地影响着陇原大地,从政府到...
日期:07-20
小鹏公布 Q2 财报,对抗特斯拉 Model Y 车型明年到_小鹏汽车Q1财报
2022 年 8 月 23 日,小鹏汽车公布 2022 年 Q2 财报,而数据显示第二季度车型的总交付量为 34422 辆,连续四个季度成为新势力销冠。营收 74.36 亿人民币,同比增长 97.7%。然而第二...
日期:09-16
全铝车身+四轮独立悬挂!奇瑞新款小蚂蚁发布:续航最高408km「奇瑞小蚂蚁全铝车身吗」
2月7日,奇瑞今日公布了奇瑞小蚂蚁2023款官图,新车将于2月10日上市,提供251km、301km、408km三种续航选择。外观设计方面,与现款车型没有太大变化,但在细节上做出变动升级,车辆车身...
日期:02-08
技术与场景化创新驱动中国虚拟桌面软件及云服务市场发展_虚拟桌面云主要采用什么技术
通信世界网消息(CWW)IDC于近日发布了《中国虚拟桌面软件及云服务市场半年跟踪报告》。IDC数据显示,2023上半年虚拟客户端计算软件(VCC)市场规模达到了1.5亿美元,同比增速为5.0%,是...
日期:11-28
趋势2024 | 中国电信韩智泉:加速破解5G行业应用“深水区”难题_中国电信韩臻聪
通信世界网消息(CWW)一元复始,万象更新。挥别“2023”,我们正式坐上了“2024”前行的列车。璀璨的2023年,在各方的共同努力下,ICT产业留下了浓墨重彩的一笔。面向2024年,ICT产业该...
日期:01-12
4999元起!vivo X100 Pro发布:首发天玑9300 V3芯片、年度影像天花板_从vivo s9看天玑1100表现能否媲美骁龙870?
快科技11月13日消息,vivo今晚正式发布了年度旗舰vivo X100 Pro。iqoo neo7具体发布时间价格这次X100系列全系押宝联发科,标配天玑9300芯片,并且打造了顶级的影像系统,成为史上最...
日期:11-14
iqoo neo7评测「iQOO Neo7竞速版发布:16+512G顶配仅售3599元」
今日晚间,iQOO Neo7竞速版发布,8GB+256GB售价2799元,12GB+256GB售价2999元,16GB+256GB售价3299元,16GB+512GB售价3599元,有几何黑、印象蓝和波普橙三种配色可选。这款新品配备6.78...
日期:12-30
360度全景成像混合技术实现开源_360全景影像合成软件
11月30日 消息:研究人员最近设计出一种独特的圆形混合技术,以解决创建无缝360度全景图像的难题。长期以来,360度全景图像一直是一个具有挑战性的技术难题。然而,通过这项创新技...
日期:11-30
谷歌大厂「谷歌集大成之作要来了!据称将发布AI大模型Gemini 对标GPT-4」
财联社9月15日讯(编辑 周子意)据媒体周四(9月14日)援引知情人士的话报道,Alphabet旗下的谷歌已向一小部分公司提供了其对话式人工智能软件Gemini的早期版本。Gemini旨在与OpenAI...
日期:09-16
史上首批用户定制款空调已出炉,淘宝空调万人团将于10点开团_淘宝空调活动
消费者最希望购买的空调是什么样的?5月31日晚,淘宝“空调玩定制,万人大团购”活动数万名淘宝网友经过6天的投票,两款根据消费者意愿DIY定制的空调已经正式浮出水面。(http://100...
日期:07-28
JoyFusion官网体验入口 AI图像生成软件工具app免费使用地址_joy官方网站
JoyFusion是一款AI图像生成应用,可以通过简单的几步操作生成高质量的图像。无论您是设计师、艺术家还是营销人员,JoyFusion都适用于各行各业。它不仅可以生成漂亮的图片,还可以...
日期:01-10
恒驰5首次OTA升级来了!低温续航性能提升「恒驰5续航里程」
去年10月,首批100台恒驰5正式开启交付,根据恒大最新公告,目前已交付共324辆恒驰5给客户。今日,恒驰汽车官方宣布,恒驰5迎来首次OTA(在线升级),版本号为H-SMART OS V1.3.4”,本次升级...
日期:01-06
儿子给妈妈买花的祝福语「母亲节儿子偷偷给妈妈买花被骂哭:各有各的立场」
昨天是母亲节,一些孩子和母亲之间的互动让千万网友为之动容。锐目视频分享了发生在浙江东阳的故事,5月14日母亲节当天,男孩给妈妈买了一束花,想给妈妈一个惊喜,没想到却被妈妈指...
日期:05-15
抖音知识付费直播「做好知识付费直播间的10个“真相”」
声明:本文来自于微信公众号 黄有璨(ID:owen_hyc),作者:黄有璨,授权转载发布。2周以前,跟一个朋友有一场线上直播对谈。这次直播对谈的主题是:关于知识付费直播间的“真相”。我对谈...
日期:12-06
东航班机客舱内充电宝自燃,飞机已返航_飞机因故障返航
  东方航空官方微博9月4日发布消息,今日公司南京至厦门航班,在巡航期间客舱内有旅客充电宝自燃,机组第一时间按程序妥善处置,迅速排除安全风险。为最大限度确保安全,机组决策...
日期:05-17