您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 21:42:38  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

仙剑7 1030能玩吗

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

联发科5G芯片

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

苹果14上市具体时间

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
基于Android 14!OPPO ColorOS 14发布时间定了:11月16日见_oppo24号发布会
快科技10月9日消息,从OPPO官网获悉,11月16日,2023 OPPO开发者大会将在上海举行,届时,基于Android 14打造的全新操作系统ColorOS 14将正式发布。根据大会日程,11月16日上午10:10-11...
日期:10-09
一加官宣:Ace2 Pro全球首发量产24GB内存 还有黑科技「一加be2029」
【手机中国新闻】8月4日,手机中国注意到,一加中国区总裁李杰宣布,一加手机一直是大内存的引领者。曾经一加手机淘汰了8GB的内存,选择从12GB内存开始起步,甚至普及16GB内存。而如...
日期:08-05
广之旅原董事长擅自借款易网通为上市谋利
  昨日上午,广州市中级人民法院第十六法庭公开开庭审理了广之旅原董事长郑烘涉嫌受贿、挪用资金罪,广东易网通原董事长吴植辉涉嫌挪用资金、虚报注册资本、职务侵占、单位...
日期:07-22
明日开展!卡萨帝携4大高端套系亮相AWE2023「卡萨帝咋样」
高净值人群理想中的生活方式是什么样子?明日,答案将在上海揭晓。荣耀70手机最低2199元 限购一台怎么办所谓的刷视频赚钱可靠吗2023 中国家电及消费电子博览会(简称AWE2023)将于...
日期:04-27
两款iPhone 14 Pro卖爆:苹果季度收入将创新纪录_iphone 12 pro 销量
尽管iPhone 14/14 Plus破发,销售情况不理想,但价格更贵的iPhone 14 Pro/Pro Max却异常火爆,至今还是供不应求。日前,投行摩根大通在一份研报中预测,苹果第四财季的收入有望在900...
日期:10-14
大厂“新贵”下场造芯、转型to B 业绩如何验证?
财联社|新消费日报8月11日讯(记者 李丹昱)字节跳动宣布自研芯片后,再次掀起互联网大厂们“造芯”热。8月10日,快手(01024.HK)推出自研SoC芯片SL200,已进入内测阶段。与字节跳动围绕...
日期:08-12
理想史上最强更新!理想L系列 OTA 5.0正式开启推送_理想0ne新款
快科技12月19日消息,作为理想汽车史上最强升级更新,备受车主期待的L系列 OTA 5.0,今日正式开启推送,新增145项功能,优化100项体验。其中,车机界面焕新,全新卡片桌面操作更为便捷,屏...
日期:12-20
顶流“花花”提前休五一 保安大叔:和叶在值班_顶流和小花
4月28日消息,万众期待的五一假期临近,前往成都大熊猫繁育研究基地和熊猫见面的游客络绎不绝。保安大叔在门口喊话,花花休五一了,和叶值班,大家往前走。据悉,和叶是一只雄性大熊猫,...
日期:04-28
手机屏幕的完美形态!小米14 Pro首发等深四曲屏_小米pro14是oled屏幕吗
快科技10月26日消息,小米今晚正式发布了小米14 Pro,首发等深四曲屏,融直曲屏之长,堪称手机屏幕的完美形态”。据介绍,全等深微曲屏设计满而不溢,具有直屏观感,超窄视觉四等边。另有...
日期:10-27
我想买山东大葱「身着军大衣人手一颗大葱!“山东小葱花”也要勇闯哈尔滨了」
1月11日,青岛胶东机场迎来了一批特殊的旅客。他们身着军大衣,手拖编织袋,人手一颗大葱,这独特的装束瞬间引发了众人的围观。这批旅客正是即将启程前往哈尔滨的“山东小葱花”们...
日期:01-12
中国挖掘机和日本挖掘机比较「中日发动机差距有多大?为何我国的挖掘机要用日本发动机?」
中国的挖掘机产业正处于蓬勃发展的阶段,其销量和市场份额在全球持续领先。然而,有一个令人疑惑的现象一直困扰着人们:尽管中国的挖掘机制造业取得了令人瞩目的成功,但大部分挖掘...
日期:11-05
面临70亿美元赔款-苹果在英上诉遭驳回,仍被认定4G专利侵权_曝苹果面临70亿美元专利赔偿
北京时间7月5日早间消息,据报道,当地时间周二,英国上诉法院驳回了苹果公司的上诉请求,称苹果的iPhone和iPad等设备侵犯了美国专利公司Optis两项4G通信专利,这意味着苹果还是要支...
日期:09-22
19岁美国选手爆冷击败国际象棋世界冠军,最新调查称其此前可能作弊100多次
  每经记者 李孟林;;每经编辑 高涵 卢祥勇;;  19岁少年轻松击败连续十年霸榜世界第一的“史上最佳”棋手,到底有没有作弊?这是国际象棋界近一个月来最大的疑云,其间的跌宕...
日期:10-09
索尼PS VR2惨遭破解!可玩性大增:直连PC、无须PS5「索尼playstationvr」
快科技5月8日讯,在索尼官网,PS VR2被归类在PlayStation配件中,且官方海报中清晰地标注着须配PS5游戏机使用。不过,高手在民间。日前,iVRy项目实现了对PS VR2硬件认证的破解,从而为...
日期:05-08
Android 12首个开发者预览版发布_安卓开发者预览计划
  (原标题::新界面 众多底层更新)   谷歌今天发布了面向 Pixel 设备的下一版 Android 系统 Android 12 的首个开发者预览版。按照谷歌的惯例,Android 的首个预览版充满了...
日期:07-16
诺基亚旋转是哪一款「诺基亚经典扭扭机,如今仅要30元,灵动一扭青春不闪腰」
诺基亚这个曾经的手机霸主,虽然现在已经没落,但曾经以其出色的产品质量和创新的科技特性,赢得了全球消费者的喜爱。而在其众多的产品线中,诺基亚3250无疑是一款颇具代表性的机型...
日期:01-15
今年7月Windows XP市场份额已跌破50%
  北京时间8月2日消息,据国外媒体报道,互联网流量监测机构Net Applications的最新统计数据显示,今年7月份微软Windows XP操作系统的市场份额已跌破50%。这也是自Net Applica...
日期:07-22
美团2020年第二季度财报_美团将于8月26日公布2022年第二季度财报
bmw病毒测试 查看最新行情   讯 8月16日下午消息,美团(香港联交所股份代号03690)今日宣布该公司将于2022年8月26日闭市后公布其截至2022年6月30日的第二季...
日期:08-20
微信文件传输助手是真人?官方回应否认 已禁止类似微信名称、头像
快科技6月27日消息,今天微信文件传输助手是真人的话题引起不小关注。有网友在社交平台发文称,微信文件传输助手是真人,这让很多平时会将其当成是备忘录、网盘的朋友非常担忧。...
日期:06-27
全国最大规模量子计算云平台重磅发布
通信世界网消息(CWW)8月19日,在2023中国算力大会主论坛上,中国移动携手中国电科发布“量子计算云平台”。这是目前国内最大规模的量子计算云平台,也是业界第一次实现“量子与通用...
日期:08-22