您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 17:01:32  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

intel edison智能硬件开发指南

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

一月八日京东plus会员

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

短视频跨界营销

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
郭明錤:苹果 iPhone 13 或将支持低轨道卫星通讯,没有 4G/5G 也能上网、打电话
  8 月 29 日消息 据天风国际官方公众号,郭明錤等分析师预测,苹果 iPhone 13 硬件规格可能将支持低轨道卫星通讯。   如果苹果开启相关软件功能,当 iPhone 13 使用者不在...
日期:02-19
仅次OpenAI!AI初创公司Inflection融资13亿美元 估值达40亿美元_中国ai初创公司
6月30日 消息:日前,总部位于加州的AI初创公司Inflection宣布完成13亿美元的最新一轮融资,本次融资由微软、英伟达以及比尔·盖茨、埃里克·施密特、Reid Hoffman(LinkedIn的创...
日期:06-30
山西辞退倒水太满员工公司致歉:将加强员工关怀
3月15日消息,据新京报报道,山西卓育云教育公司就辞退倒水太满”员工发布致歉说明,就给梁某某不好的工作体验道歉,表示将加强员工关怀。华为mate50卫星电话此前梁某某与该司签订...
日期:03-15
专访何一 | 我得回来打仗
《专访何一 | 我得回来打仗》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:何一接受了Odaily星...
日期:08-01
贝克汉姆回复王濛大胆表白 感谢你的赞美:后者曾公开表示因为帅喜欢他
快科技4月8日消息,比赛短道速滑名将王濛对贝克汉虎的喜欢一直都不是秘密了,现在贝克汉姆也跟他进行了互动。谈到喜欢的球员,王濛表示以前喜欢贝克汉姆,比较帅的,现在喜欢C罗,性格...
日期:04-09
网红俄罗斯小哥「俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了」
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。美国亚马逊董事长有事 AI 它是真上啊。我向一位女生求婚,ChatGPT 已经和她交流了一年。...
日期:02-06
顺丰同城将上线“骑士权益日”周六专属福利活动
11 月 25 日消息,顺丰同城宣布将于明日( 11 月 26 日)起面向骑士开启“骑士权益日”福利活动。该活动将每周的周六设定为“权益日”,骑士参与活动即可享受同城币活动加码、快速...
日期:11-26
特斯拉第二季度中国销量「特斯拉第二季度交付超46万辆汽车,同比增长83%」
7月3日消息,美国当地时间周日,电动汽车制造商特斯拉发布了2023年第二季度汽车生产和交付报告。报告中称,特斯拉第二季度汽车总产量为479700辆,总交付量为466140辆,同比增长83%,创...
日期:07-03
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预...
日期:02-05
boss直聘不花钱招聘不到人「尴尬的BOSS直聘们:有用户,但不赚钱」
声明:本文来自于微信公众号价值星球Planet(ID:ValuePlanet),作者:沙拉酱,授权转载发布。BOSS直聘又要上市了。10月10日,BOSS直聘(BZ.US,以下简称“BOSS”)发布公告称,公司已向香港联交所...
日期:11-03
微店商家:视频号带来新的私域流量增长点_微信视频号商家入驻
  4月21日,微店对外宣布开始支持全量商家、全品类接入视频号。4个月后,已有一批率先入局的商家,得到了不菲的收获。微店商家表示,短视频既是营销渠道,也是建立品牌、与粉丝互...
日期:07-17
华为芯片制造商到底是谁?合作伙伴“嘴”很严,外媒:低估了中国
关注华为的小伙伴都知道,华为Mate60 Pro很争气!幸福最晴天预告在雷蒙多访华期间,华为送上了一份“厚礼”,在没有任何消息的情况下,华为直接开售了Mate60 Pro,而有数码博主对华为Ma...
日期:09-07
LCD时代即将终结!曝苹果新iPad升级为OLED屏_ipadpro屏幕升级
快科技10月10日消息,市场调研机构Omdia在一份报告中提到,苹果将在2024年推出配备OLED屏的iPad Pro,有11和13英寸两种尺寸,供应商为三星和LG。苹果新机发布老款涨价报告指出,苹果...
日期:10-10
吉利新车极氪「极氪回应将被吉利分拆上市:将以业务为先 确保7万辆年销量」
10月31日 消息:今日,吉利汽车公告称,已向香港联交所提交一份议案,内容有关建议分拆极氪并将其独立上市。极氪方面就此回应称,“我们将根据相关法律法规,及时披露相关信息。极氪管...
日期:11-07
以创新为基础,打造懂业务的SSD  ——华为ES3000 V6 SSD(华为企业级ssd)
  数字经济的到来,数据的价值越发重要,随着数据处理在企业关键业务应用的深入,企业级SSD存储新技术的发展,正在颠覆整个存储世界。通过不断技术探索与创新,华为推出了最新一代...
日期:07-14
百度沸点榜单入口2020_百度沸点完整榜单出炉,不能错过的2019热点全在这里了
  12月16日,百度方面公布了百度沸点2019年度榜单,新中国成立70周年、996、AI、5G等内容成为今年网民热搜热议的对象。作为百度每年年末发布的大数据盘点榜单,今年的百度沸点...
日期:04-07
三星z flip 5g国行版与韩版有什么区别「最低7499元/12999元起 「三星Galaxy」-Z Fold/Flip 5国行售价曝光」
据官方此前宣布,三星将于7月26日也就是明天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy Z Flip 5、Galaxy Z Fold...
日期:09-10
男子骑车下班被拦路光纤线割喉受伤:画面让人后怕!医生提醒「光纤被车挂断了怎么办」
据一点资讯,4月8日在四川自贡,一男子下班骑车,当时阳光刺眼没注意,被拦在路上的光纤线割伤颈部住院。苹果哪些电脑是m1芯片当事人朋友童先生表示,现场发现两个通讯公司的光纤入户...
日期:04-10
骁龙8nm处理器「高通骁龙8 Gen2核心规格曝光:八核心架构 性能提升10%」
随着年底的临近,大家关注的焦点也逐步转移到了搭载新一代高通旗舰平台骁龙8 Gen2的新一代顶级旗舰上。据此前多方透露,高通将于11月14日至11月17日期间举行高通骁龙峰会,届时将...
日期:09-30
世界富豪榜马斯克「《福布斯》年度富豪榜:马斯克失首富 贝佐斯最惨」
凤凰网科技讯 北京时间4月5日消息,2022年对科技公司来说是艰难的一年,股价的暴跌也给这些公司创始人的财富造成了巨大损失。《福布斯》周二发布了2023年度全球富豪排行榜,确定...
日期:04-05