您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 14:23:10  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

龙芯3a5000芯片的电脑

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

soso地图手机版下载

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

特斯拉model y提价

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

中兴通讯5g商用合同

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
今年来阿里已减员超1.5万人  较上季度减少1797人
11月18日 消息:阿里巴巴最新财报显示,其员工数量已连续三季度减少。截至9月30日,阿里巴巴员工总数为243903人,较上季度减少1797人,比年初减少15413人。朱诺号拍摄的木星高清图片...
日期:11-20
父母从新疆给远嫁女儿寄50斤羊肉 网友:深感父母的无私和关爱
董女士,一位远嫁天津的女子,近日收到了来自新疆的50斤羊肉,这是她父母精心为她准备的礼物。这份礼物不仅仅是沉甸甸的羊肉,更是父母对女儿深深的爱意。苏宁易购家电节据悉,每年,董...
日期:01-08
孟小龙是谁「曾与林正英、李小龙搭档 著名武打演员孟海去世:终年65岁」
10月10日消息,据国内媒体报道,中国香港资深武术指导、著名动作演员孟海去世,终年65岁。苹果换芯片redmi note10 pro发售价ipadlightning是什么报道称,孟海的侄女孟希璘证实,孟海...
日期:10-10
腾讯三季度收入1401亿元,净利润399亿元同比增1%__腾讯一季度营收
11月16日消息,腾讯控股(00700)发布2022年第三季度业绩。报告显示,腾讯第三季度营收1400.93亿元,同比减少2%,环比增加5%。毛利619.83亿元,同比减少1%,环比增加7%;公司权益持有人应占...
日期:11-25
低于市场预期 iPhone16或仅最高端机型配潜望式镜头_iphone 16概念机
2月1日电,知名分析师郭明錤表示,2H24新款iPhone16可能仅一款/最高阶机型配备潜望镜相机,低于市场预期的两款,镜头升级需求低于市场预期,不利大立光与玉晶光。如先前预测,2H23最高...
日期:09-20
李彦宏:大模型时代最大的机会在于应用层_李彦宏ceo
3月16日消息,百度今日正式推出新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏表示,“我认为生成式AI,将催生新产品、新业态,会有很多创业和投...
日期:03-16
B站UP主“停更潮”登热搜:多位UP主做出回应_b站停播番剧
今天,微博话题#B站UP主发起停更潮#爆火,一度登上微博热搜榜一,多名UP主集中宣布暂时停更,矛头直指平台收益减少,引起大众关注。属于量子测量问题的三种经典解释是激光雷达 气象目...
日期:04-02
俞敏洪建议一周放假两天半到三天:人类工作已逐渐智能化_俞敏洪提前跑了
1月16日 消息:东方甄选看世界直播间中,俞敏洪谈及未来工作与休假制度。他认为,随着人工智能的发展和工作的智能化,现有的每周两天假期可能不足够。他主张每周应有两天半到三天...
日期:01-17
AI技术赋予新年味 360搜索推出Q版全家福制作神器温暖就地过年一族
  “二十三,糖瓜粘。二十四,扫房子……”随着春节的临近,大街小巷开始张灯结彩,年味愈发的浓了。不过,出于疫情防控考虑,国内许多地方和机构倡导“就地过年”,并推出了各种暖心...
日期:07-16
美团股价上涨_港股美团收跌超9% 快手跌超4%
查看最新行情   讯 8月16日下午消息,香港恒生指数收跌1.05%,恒生科技指数收跌2.03%。港股美团收跌超9%,盘中市值一度跌破万亿港元。此前有市场消息称,腾讯...
日期:08-20
暴打超跑?蔚来发布全新车型预告:配电动扰流板「蔚来电动轿跑车」
12月22日,蔚来预告了一款全新车型,并表示该车将于12月24日举办的NIO DAY上亮相。此次预告信息十分简短,仅展示了该车的电动扰流板,不过结合此前蔚来新产品的谍照,推测即将发布的...
日期:12-22
开源鸿蒙 OpenHarmony Github 镜像库正式上线_鸿蒙开源代码github
  10 月 3 日消息 据开放原子 OpenHarmony 官方发布,开源项目 OpenHarmony 是每个人的 OpenHarmony,OpenHarmony Github 镜像库已正式上线。   访问地址:https://github.c...
日期:12-19
女子飞机上光脚踩踏座椅扶手 还怼前座我愿意:网友直呼没素质到家
5月21日,长沙飞北京南航飞机上,一女子座椅扶手被他人光脚踩踏,礼貌劝阻后被怼:我碰你了吗,愿意!视频中,一只没有穿鞋的脚正搭在前座乘客夏女士的座椅扶手上。夏女士礼貌询问,对方的...
日期:05-23
华为数据中心基础设施「华为发布《数据中心2030》报告,引领新型数据中心创新与发展」
通信世界网消息(CWW)2023年9月20日,在华为全联接大会2023期间,华为发布《数据中心2030》报告,与产业界共同展望数据中心未来发展前景,定义未来数据中心关键技术特征,提出新型数据中...
日期:09-23
华为P70系列将带来梦幻新配色 首次亮相非常神秘_华为p70概念手机
  【手机中国新闻】2月7日,有数码博主爆料称,华为即将发布的P70系列手机在颜色选择上有了新突破。除了经典且受欢迎的类似于洛可可白的白色版本外,P70系列还将推出一款浅紫色...
日期:02-07
华为金融市场_金融转型数据先行,华为用科技加速业务交易
  金融是一个很大的概念。   对于一些人来说,去银行取钱、办贷款、做理财就是金融;   对于一些人来说,买股票、炒期货、做基金就是金融;   对于另外一些人来说,买保险...
日期:01-03
华为重磅发布专为AI场景而生的数据存储新品OceanStor A310「华为数据存储概念股」
近日,在大模型时代华为AI存储新品发布会上,华为重磅发布了专为AI场景而生的数据存储新品OceanStor A310。以存力和算力为中心的大模型时代,面临着数据归集慢、数据预处理周期长...
日期:07-17
腾讯游戏还能坚持多久「马化腾还能接受腾讯游戏慢多久?」
声明:文来自微信公众号“新熵”(ID:baoliaohui),作者:白芨,,授权转载发布。“表态没用,坐看行动。”对腾讯聚焦精品游戏的新闻,这是一个颇具代表性的玩家评论。在12月15日的腾讯内...
日期:12-28
年终购机攻略:论“苹果”最经济的购买方式_打算买苹果
  农历新年脚步声渐近,商家的促销力度也是一波高过一波。就连价格一直坚挺的iPhone系列手机,也随着春节的临近出现价格松动。在京东年货节期间,iPhone 12、iPhone 12 mini限...
日期:07-10
国家互联网应急中心:境外黑客组织声称将对我国发起网络攻击(黑客入侵国家网络)
  2月12日消息 近日国家互联网应急中心刊发了一份《关于近期境外黑客组织拟对我国视频监控系统发起攻击的预警通报》。官方表示,境外黑客组织声称将于2月中旬对我国发起网...
日期:10-08