您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 21:08:31  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

擎朗智能机器人有限公司怎么样

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

首款闪充手机

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

政府怎样完善和形成机器人产业链

iqoo手机快充变成了慢充怎么解决

—完—


返回网站首页

本文评论
华为mate60官方首曝「郭明錤:华为Mate60 Pro需求强劲 出货量至少1200万部」
  【手机中国新闻】9月5日消息,天风国际分析师郭明錤预计,华为Mate60 Pro自8月29日开卖后需求强劲,2H23出货计划已提升约20%至550–600万部,发售后仅4个月即可达550–600万部,...
日期:09-05
腾讯股票涨停_中概股周一收盘涨跌互现 腾讯音乐涨近6% 趣活跌超11%
  北京时间16日凌晨,美股周一小幅收高,主要股指延续上周涨势。市场继续关注全球经济衰退风险,并等待美国零售巨头财报以及7月零售销售数据。   道指涨151.39点,涨幅为0.45%...
日期:08-20
中国移动发布国内首个智算跨架构平台——算力原生 “芯合”_中国移动算法工程师
通信世界网消息(CWW)10月12日,在中国移动全球合作伙伴大会期间,中国移动联合13家产业合作伙伴共同发布了国内首个支持智算应用一键式跨架构迁移的平台——算力原生“芯合”。该...
日期:10-13
搭载1.5K高频调光曲屏+骁龙8 Gen2 「一加Ace」-2 Pro部分配置细节曝光_一加8pro 曲率
今年初,一加推出了一加Ace 2机型,该机搭载满血版骁龙8+移动平台,至高支持16GB超大内存,拥超帧超画引擎、 HyperBoost 2.0稳帧引擎、电竞云计算专网等三大自研技术,带来全方位的体...
日期:09-12
京东双11销售额超4982亿「京东双11预售战报:家电1分钟成交额破10亿 折叠屏手机销量增长400%」
凤凰网科技讯 10月31日消息,刚刚迎来预售的双11电商大促中,家电市场继续呈现如火如荼态势。根据京东发布的数据,今晚8点预售开启后,家电全品类1分钟成交额超10亿,10分钟整体成交...
日期:11-02
比11 Ultra更惊艳!曝小米14 Pro外观设计已完成_小米14pro是什么屏幕
近日,有网友在小米工业设计部设计总监魏旭微博下提问“小米 14 Pro 能不能继续沿用小米 11 Ultra 的外观?”。随后魏旭本人针对这一问题进行回答,表示小米 14 Pro 手机外观设计...
日期:04-24
沃达丰率先在英国开通5G SA网络_沃达丰中国官网
通信世界网消息(CWW)近日,沃达丰宣布,他们已成为英国第一家基于新的5G独立(SA)技术为客户推出套餐服务的移动运营商,该技术被称为“5G Ultra”,将带来更快的移动宽带速度和其他领...
日期:06-26
B站称已将大模型应用于旗下业务 并已推出AI视频小助手
8月18日 消息:在昨日的电话会议上,B站董事长、CEO陈睿表示,AIGC是一项能够改变世界和行业的划时代技术革命,对于B站来说,AIGC已经带来了明显的增益。AIGC可以提高创作者创作内容...
日期:08-25
鸿蒙生态解决方案「鸿蒙生态加速扩容,腾讯、支付宝、美团等将以原生方式适配」
华为在移动应用生态领域正加速快跑。继腾讯、支付宝、国航等宣布接入鸿蒙系统后,11月9日,据《财联社》报道,美团已成立独立研发团队,专注鸿蒙App的开发。美团招聘官网的公开信息...
日期:11-11
宁波“顺其自然”24年捐款1469万 满满正能量网友致敬:央视点赞_宁波顺其自然捐款人真的找不到
做好事不留名的例子很多,但能够坚持24年,那就很不易了。据央视新闻、浙江日报等报道,11月25日上午,宁波市慈善总会收到了一封厚厚的挂号信。白色的信封上,署名顺自”,落款地址是不...
日期:11-26
“挥洒”至少50亿美元!索尼计划今年将继续大型收购「索尼收购了哪些公司」
在微软为了收购动视暴雪奔波的同时,索尼也一直没有停下收购的脚步。近日,索尼首席财务官十时裕树表示,将在2023年投入7000亿日元(约合美元50亿,人民币3545亿)用于大型收购。亚马逊...
日期:03-08
火山引擎给大模型造大底座!MiniMax、智谱AI等已登陆「火山引擎 logo」
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:明敏,授权转载发布。火山引擎刚刚交出大模型趋势答卷:火山方舟,一个大模型服务平台。它将国内多个明星大模型放在平台上,如Min...
日期:06-29
彻底开源,免费商用,上海AI实验室把大模型门槛打下来_igi上海实验室
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:杜伟、泽南,授权转载发布。终于,业内迎来了首个全链条大模型开源体系。大模型领域,有人探索前沿技术,有人在加速落...
日期:07-13
外媒爆料萨姆·奥特曼遭罢免原因:OpenAI取得可能威胁人类的Q*技术突破
11月23日消息,据路透社援引两位知情人士透露,在OpenAI首席执行官萨姆·奥特曼(Sam Altman)被公司前董事会罢免之前,几名研究人员向董事会发出了一封信,警告称人工智能领域的一项...
日期:11-23
中国互联网社区20年,赚钱的路跑通了吗?_互联网这么发达怎么挣钱
声明:本文来自于微信公众号 几何小姐姐(ID:jihexjx),作者:几何小姐姐,授权转载发布。社区是一个社会学概念,一般被解释为生活在同一地理区域内、具有共同意识和共同利益的社会群...
日期:01-27
OpenHarmony,奏响中国基础软件的“光辉岁月”
梦想需要多久的时间,多少血和泪,才能慢慢实现?天地间任我展翅高飞,谁说那是天真的预言?《光辉岁月》歌词中的这两个问题,恰好可以送给今天的中国基础软件事业。曾几何时,我们认为中...
日期:11-07
Chupa:使用 2D 扩散概率模型雕刻 3D 穿衣人体
9月14日 消息:研究人员提出了一种新的3D人体生成方法Chupa。这种方法将扩散模型的生成能力与神经渲染技术结合,以创建多样化、逼真的3D人体。它可以轻松地推广到看不见的人体...
日期:09-14
微信和qq产品分析「微信、QQ被官方认定优秀产品:设计很人性化」
3月30日,中国信息通信研究院联合中国互联网协会,公布了全国44个互联网应用适老化及无障碍改造优秀案例”。腾讯旗下有5款产品及网站成功入选,包括微信、QQ、腾讯地图、腾讯新闻...
日期:04-01
美团港股急跌超10% 腾讯回应出售美团股权传闻:不予置评(美团股票港股)
查看最新行情   记者/张洋洋   美团股价午后持续走低,跌幅现扩大至10%。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,腾讯方面回应《...
日期:08-21