您的位置:首页 > 移动互联

Nature子刊 | NUS、字节首次将AI元学习引入脑成像领域

发布时间:2015-08-05 19:29:45  来源:互联网     背景:

  近期,新加坡国立大学、字节跳动智能创作新加坡团队等机构合作的一项技术成果被全球顶级学术期刊Nature的子刊Nature Neuroscience收录。这项研究首次将人工智能领域的元学习方法引入到神经科学及医疗领域,能在有限的医疗数据上训练可靠的AI模型,提升基于脑成像的精准医疗效果。

  研究背景

一加9系列高清渲染图曝光

  脑成像技术是神经科学发展的一个重要领域,能够直接观察大脑在信息处理和应对刺激时的神经化学变化、从而对疾病的诊断和治疗提供重要参照。理论上,基于脑成像的机器学习模型可应用于预测个人(individual)的一些非脑成像(non-brain-imaging)的表征特性(phenotypes) ,例如,流动智力 (fluid intelligence)、临床结果(clinical outcomes)等,从而促进针对个人的精准医疗( precision medicine)。

  一个现实的问题在于,虽然现在已经有英国生物银行(UK Biobank)这样的大规模人类神经科学数据集,在研究临床人群或解决重点神经科学的问题时,几十到上百人的小规模数据样本依旧是常态。在精确标注的医疗数据量有限的情况下,很难训练出一个可靠的机器学习模型来预测个人表征特性。

奥林巴斯45 1.8镜头

  论文提出一个新的思路来解决这一数据匮乏所带来的根本限制:在给定一个大规模(N>10,000)的带有多种表征特性标注的脑成像数据集,可以将在该数据集上训练的机器学习模型迁移到一个独立的小规模(N<200)的带有新的表征特性的数据集上,从而使得在新的数据集上训练的模型能够准确预测新的表征特性。

  方法

  研究者通过对先前的小样本数据分析发现,个体的认知、心理健康、人口统计学和其他健康属性等表征特性与大脑成像数据之间存在一种内在的相关性。这意味着,小数据集当中的某些独特表型可能与大规模数据集当中的某些预先存在的特定表型相关,利用这种相关性,研究者提出了一个新的基于元学习的元匹配方法建立了一种框架机制,可利用大规模脑成像数据集来促进对小数据集当中一些全新的、未知的表型的预测,从而训练出可靠的用于表征特性预测的机器学习模型。

  论文提出了一种新的元匹配(meta-matching)方法,来解决小规模数据集上的表征特性预测模型的训练问题。元匹配是一种高度灵活的学习框架,可以用于各种不同的机器学习方法。论文主要研究了将元匹配方法应用于核岭回归(kernel ridge regression, KRR)以及全连接的深度神经网络(DNN).

  在元匹配的学习框架中,大规模的训练数据被分为元训练集 (training meta-set) 以及元测试集 (testing meta-set)。这两个数据集包含不同的个体和表征特性标注。元训练集被用来训练DNN预测模型,而元测试集则用来评估当前DNN模型在新的表征特性上的预测准确率(也即泛化性能)。特别的,随机挑选的K个(K<5)个体数据被选作测试样本。而在元测试集上表现最好的一个DNN输出节点(output node)将被保留,而其他节点被移除。之后在该K个测试个体数据,微调(fine-tune)该保留的节点以及DNN模型之前与该节点相连的隐藏层参数。注意与一般的元学习或者微调策略不同的是,这里只微调DNN模型中的一个子网络,而不是微调整个模型参数。该过程将被重复M次,直到DNN模型在元测试集上预测稳定为止。

  在完成上述的元训练过程以后,得到的DNN模型已具有了较强的在新的预测任务上的泛化能力。该模型可以直接迁移到新的表征特性数据集上,用少量的标注样本进行训练,即可有较好的预测性能。

  实验设置

  论文在英国生物银行(UK Biobank)和人类连接组计划(Human Connectome Project)数据集上进行了测评。所有数据的使用均已经过了相关研究部门批准。其中 UK Biobank 包含36,848名参与者的结构MRI以及静息fMRI脑成像数据,以及被筛选出的67个非脑成像的表征特性。而HCP包含 1,019 名参与者的结构MRI以及静息fMRI数据,以及被筛选出的58个表征特性。所筛选的表征特性涵盖了意识(cognition)、情绪(emotion)以及个人特质(personality)。

小米手环6屏幕变小了

  UK Biobank数据集被用作训练集,用于使用元匹配来训练预测模型。其被随机分为元训练集(26,848名参与者,33个表征特性)以及元测试集(10,000名参与者,34个表征特性)。而HCP数据集则被用作测试集、测试预测模型在新的表征特性上的预测准确率。其被随机分为K个参与者用于训练以及(1,019-K)个参与者用来测试。其中K取值为19,20,50,100和200.

  △ 图. HCP表据集表形特性示例

  实验结论

  上述方法已经在英国生物银行(UK Biobank)的 36,848 名参与者和来自人类连接组计划(Human Connectome Project)的 1,019 名参与者的样本评估中显示出有效性。

  在BioBank测试集上性能超过经典的核岭回归(KRR)

  下图展示了在UK Biobank元测试集 基于Pearson’s相关系数的准确性比较。在所有的样本数量设置上(K值),所提出的元匹配方法在34个表征特性准确率大幅超过经典的KRR方法 (伪发现率FDR q<0.05). 例如在fMRI研究中常见的样本数量K=20 (20-shot),基本的DNN meta-matching 方法准确率超过KRR 100% (0.124 vs. 0.052). 而如果采用coefficient of determinant (COD)作为性能指标,DNN meta-matching方法则超过KRR 400% .

Nature子刊 | NUS、字节首次将AI元学习引入脑成像领域

nvidia network

  在HCP小规模新数据集上显著超过KRR

  为了测试元匹配在全新的测试集上的表现,论文进一步测试了其在HCP数据集上的性能。发现同样的,所提出的元匹配方法准确率大幅超过经典的KRR方法。例如在K=20时,元匹配方法准确率超过KRR 100% (0.123 vs. 0.047). 而在K=100时,以COD为指标,元匹配方法准确率超过KRR 800%.

新品OnePlus/一加 Nord 5G

Nature子刊 | NUS、字节首次将AI元学习引入脑成像领域

  讨论与总结

三星内存卡行车记录仪

  考虑到所提出的元匹配方法是利用表征特性之间的相关性来辅助预测,其背后的预测机制有可能是非因果的。然后该研究的主要目标是提高预测准确率,并且即使是非因果预测,所得到的预测模型也有很多的应用场景。例如,抗抑郁药物至少要4周以上才会起效,而少于50%的病人会对第一次给药反应良好。因此,即使是非因果的预测,提高表征特性的预测能力在临床上仍具有巨大价值。

  论文所提出的元匹配方法,是基于机器学习领域中的元学习,多任务学习以及迁移学习等。例如在DNN模型上先训练再微调可认为是迁移学习的一种形式。但是,值得注意的是,实验表明最大的准确率提升是来自于论文提出的核心算法—元匹配。当然,更先进的机器学习算法有希望在这个方向上带来更大的预测准确率的提升。

  虽然最初的脑成像数据集来自于年轻健康的成年人,现在有越来越多的数据集侧重不同的人群,例如老年人、儿童、不同的疾病等。论文提出的方法在将来也可以用于其他人群数据集的表征特性预测,例如最近的ABCD数据集包含了精神健康症状。

  字节跳动智能创作团队是字节跳动音视频创新技术和业务中台,覆盖了机器学习、计算机视觉、图形学、语音、拍摄编辑、特效、客户端、服务端工程等技术领域,在部门内部实现了前沿算法—工程系统—产品全链路的闭环,旨在以多种形式向公司内部各业务线以及外部合作客户提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案。

  智能创作基础研究团队旨在探索前沿机器学习以及计算机视觉、自然语言处理技术,解决人工智能领域里的挑战性问题。

  Nature Neuroscience是神经生物学领域最顶级的刊物之一,该杂志发表的论文涉及神经科学的各个领域,包括分子、细胞、系统、行为、认知和计算研究。(文章来源:量子位)

  作者:王蜂



返回网站首页

本文评论
如何使用跳绳来丰富体育课的内容_寒假体育作业,该怎么留?【天天跳绳App】,体育老师的好帮手!
  这几年,为了督促孩子们锻炼身体,不少中小学一到寒暑假都会布置体育作业,内容一般是跳绳、仰卧起坐、俯卧撑、跑步等,要求孩子们每天进行一小时体育锻炼,对于增强体质、预防肥...
日期:08-06
不要买当贝投影仪d3x_当贝NEW D3X最适合女生用的投影仪,入门级旗舰机 极致性能天生好看
  在男性为主要消费群体的投影行业中,女性细分市场也是在近两年才得到重视,与男性相比,女性对于投影的要求则有很大的不同。如今想要做一款在性别上更符合女性用户的产品,仅仅...
日期:10-09
华为应用市场《开发者说》Young样精彩 用App讲述7位青年开发者故事(华为手机APP开发者)
  青年,是拥有无限可能的群体,代表着积极向上、充满朝气的蓬勃力量。在移动应用与用户生活密切关联的当下,不同性格、不同追求的青年开发者们通过洞察用户需求,用科技的力量让...
日期:05-07
五一购机惊喜福利来袭 全能游戏旗舰黑鲨5到手价2599元起
  喜迎劳动节五天小长假,黑鲨科技为众多热爱手游的玩家准备了极具诚意的购机福利活动。在4月30日-5月5日活动期间,购买黑鲨5即可享受立减200元的购机价格,到手价为2599元...
日期:07-14
千元级智能投影仪全评测,微果C1、小明Q1、知麻DIVA Pro、哈趣H1,你Pick哪一个?
  今年618,如果你想入手一款千元价位的智能投影,这四款产品一定进入了你的短名单,【微果C1】【小明Q1】【知麻DIVA Pro】【哈趣H1】,那么,他们具体有什么区别呢?  参数横向...
日期:07-14
石墨烯防护口罩能防病毒吗_病毒高一尺、防护高一丈,石墨烯推动口罩防护力大升级
  4月22日是第53个世界地球日,随着人类活动对地球的影响增加,全球环保热心人士呼吁减少石化产品的消耗,其中,一次性口罩的消耗已成为日益关注的问题。据统计,仅2020年便有超15...
日期:08-02
第三届华为云VR开发应用暨沈阳元宇宙开发应用大赛即将启幕,作品征集进行中
  数字经济是推动我国经济高质量发展的重要动力,也是引领传统产业升级、促进前沿科技进步的中坚力量。新兴的元宇宙(metaverse)概念,正是社会生活体系在数字空间的具现,是5G...
日期:09-27
献礼国庆 | 统税兴国之本 纳税为国为民_国税为国聚财为民
  ​新中国成立72周年之际,在推动智慧税务建设的大背景之下,华云数据作为肩负着社会责任的科技企业,积极赋能税收,推动税务部门信息化、数字化能力建设,让税收政策直达畅享,实实...
日期:07-27
构建研发数字化引擎,TiD2021质量竞争力大会圆满落幕
  2021年9月9日-15日,由中关村智联软件服务业质量创新联盟主办,中国软件行业协会系统与软件过程改进分会、中国软件行业协会软件造价分会协办的第八届TiD质量竞争力大会在京...
日期:07-27
腾讯产品青少年模式首发戚发轫等四位科学家讲堂特辑
  5月31日,在中国宋庆龄基金会成立40周年,腾讯集团与中国宋庆龄基金会战略合作一周年之际,双方联手推出的“给孩子们的大师讲堂”上线了六一科学特辑,戚发轫、姜鹏、丁洁、魏...
日期:07-14
2022综合性能最好的投影仪推荐,选择当贝X3 Pro一步到位_当贝投影仪2021年新品
  如今投影仪行业发展日新月异,各个品牌不断推出新品,消费者对于投影仪的画质和亮度要求也越来越高。如果你也想选购一台投影仪,在笔者看来,2022年综合性能最好的投影仪非当贝...
日期:09-23
CubeFS 进入 CNCF 孵化阶段,国产分布式存储的新里程碑!
  CubeFS 是国内首个云原生开源分布式存储产品,2019 年开源并捐赠托管至云原生计算基金会(CNCF),2020 年 10 月 OPPO 开始主导 CubeFS 社区运营与版本迭代,累计发布 7 个...
日期:07-25
FILA 首个绿色天猫超级品牌日 探寻可持续时尚生活_fila旗下品牌
  近年来,低碳生活越来越成为一种社会共识,环保理念的流行也让“绿色”的生活方式逐渐为年轻人所认可。在此背景之下, FILA 近日联合天猫超级品牌日,围绕 FILA 主推的Eco...
日期:09-10
单反时代落幕 佳能宣布停产单反相机_佳能宣布放弃单反
  原标题:单反时代的落幕 佳能官方宣布停止生产单反相机  12月30日,佳能官方正式宣布停产其旗下单反相机产品,未来将全身心投入到无反相机产品线上。至此佳能EOS单反时代落...
日期:07-25
智赋园区 数创新程”,锦和商业、原圈科技发布“云屏计划”
  “美国spacex发射火箭成功意味着什么  “云屏计划”首次发布,园区4.0时代于锦和商业开启  “发展壮大城市群和都市圈,实施城市更新行动”是“十四五”时期的主要目标...
日期:07-25
大悦城商业模式_大悦城控股3C智慧运营服务体系,重塑商圈未来商务格局
  大悦城控股北京大区有着丰富的地产业务经验,深耕北京市场多年。在多年前行发展历程中,始终肩负“创造城市永续价值,追求可持续性幸福”的企业使命,以“城市运营商与美好生活...
日期:07-26
云时代下一个十年,看Serverless如何定义未来_serverless 云原生
  IT技术的诞生奠定了现代计算机信息技术的雏形,信息时代的大幕正式拉开。而云计算的出现改变了传统IT架构和运维方式,“云”的革命被人们视作互联网技术的未来。在新旧技术...
日期:07-26
索尼又让我相信了!论舒适降噪,听听Sony Linkbuds S的 ——新品LinkBuds S和WH-1000XM5带来卓越聆听享受
  作为索尼史上最轻*1盈、最小巧、最舒适的入耳式降噪耳机,linkBuds S的耳机本体重量仅约4.8g,在索尼业界盛名的降噪技术和通透的环境声模式加持下,结合出色高解析度音质表...
日期:06-13
疫情尚未结束,防控不可松懈请各位_疫情防控切勿松懈,无人配送成良策
  最近,全国疫情逐渐严重,多个省市均出现本土确诊人数攀升情况,这让疫情防控再次升级。本次疫情主要面对的是新出现的奥密克戎变异毒株,它具备传染性强、传播速度快、隐匿性高...
日期:07-29
Galaxy buds pro2_简约设计 功能丰富 耳机潮品三星Galaxy Buds2 Pro超百搭
  告别了难耐的酷暑,迎来了凉爽的秋天,新一轮的秋日潮流正向我们走来。不同于夏日,凉爽的秋季人们更加关注不同服饰之间的混搭,而作为日常实用的智能穿戴产品,也更需要在时尚度...
日期:10-09