您的位置:首页 > 移动互联

打破存储性能瓶颈,杉岩数据为AI提速增效

发布时间:2022-07-26 13:16:10  来源:互联网     背景:

  当前,随着AI(人工智能)技术的日趋成熟和疫情的影响,整个社会加速进入以人工智能为代表的数字化新常态。AI应用已逐渐渗入到我们生产、生活的方方面面,并产生积极影响。比如,AI在人脸识别、机器人客服、智能质检、辅助医疗、自动驾驶、风评风控等领域快速响应,提高了效率。在今年发布的国家“十四五“规划纲要中,人工智能更是被重点提及,已上升为国家战略高度,成为新一轮科技革命和产业变革的重要驱动力量。

  面对扑面而来的AI旋风,在Gartner2020年的一份调查中,超过85%的CIO表示将在两到三年内为企业部署AI(人工智能)和ML(机器学习)。

  在人工智能发展的三个要素数据、算力和算法中,数据和算力主要受限于信息基础设施的建设。随着AI/ML在各行各业中多点开花,数据作为关键生产要素的作用愈发突出,海量数据的采集、存储、访问和应用让存储层挑战越来越大。

  AI 时代,计算之外的存储架构挑战

  AI 时代,算力是产业发展的推力,要保证 AI 应用的持续高效运行,承载数据的存储系统也必须跟上时代的步伐。如何在有限资源投入下,充分发挥算法算力优势,最大限度地推动AI应用落地和释放数据价值,已经成为信息基础设施运营者们迫切需要解决的问题。其挑战主要体现在以下几个方面:

Windows 10 LTSC 2020正式版

360路由器安全

  1.如何接入和保存各类来源、各种格式的数据,真正做到“海纳百川”?

  在大量的AI场景之中,海量非结构化数据(图片、视频、音频、文档等)占据主流,单个文件通常很小,一般大小仅为几KB或几百KB,但文件数量极大。例如在金融领域,金融业务不仅产生大量原始票据扫描件,还有电子合同、签名数据、人脸识别数据等,数量甚至可以高达数十亿级规模;在自动驾驶领域,单个数据集可能就包含10万+数量的视频、图片及相应标准,近年来又增加了许多雷达数据,总数据量往往达到几百TB甚至数PB,这对于存储的吞吐量、延迟要求极高。

  在大多数企业中,数据通常以业务线为单位组织和管理,并且多数情况下,使用的是不同的中间件技术。随着云计算特别是容器技术的不断发展,大量基于物理机和虚拟机等传统IT架构的应用被迁移到云平台上,IT架构不断演变。如何有效整合新型IT架构与现有存储设备成为难题。

  2.机器学习开发,如何满足各阶段对数据的存储和管理要求?

  如下图所示,机器学习开发大致分为4个大的阶段:数据集中与归档、数据准备、模型训练、推理。不同阶段对底层存储的要求不同。

小鹏汽车付款方式

图1 机器学习开发的几个关键阶段

  数据集中与归档阶段,首先需要采集产品用户环境下不同来源的数据,包括外部来源的数据/数据集,并将数据转换为机器学习模型所需要的格式,这个阶段通常具有典型I/O密集的特征,要求高带宽和大容量。

  模型训练阶段,复杂的深度神经网络需要利用高度并行的技术来实现,这些模型需要大量经过清洗和标记的数据来训练,涉及到大量的随机、小文件读取操作,要求高带宽和低时延。

  推理阶段,所部署训练好的模型需要准实时的分析数据,要求低时延和高性能。

  3.如何打破存储系统性能瓶颈,充分发挥算力?

  为了加快模型训练速度,在机器学习开发中常常会使用一些特殊的硬件,如GPU。但是,由于存储或网络无法快速提供训练的数据,不能很好的服务上层的GPU等训练服务器,成为系统I/O瓶颈,导致昂贵的GPU无法充分发挥其价值。

  综合来看,随着企业AI应用的快速发展,传统存储架构成为制约瓶颈,性能、容量无法满足需求,管理和扩展复杂,存储效率问题凸显,很难胜任各种AI应用场景的要求。

  针对AI应用,如何在数据存储层面通过一套方案覆盖AI应用所有存储工作流,并且能够全面平衡性能、容量、扩展性和易用性?目前,通过新型存储软件来满足AI应用对存储的需求,成为越来越多高成长性企业的选择。

  杉岩数据MOSFS,为AI应用提速增效

  MOSFS,就是一款由杉岩数据为AI应用量身打造的智能分布式存储解决方案。

图2 MOSFS多源汇聚兼容多种存储

  首先,MOSFS的底座基于杉岩数据自研的海量分布式对象存储(MOS),支持通过横向扩展硬件节点线性增加系统容量与性能,满足EB级存储规模需求。系统提供File Ingestor、DB Ingestor等数据汇集功能,支持各种格式、各类来源的数据。同时MOSFS还支持对现有NAS存储、对象存储和HDFS存储的纳管,既充分利用客户既有投资,又满足客户的业务规模增长需求。

智慧经营小程序

万兴科技长沙总部

  其次,MOSFS不仅能够容纳汇聚各类数据,同时还可对上层应用提供标准POSIX接口,兼容Amazon S3协议接口,以及大数据服务接口,一套存储支持多种协议接口,满足AI训练各阶段对数据的访问诉求,支撑AI数据处理的全套流程,构建了一个安全、共享、高效存取的“数据湖”。

华为商城举办了一个促销活动

科大讯飞 电子阅读器

  最后,MOSFS针对AI训练的特性,开发了多级分布式缓存架构,将热点数据(如正在训练的数据集)缓存在高性能介质中,如NVMe SSD、MEM等,将非热点数据存储在大容量介质中,既保证了极致的响应时延,充分释放出GPU等特殊硬件的算力,横向扩展带来的近似线性增加的容量和性能又保障了高带宽和超大的容量。

  如下图所示,在国内某AI领域独角兽企业的选型测试过程中,通过采用杉岩数据MOSFS存储解决方案,相比采用传统分布式NAS存储,训练时长缩短了5倍,GPU利用率提升了近3个百分点。

打破存储性能瓶颈,杉岩数据为AI提速增效
打破存储性能瓶颈,杉岩数据为AI提速增效

注:训练计算节点相同,数据集ImageNet分别存于本地(4TB SATA SSD)、MOSFS(960GB SATA SSD + 4T*10 SATA HDD)和某商用分布式NAS(6TB SAS)时,进行AI训练,模型采用ResNet18。

  随着科技的进步,AI作为新一轮产业变革的核心驱动力,将催生新技术、新产品、新产业、新业态、新模式,实现社会生产力的整体提升。MOSFS作为杉岩数据针对AI、大数据等新型业务场景而打造的智能分布式存储解决方案,针对传统存储在新业务场景下的痛点,全新设计优化,实现了在性能、容量和扩展性之间的全面平衡,将助力企业进一步释放数据潜能,加速数字化转型,为AI在国民经济各行各业中更好的落地开花贡献力量。


返回网站首页

本文评论
《迷你世界》参展九州风华集 以沙盒文创助力文旅数字化转型
  《迷你世界》将于10月1日至7日参展落地在世界自然遗产,国家级5A景区龙虎山的“九州风华集”国风创意园游会。maxhub 云会议spacex星舰最终目标华为手机20000元  活动具...
日期:07-27
之家跌倒,易车吃饱,汽车互联网霸主已悄然易主
  2021年这个秋天,新闻太多。  市场新常态下,各类针对性的监管措施陆续落地。有人欢喜有人愁。  扬清去杂中,各行各业都逐步恢复到合理的节奏中去。当然,市场上也有利好的...
日期:07-28
RTX光追显卡_光追画质的极致享受 ,RTX独显加持带你领略华硕天选X的风采
  随着电脑性能的逐步提升,玩家对游戏画面也早就拥有了和几年前完全不同的高要求。尤其是RTX显卡开创的“实时光线追踪”功能,满足了无数玩家对于真实光线和绚丽画面的期待...
日期:05-28
openharmony组件开发大赛_2022 OpenHarmony组件大赛开启报名 构建繁荣开源社区
  2022年4月15日,2022 OpenHarmony组件大赛(下称“大赛”)报名通道正式开启,开发者登录OpenHarmony官网,点击【互动】,可在【活动】页面进入大赛活动页。本次大赛旨在鼓励开发...
日期:07-14
全国两化融合标委会启动数字化供应链等级评价与认定工作 京东工业品入选首批试点名单
  4月19日,全国两化融合标委会现代供应链标准工作组(TC573/WG11)2022年第一次全体成员大会在京召开。为深入贯彻《国家标准化发展纲要》, 加快数字化供应链标准研制和应用...
日期:07-14
医美行业前台_更美APP对底层医美行业进行深入了解,多项经营数据呈现上涨状态
  终端数据显示,自2021年5月中旬更美APP旗下的次卡活动上线以来,短短几个月内,累计支付订单就已经达到了数万单。最关键的是更美次卡订单的验证核销率达到了70%以上,这也充分...
日期:07-28
2022款三星The Serif画境电视体验:它凭借颜值让电视重回家中C位
  出生在80、90年代的人,往往对电视有着一种特别的坚持,或许是受到了老一辈人的影响,大部分的80、90后,都认为家中就是要有一台电视才像是家的样子。然而经历了互联网以及移动...
日期:10-18
亚信科技亮相2021中国移动全球合作伙伴大会,赋能百业,数智共赢!
  11月1日至3日,领先的软件产品、解决方案和服务提供商同时也是中国移动战略合作伙伴的亚信科技携5G、人工智能、数字化运营以及面向城市管理、政务、能源、交通、医疗等垂...
日期:07-26
桌面的高清影院,华为发布首款原色全面屏一体机HUAWEI MateStation X_华为最新全面屏手机
  2021年9月13日,华为发布首款旗舰一体机——HUAWEI MateStation X。作为华为智慧办公家族的新成员,HUAWEI MateStation X继承华为PC美学、创新和智慧基因的同时,带来全新的...
日期:07-28
实力见证!卓尔数科入选2021智能营销创新TOP50榜单_卓尔数科ceo
  9月3日,德本咨询、eNet研究院、互联网周刊联合发布了“2021智能营销创新TOP50排行榜”。基于Martech领域领先的技术实力与行业积淀,成立不到3年的卓尔数科成功后来居上,荣...
日期:07-28
官宣!小狗吸尘器第4代旗舰新品全球首发!「小狗吸尘器 官方网站」
  10月17日,国内专业吸尘器品牌小狗吸尘器发布了一则悬疑海报,透露其第4代旗舰新品即将全球首发。海报中,一个炫目的蓝圈高速旋转,充满了科技感和未来感。虽然海报并未露出更...
日期:10-21
2021世界公众科学素质促进大会“公众科学素质建设与绿色发展”专题论坛举办
  光明网讯12月3日,由中国科协主办、光明网承办的2021世界公众科学素质促进大会“公众科学素质建设与绿色发展”专题论坛在北京举办,七位知名中外专家齐聚一堂,探讨如何通过...
日期:07-25
“大型海上运输服务商”泛洲船务选择蓝凌合同、报账管理平台
  近日,江苏泛洲船务有限公司协同办公项目启动会成功召开。泛洲船务总经理陆义、蓝凌苏皖大区总经理沈爱华及项目组成员,共同出席本次会议。三星galaxynote10上市时间  泛...
日期:07-14
vivo X Fold + 折叠机官方渲染图曝光-手机数码-ITBear科技资讯
  9 月 20 日消息,近日 vivo X Fold 迭代产品 vivo X Fold + 折叠屏手机已经现身工信部,并且有消息称该机将于本月底发布。昨日 vivo 品牌副总裁,兼品牌与产品战略总经理贾...
日期:09-21
2022年618客厅投影仪推荐哪款好,当贝X3高亮白天能看值得选「当贝x3最佳投影距离」
  关于客厅投影仪推荐,小编已经分享很多了,由于客厅使用环境,在选择时注意看高亮度、抗光强特点的投影仪,所以在价位上推荐看中高端投影仪,建议选择价位5000-6000元左右家用客...
日期:07-14
投影仪高流明度有什么用_投影仪的流明度是不是越高越好,当贝X3超高流明度告诉你答案了
  投影仪界科普小达人驾到,最近浏览网络,发现网友搜索相关投影仪是流明度越高越好吗,投影仪的流明度是不是越高越好,投影仪流明越高是不是越亮,投影仪流明越大越亮吗等相关问题...
日期:07-30
小小一个码 打开四川农产品“安心”大市场
  “来,扫一下这个码,就能看到这盒桃子从播种到采摘的全过程。”6月17日上午,在四川省德阳市旌阳区的一个家庭农场内,负责人李本国拿着一盒自家产的水蜜桃,给远道而来的客人介...
日期:10-11
架构先行,斑马智行给汽车操作系统“留白”_什么是斑马智行互联系统
  根据IHS数据,全球车载OS销量规模2011年不到0.3亿套,2020年已突破1.3亿套,2011-2020年复合增速超过20%,市场扩容趋势显著。按照产品市场均价进行测算,目前全球车载OS市场...
日期:07-25
更美APP私域业务不断发展,AI技术或成医美行业另一块敲门砖「医美app的商业模式」
  之前有消息传出,自去年年启动以来,国内知名综合医美平台更美APP已经在私域业务方面实现了明显盈利。并且更美也凭借多年以来积累的经验和海量大数据,不断完善自己的平台和...
日期:07-28
关爱升级 中国移动超清视话助力老年人畅享数智生活
  今年世界电信日的主题为“面向老年人和实现健康老龄化的数字技术”。面对人口老龄化挑战,借助新一代信息通信技术推出针对老年人的产品和服务,帮助他们跨越数字“鸿沟”,共...
日期:10-21