在日前举办的2023中国国际大数据产业博览会上,“东数西算”成为关注焦点。“东数西算”工程启动一年多,数据要素充分激活,算力存力需求激增。据统计,我国算力总规模达到180EFLOPS,位居全球第二位,存力规模超过1000EB;在用数据库标准机架的规模超过650万架,服务器超过了2000万台。算力基础设施的梯次供给体系已初步形成,“算、存、运”一体化应用体系正在逐步构建。
“东数西算”工程从系统布局进入全面建设阶段。国家互联网信息办公室近日发布的《数字中国发展报告(2022年)》显示,2022年,京津冀等8个国家算力枢纽建设进入深化实施阶段,新开工数据中心项目超60个。西部数据中心占比稳步提高,“东数西算”干线光纤网络和兰州等中西部国家级互联网骨干直联点加快建设,推动全国算力结构不断优化。
“算力是数字经济的核心生产力。算力中心基建化,保障优质算力服务高效供给,已成为发展数字经济的必要条件之一。算力中心之于数字经济,就像工业时代的电厂。算力中心在承载算力的生产、调度和供应过程中,为数据的加工、处理、挖掘、分析提供源源不断的动力源。”浪潮信息高级副总裁刘军说。
(资料图)
“优化数据中心建设布局,推动算力、算法、数据、应用资源集约化和服务化创新,对深化政企协同、行业协同、区域协同,全面支撑各行业数字化升级和产业数字化转型具有重要意义。”刘军认为,我国数据中心布局存在一定程度的供需失衡问题,东部地区应用需求大,但能耗指标紧张、电力成本高,大规模发展数据中心难度和局限性大;一些西部地区可再生能源丰富,气候适宜,但存在网络带宽小、跨省数据传输费用高等问题。通过构建类似能源领域“西气东输”的“东数西算”工程,把东部的数据流动到西部计算、存储,能够改善我国区域新型数字基础设施发展不平衡的布局。
中国联通董事长刘烈宏表示,“东数西算”作为解决东部算力供给难、促进西部算力利用的重量级工程,在有为政府和有效市场的共同作用下,取得了一系列积极成效。
当前“东数西算”更多还表现为“东数西存”。赛迪顾问股份有限公司业务总监高丹坦言,各枢纽节点推动数据中心建设步伐加快,带动了我国算力水平有效提升。但与之不相匹配的是,存力发展相对滞后,一定程度上限制了我国高质量算力网络体系的建设。
随着新市场容量迅速增长,存储供给量严重不足。“‘东数西算’工程推动了东西部地区数据中心对冷热数据的专业化分工处理。由于数据的价值挖掘以存储为前提,需求巨大,考虑到上架率等限制了存储的实际供给水平,到2025年,我国将有超过420EB的巨大存储缺口亟待补充。”高丹说。
华中科技大学武汉光电国家研究中心研究员吴非表示,“东数”要想更好实现“西算”,算力是中心,存储则是根基,海量数据要想算得好,得先存得下、读得快。
在“东数西算”工程中,西部并非只承接存储功能,进行简单的数据备份。随着中西部地区数字经济潜力不断释放,带动了针对AI训练需求的“东数西训”以及用于影视、游戏后期制作环节的“东数西渲”等新业态,同时也对存储性能提出了更高要求。
“目前计算速度已达纳秒级,但存储I/O速度最快只能达到微秒级,存算均衡尚有较大发展空间。”高丹说。
新需求、新应用对底层的存力平台提出了更高要求,既要海量存储更安全、更可靠,又要实现数据跨区域灵活流动,还要支持融合应用场景,并且符合绿色低碳存储。“东数西算”打通了多元数字业务场景,激发了丰富的应用需求,要实现东西部数据的无障碍无延迟流通,扩大软硬件及应用生态,更需要推动融合、智能的一体化存力布局。
“只有实现东西部存力一体化,才能应对‘东数西算’海量丰富的存储新需求。”中科曙光存储产品事业部副总经理张新凤介绍,目前曙光建立了海量自研分布式存储集群,同时发挥存储全栈技术能力,布局存力一体化,将存储和计算资源进行整合,实现“东数西算”存力统筹调度。
中国计算机行业协会信息存储与安全专委会秘书长阳小珊认为,数据存储首先要安全合规,要降低开源软件依赖,提高存储技术自研能力。
“存算融合是解决算力瓶颈的有效手段。”吴非介绍,随着“东数西算”跨域应用平台规模不断扩大,计算和存储节点数也将不断增加。然而,采用存算传分离的结构会导致传输的瓶颈变大,限制了高质量算力发挥,进而导致存力、算力和传力变得相对薄弱。要通过协同调度和统一管理来提高存力、算力和传力的整体效能。
高丹表示,存储能力与计算能力相互匹配,可以实现成本、赋能效果和能耗的大幅优化,并推动各领域供应商重视合作,打通行业壁垒,有助于打造良好的产业生态,提升我国数据中心行业整体竞争实力。