大数据

“东数西算”力推全体系化产业升级

2025China.cn   2022年04月28日

  “东数西算”工程背后不仅仅是投资规模及其带来的产业发展机遇,更重要的是,统筹优化数据中心的能源使用效率,提高算力基础设施的有效利用率,以及通过架构创新来大幅提高系统性能,最终,实现产业互联网驱动之下的“算力普惠”。

  今年,“东数西算”工程已经成为热点议题。简单来说,“东数西算”就是把东部的算力需求调到西部来处理,和著名的南水北调、西电东送、西气东输是同一个系列的系统工程,分别解决水、电、气和算力的全国统一资源调配。尤其是今年1月,国家发展改革委、中央网信办、工业和信息化部、国家能源局四部委联合复函同意京津冀、长三角、粤港澳大湾区、成渝、贵州、甘肃、内蒙古和宁夏启动建设国家算力枢纽节点,被外界视作启动“东数西算”工程的标志性事件。甚至国内资本市场也开始针对大数据、云计算、算力建设、数据安全等细分领域展开布局。

  现今数字经济的创新发展正在进入一个至关重要的时间窗口,5G、物联网、人工智能,以及集成电路、移动电子设备、自动驾驶汽车等核心产业,正在经历新一轮的高增长。《“十四五”数字经济发展规划》指出,数字经济核心产业增加值占GDP的比重要从2020年的7.8%增长到2025年的10%。基于这一宏观产业背景,“东数西算”的系统性布局、推动进度和创新加速,将力推中国全体系化产业升级。

  未来几年,“东数西算”驱动之下的数字经济将会是这个时代的最大增量。各行各业将会与之深度融合,成为继过去10年的网络化、信息化时代的下一个典型新经济业态。

产业互联网是第一驱动

  “东数西算”绝对不是被突然构想出来的,而是有非常广泛甚至紧迫的产业需求推动,产业互联网则是“东数西算”的第一个驱动因素,产业互联网主要瞄准企业级服务。

  早在2016年,国内就出现一个观点——“中国的互联网进入下半场”。中国互联网的上半场是消费互联网(面向个人),下半场是产业互联网(面向企业)。当时已经出现了两个发展瓶颈:一是移动电子产品(主要是手机和可穿戴设备)的普及程度已经接近人口总量,To C 数字经济已经接近了产业发展的天花板;二是 C 端个人用户的线上停留时间(人均接近 6 个小时)也已经接近极限,数据和流量的增长空间非常有限。

  所以,全球主要科技公司主动开始转型,利润来源已经开始转向 To B 业务,比如原本主营 To C 的微软、亚马逊目前一半以上的利润来源是企业级服务,腾讯、百度、阿里巴巴等国内科技公司也在花更大的力气,在技术层面去推自己的企业级服务优势。既然产业互联网代表整个“下半场”的共识已经形成,就必须跟进,不能被甩出时代。

  消费互联网的核心逻辑是沉淀用户,稳定的流量和用户规模就是一切,但是产业互联网更强调费用、效率。有人把产业互联网的商业模式总结为:提效、降费、定价权。产业互联网的核心价值是帮助整个产业链的某个环节提升效率或是降低费用,比如,亚马逊的云计算服务帮助许多家欧美企业节省了IT设备费用。而定价权就是你在企业客户提升的效率里能够分到的利益。

  产业互联网的创新进取需要坚实的数字化基础设施,参考国内外的具体经验,企业的参与当然也非常重要,但国家引导更不可或缺。

  消费互联网或者 To C 数字经济的规模化发展有国家引导的作用。数据显示,截至2021年6月,我国移动数据流量平均资费降至3.22元/GB,用户月均移动数据使用量为12.62GB。根据第三方数据分析机构 Speedtest 公布的数据,中国固定宽带速率位居全球第8,移动宽带上网速率排名全球第9。不可否认,我们每个人都可以使用稳定、可靠、廉价的高速宽带移动通信,政府部门在其中起了非常重要的作用。进入产业互联网时代,在面对企业客户多样化的具体需求时,现有的基础设施能力还有很多欠缺,包括数字化连接成本,与通信网络、云计算能力的融合,乃至基础设施与应用的集成等方面,迫切需要对数字化基础设施进行产业升级。这也是推进“东数西算”战略工程面临的实际挑战。

背后的算力革命

  “东数西算”当中的“数”是数据,“算”是算力。具体而言,数字经济时代的三大核心要素就是数据、算力、算法。其中,数据是新的生产资料,算力是新的生产力,而算法是新的生产关系。三者相互促进——算法迭代需要海量数据的喂养,而处理爆炸式增长的数据需要算力的快速提升,算力的进步又能够促进更多的新应用、新算法。

  目前,三大要素中最紧张的,是算力。中国移动董事长杨杰说:“算力是继热力、电力之后,新的关键生产力。”用国家投入产出比模型来计算,在算力产业上每投入1元钱,可以带动3~4元的经济产出;算力规模每增长1%,可以撬动GDP增长0.2%。中国现在处于什么“算力水平”?《中国算力发展指数白皮书》指出,各国的算力规模和GDP水平强相关,美国占全球总算力的36%,中国占31%,日本占6%,欧洲作为一个整体占11%。算力规模排名前三的国家和GDP排名前三的国家是一致的。而且,目前全球算力处于加速增长的阶段。2016年至2020年,全球算力规模平均每年增长30%;而2020年至2025年,预计全球算力规模增速会再上一个台阶,达到每年增长50%。全球主要经济体都已经投入巨资加快算力布局,为了掌握未来的发展主动权,必须掌握先进算力。

  那么,从微观层面看,算力的需求端、供给端是怎样一个格局?

  算力需求端:产业(工业)互联网是主要需求来源

  比如,为什么现在的天气预报比原来准多了?过去只能告诉你“局部地区有雨”,现在你可以随时在手机上查看未来两小时精准的降雨云图。再比如,生物医药的研究上,为什么新药研发鉴定的周期可以从5000天缩短到100 天?这主要是算力提升的结果。

  真正的自动驾驶,没有算力的巨大进步完全不可能实现。因为一辆自动驾驶汽车的摄像头、雷达、导航和各种传感器每个小时产生的数据多达40TB(大概相当于500部智能手机的存储量),要用这些数据对自动驾驶的神经网络进行训练,仅仅是数据处理就需要巨大的算力支持。加上车路协同的计算需求,对算力的要求更是极其严苛。为什么近年特斯拉发布了自己研发的超级计算机?根本上就是在拼传感器和算法,还有拼算力。

  算力供给端:与碳中和规划要求艰难平衡

  算力如此重要,那么,算力产生的成本大不大?不得不说,构建算力场地和数据中心的成本是非常昂贵的,“计算”一直是一项高耗能的工作,尤其消耗电力。

  一个数据中心的运营成本中,电力成本往往占到50%以上。2020年,国内的数据中心用电量已经占到全社会总用电量的2.7%,总能耗超过2000亿千瓦时,相当于燃烧6000万吨煤排放1.6亿吨的二氧化碳的发电量。而《“十四五”数字经济发展规划》明确要求,发展数字经济需要的基础设施要符合同为国家战略的“碳中和”规划要求,不能因为自身的发展而破坏中国对世界的承诺。而且电力的传输问题也很多,以当前的技术水平,2000公里长距离输电的损耗是6%左右,这已经比较乐观了,且特高压输电线的建设成本十分惊人。

  此外,给数据中心服务器冷却降温,也需要消耗大量电力。微软、亚马逊、Facebook等都曾为了“物理降温”走了弯路,比如微软将“北方群岛”数据中心沉入海底,Facebook在瑞典北部靠近北极圈边缘的地方兴建数据中心,国内的阿里云、腾讯云、百度、华为等也在将数据中心向贵州、甘肃等整体气温偏低的地区迁移。综合以上因素,如何解决算力和数据中心的场地、能耗、分布问题,要做出很多艰难的平衡。哪怕没有“东数西算”工程,算力和数据中心“向低成本区域迁移”的趋势也难以阻挡。

探索最优算力结构

  如果说是国内不均衡的电力资源分布催生了“东数西算”工程,或者说是“东数西算”工程要破解这一轮次数字经济发展遇到的一大难题——如何在节能减排的约束框架下建设数字化基础设施,可能都不算理解“东数西算”布局背后的深谋远虑。其实,将大型和超大型数据中心布局到可再生能源等资源相对丰富的西部地区,统筹调度东西部数据中心算力需求与供给,是要实现全国算力、网络、数据、能源的协同联动。

  综合来看,未来数字经济的创新发展确实需要史无前例的算力支持,但更重要的,是算力结构的统筹优化。基于我国数字经济长远发展所需要的算力结构而言,可以将算力做出以下分类:

  一是基础算力,就是由基于CPU芯片的服务器提供的算力,主要用于基础通用计算,包括云计算、边缘计算等,都属于基础算力。二是智能算力,就是由基于GPU、FPGA、ASIC等AI芯片的加速计算平台提供的算力,主要用于人工智能的训练和推理计算,比如语音、图像和视频的处理。三是超算算力,就是由超级计算机提供的算力,主要用于尖端科学领域的计算,比如行星模拟、药物分子设计、基因分析等。

  现今的全球总算力当中,基础算力占73%,智能算力占25%,超算算力占2%。具体到中国算力资源,我们在基础算力和超算算力上分别位于全球第二和第三,而在智能算力上保持绝对领先优势,独占全球52%的份额。仅仅去年一年,全国就有20多个城市在建智算中心。显然,国内这个算力结构不算是“统筹优化”的,缺乏总体布局,信息孤岛的状态是伤害中国数字经济整体效率的。

  与此同时,国内的算力资源分布也很不均衡,整体利用效率并不理想。截至2022年初,国内已建成的数据中心为500万标准机架,整体算力达到130EFLOPS,并将以20%以上的速度持续增长。仅从数字上看,算力规模的增长非常乐观,但是北京、广东、上海的算力规模位列前三,浙江、广东、江苏等东部省份的算力增速超过60%,而内蒙古、贵州、甘肃等省份在算力规模和增速上比较有限。而且,目前国内数据中心平均利用率约为55%,地区需求的不均衡导致算力利用率的低下,算力需求大户(包括新能源车企、AI企业、互联网企业等)主要集中在东部沿海一线城市和准一线城市。扭转和改变这种需求不均衡导致的低效状况,无疑是一个循序渐进的系统性工程,“东数西算”本质上是一项长期规划。

  《全国一体化大数据中心协同创新体系算力枢纽实施方案》中明确提出,布局建设全国一体化算力网络国家枢纽节点,加快实施“东数西算”工程,国家枢纽节点之间进一步打通网络传输通道,加强云算力服务、数据流通、数据应用、安全保障等方面的探索实践。因此,“东数西算”工程最重要的实施原则,就是“加强统筹”,强调“加强数据中心统筹规划和规范管理,开展数据中心、网络、土地、用能、水、电等方面的政策协同,促进全国范围数据中心合理布局、有序发展。”

  所以,“东数西算”工程背后不仅仅是多大量级的投资规模,及其带来的产业发展机遇,更重要的是,统筹优化数据中心的能源使用效率,提高算力基础设施的有效利用率,以及通过架构创新来大幅提高系统性能,最终,实现产业互联网驱动之下的“算力普惠”。

数字化产业链变革

  “东数西算”无疑会带来数字化产业链的巨大变革,可以从资源分布、技术架构、前瞻创新三个角度来进行理解。

  资源分布:基于“数据的温度”来配置算力资源

  根据“东数西算”工程的具体规划,国家将在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并在张家口、芜湖、韶关等地建设10个国家数据中心集群。其中,8个枢纽节点定位不同:京津冀地区、长三角地区、粤港澳大湾区、成渝地区作为经济最发达的核心城市群,地区用户规模较大、应用需求强烈,属于“服务内部”的一类;而内蒙古、贵州、甘肃、宁夏都在西部欠发达地区,当地的算力需求不大,作为枢纽节点“对外输出算力”。

  而且基于通信原理的常识判断,物理距离一定会带来通信时延,西部数据中心向东部输送算力,最大的问题就在于时延。因此,中国工程院院士邬贺铨认为:“受限于网络长距离传输造成的时延,以及相关配套设施等因素影响,一些后台加工、离线分析、存储备份等对网络要求不高的业务,可率先向西部转移。一些对网络要求较高的业务,比如工业互联网、灾害预警、远程医疗、人工智能推理等,可以在京津冀、长三角、粤港澳大湾区等东部枢纽布局,枢纽内部要重点推动数据中心从一线城市向周边转移。”

  依据网络时延和访问频率不同,可将不同算力要求的数据处理分为两类:一类是访问频率低的冷数据,这类数据西部数据中心会承接得更多,诸如后台加工、离线分析、冷数据存储备份等对时延不敏感的网络应用。比较典型的就是软件系统中的日志分析、每日每月报表分析、用户千人千面算法分析、视频渲染等应用。尽管增加了数据传输的成本,但西部地区便宜的电价、地价等优势,足可以抵消数据传输增加的硬性成本。

  另一类是访问频率高的热数据,这类数据东部数据中心会承接得更多,诸如自动驾驶(车联网)、工业制造(机器人)、远程医疗、金融证券、灾害预警等对时延非常敏感的网络应用,一定会在所在地或距离所在地最近的数据中心完成。上述应用的价值已经不能只从性价比上考虑,而是产业数字化转型的主要方向和可以预见的经济增长动力,相关的产业带动效应和扩散效应不可低估。

  技术架构:推动分布式IT架构创新发展

  “东数西算”具体的算力资源配置和运用,可以很大程度上刺激国内软硬件企业的技术创新。有人认为,数据中心的一些利润较高的软件和硬件掌握在国外企业手中,参与其中的很多国内企业没有那么高的利润率。这可能是一个误解。“东数西算”非常有利于分布式IT架构的创新发展。

  比如,目前所有的传统行业中,银行业的数字化程度是最高的。银行时刻要处理大量数字,巨大的数据量和吞吐量需要银行业的IT架构由集中式转向分布式。具体而言,就是把一台集中式服务器替换为多台中小型服务器,每一台服务器不负责全部功能,而是只负责一个模块,联合起来的多台服务器总体支撑整个系统。

  银行业务的系统架构从集中式转向分布式,数据结构、算力分配、资源调度的方式都要改,相当于代码的底层逻辑变了。例如,一个简单业务场景转账,集中式架构中,账户、转账、账单等模块都在同一个系统后台,全程数据也都存在同一个数据库里。但在分布式架构中,一个系统被拆分为多个后台系统,数据库也被拆分为多个数据库,同样的业务要调用更多的模块,就需要通过更改底层代码逻辑来实现。由此带来的产业机会是,上层的各个业务系统,比如核心交易系统、信贷管理系统都要进行相应的改造。

  前瞻创新:产业规划牵引技术发展

  可以看到,“东数西算”的相关政策性文件中,非常强调对技术的高标准和特殊要求,尤其在时延方面,提出数据中心集群端到端单向网络时延原则上在20毫秒范围内;城市内部数据中心端到端单向网络时延原则上在10毫秒范围内。

  理论上看,只有基础设施具备提供超低时延的能力(数据的快速获取、算法的快速生成、及时响应变化等),才敢把数据中心放在远端。可是,眼下的成熟技术和传统的建设方式确实难以达到这些指标的要求。超远距离传输会有时延,跨网络、跨运营主体的使用场景还会造成更大的时延,比如,数据从深圳的华为云数据中心传动到位于甘肃的阿里云数据中心,中间是电信运营商提供的传输网络,端到端时延的达标如何保证?

  然而,产业规划必定是具有前瞻性的,技术进步的因素需要被预先考虑,更要通过产业规划来牵引技术的创新突破。况且,规划中的指标是基于数据中心使用者的需求反推形成的,如果相关技术障碍不能得到解决,未来产业(工业)互联网更大范围的商用,甚至 To B 数字经济多个核心产业的平稳发展,都会遇到不小阻力。

  长远看来,“东数西算”工程将是一个更大时间尺度的整体性系统化工程,期间还有很多的现实问题需要解决,不能太过在意短期的产业红利。但是,可以肯定的是,“东数西算”将会力推中国全体系化产业升级,统筹优化国内经济结构和算力布局,推动产业数字化和数字产业化的转型,催生出新技术、新产业、新业态和新模式。

  周倩 本刊特约撰稿人

  本文发表于《中国工业和信息化》杂志2022年4月刊总第44期

(转载)

标签:东数西算 我要反馈 
ABB电机与发电机拼图挑战赛
西克
2023世界人工智能大会专题
专题报道
2024汉诺威工业博览会专题
2024汉诺威工业博览会专题

2024 汉诺威工业博览会将于4月22 - 26日在德国汉诺威展览中心举行。作为全球首屈一指的工业贸易展览会,本届展览会... [更多]

第三届EESA储能展
第三届EESA储能展

EESA储能展是由储能领跑者联盟主办的品牌展会,创办至今已经连续举办了两届。为加快适应储能规模化发展的步伐,促进储能行业... [更多]

2023全景工博会 | 直播探馆 · 全景解读
2023全景工博会 | 直播探馆 · 全景解读

2023年9月19日-23日,第二十三届中国国际工业博览会将于国家会展中心(上海)隆重举行。本届工博会将以“碳循新工业、... [更多]