少前云图计划中立函数怎么选 中立函数选择攻略,少前云图计划讲解
计算机行业算力网络深度报告:全国一体化算力网络建设加速
(报告出品方:东方证券)
一、全国一体化算力网络建设逐步深化,算力有望成 为普惠大众的基础资源
1.1 AI 与政策推动,全国一体化算力网络有望加速
1.1.1 国家政策持续推动全国一体化算力网络建设
全国一体化算力网络建设相关政策有望持续出台。算力网络已成为国家重点发展领域之一,利好 政策持续出台,未来行业发展前景广阔。2020 年 12 月,《关于加快构建全国一体化大数据中心 协同创新体系的指导意见》首次提出全国范围内数据中心形成布局合理、绿色集约的一体化格局。 2021 年 7 月,工信部发布《新型数据中心发展三年行动计划(2021-2023 年)》,计划建设全 国一体化算力网络。2022 年 2 月,发改委发布《国家发展改革委等部门关于同意京津冀地区启 动建设全国一体化算力网络国家枢纽节点的复函》,标志着 “东数西算”工程正式启动,我国算 力网络发展扬帆起航。2023 年 2 月,中共中央、国务院发布《数字中国建设整体布局规划》, 将数字基础设施列为数字中国建设的两大底座之一。2023 年 4 月 17 日,科技部启动国家超算互 联网工作,成立了国家超算互联网联合体。预计到 2025 年,国家超算互联网将形成总体布局, 成为数字中国建设的“高速路”。我们认为,全国一体化算力网络建设相关政策有望持续出台。
1.1.2 东数西算”拉开全国一体化算力网络序幕
2022 年 2 月,作为算网建设开始的“东数西算”正式启动。2022 年 2 月 17 日,国家发改 委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤 港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数 西算”工程正式全面启动。
1.1.3 AI 浪潮推升算力需求,实现智能技术规模化需首要实现算力普惠
机器学习进入大模型时代,ChatGPT 等通用大模型的训练迭代极大拉动对智能算力的需求。模 型成功部署后,推理也将需要大量智能算力做支撑。从模型训练角度来说,据 J. Sevilla 等发布的 文章《Compute Trends Across Three Eras of Machine Learning," 2022 International Joint Conference on Neural Networks (IJCNN)》,机器学习的训练计算大概可以分为三个时期。第一 个时期为 2012 年之前,训练算力大致遵循摩尔定律,约每 20 个月翻一番。而进入深度学习时代, 算力翻倍的速度加速至 5-6 个月。2015-2016 年左右开启了大模型时代,在这个时期,计算量增 长变慢,翻倍时间约为 10 个月。但整体的训练计算量比深度学习时代的系统大 2 到 3 个数量级 (OOM)。 从 2022 年底,随着 ChatGPT 成功带来的新一代 AI 浪潮,国内外 Bert、GPT4、文心 一言等通用大模型相继发布。这些大模型的训练需要千亿、甚至万亿级参数,以及上千 GB 的高 质量数据,大模型的训练迭代将极大地拉动了智能算力的需求。另外,日后随着模型的成熟落地 和推广,模型推理所需的智能算力也将逐渐增加,占比不断提高。
除了通用大模型的训练,垂直行业大模型的训练、基于通用大模型的微调的行业应用也需要大量 的智能算力做支撑。垂直行业的大模型训练也需要大量的智能算力,另外,基于大模型的多场景 应用也不断拓展。AI 渗透千行百业,拉动智能算力规模高速增长。2022 年,各行各业的 AI 应用 渗透度都呈不断加深的态势,尤其是在金融、电信、制造以及医疗领域,为实现业务增长、保持 强大竞争力、从而占据更大的市场份额,企业纷纷入局 AI 领域,通过新技术提升传统业务用户体 验,人工智能应用增长迅速。据 IDC 和浪潮信息联合发布的《2022-2023 中国人工智能计算力发 展评估报告》,预计到 2023 年年底,中国将有 50%的制造业供应链环节采用人工智能技术实现 业务体验提升。在未来,随着 AI 技术对传统行业赋能作用日益凸显,催生出更大智算需求成为必 然。
AI 应用存在此长尾效应,实现规模化首要实现算力普惠。孙凝晖院士在演讲中提出,AIGC 带来 人工智能产业的爆发,而智能技术的规模化应用具有典型长尾问题,即具备强 AI 能力的强势部门 (网安、九院九所和气象局等)、科研院校与大中企业只占据算力需求主体的大约 20%,另外 80% 则均为中小微企业,这类主体受限于公司规模与预算,往往难以接入算力资源、或受限于算力的 高昂价格,从而难以在 AI 时代浪潮中获得发展红利。因此,要实现智能技术的规模化应用,让人 工智能产业既“叫好”也“叫座”,需要大量便宜、易用的智能算力,让中小微企业也能方便、 便宜地使用算力。因此实现算力普惠,一方面可以支持先进科技发展,赋能更多产业 AI 化,同时 还能让 AI 走入千家万户,达成 AI 普惠。
1.2 绿色、普惠、赋能高质量发展,算力网络建设势在必行
1.2.1 建设算网可充分利用西部资源与气候条件,促进算力绿色环保化
采取清洁能源供电、自然降温等方法是数据中心减少碳排放的关键。从供给侧来说,数据中心可 以通过采用节能技术,使用清洁能源等方式改善碳排放过量等问题。另一方面,用自然方式降温 辅助制冷能够有效减少数据中心耗能。各大云厂商为了服务器降温也各显神通,如腾讯在贵安的 隧洞内建立了一个绿色高效的灾备数据中心,微软曾在将数据中心投放到苏格兰附近的北海中, 海兰信打造海底数据中心。 我国西部地区具备充沛清洁能源和适宜气候地理条件,建立全国一体化算网可供给环保绿色的算 力资源。我国中西部地区具备丰富的风电、光伏、水电等清洁能源,显著减少碳排放。同时,西 部地区适宜的气候与地理条件还为散热、制冷等环节提供了天然环境,以乌兰察布市为例,只有 4.3 摄氏度的年平均气温意味着每年有近 10 个月可以不使用设备,而是利用环境实现自然冷却,更加适合数据中心的建设,利于达成“双碳”目标。因此,建立全国一体化算力网络,可将算力 资源的生产重心放在气候适宜的西部地区,充分利用其丰富的清洁资源和适宜的气候条件,助力 实现“双碳”目标,在保护环境的前提下实现算力快速发展。
1.2.2 助力解决东西部供需不平衡问题,降低算力价格
算网建设可有效解决算力东西供需不平衡的现状,同时可利用低廉电价降低算力价格。目前,我 国东西部算力供需失衡,数字经济发展和数据资源的产生主要集聚在我国的东部地区,而西部地 区则有着较为充沛的土地、能源资源。然而,算力需求大的东部地区土地、能源等资源紧张,而 资源充裕的西部地区可提供绿色低价的算力资源,具备发展数据中心、承接东部算力需求的潜力。 例如我国上海等东部地区信息产业高度发达,是计算需求最旺盛的地区,然而其较高的电费和土 地价格导致东部地区算力成本高昂。贵州、内蒙等中西部算力需求较低,但其较低的电力成本和 土地价格更适合算力基础设施的建设。而通过建设全国一体化算力网络,可以将东部地区算力需 求有序引导到西部,优化数据中心建设布局、推动区域协调发展,让西部城市也可享受算力发展 带来的机会与红利。
1.2.3 提供普惠算力,赋能科技与产业快速发展
建立算力网络,发挥“乘数效应”助力经济产业发展。无论是在传统行业、还是在数据重要性日 益凸显下催生出的新兴行业中,算力网络的建立都能在产业发展中起到“催化剂”的作用。在传统行业领域中,随着数字经济快速发展,数字化转型成为不可逆转的时代趋势,算力网络提供随 取随用的算力资源,与其他生产要素协同推进产业快速发展,展现出的乘数效应使其成为产业发 展的“放大器”。同时算力基础设施化为新型智能产业高速发展提供了基础资源,有效降低智能 计算相关行业的运营成本,自动驾驶、智慧城市等智算应用场景转为现实的可能性得到展现,为 更多先进技术的商业化落地提供良好的发展环境,国家经济发展被注入了新的蓬勃活力。算力网 络不仅助力新老产业高速发展,同时在其从理论走向现实、进而实现商业化落地的过程中,也催 生了新兴技术的诞生和迭代,有效拓展智能计算技术领域,赋予数字行业发展更多可能性。 算力有望成为基础资源,普惠中小企业及个人。在算力无法流通、成本昂贵的情况下,资源垄断 自然形成,算力资源被大量掌控在大型企业当中。建立算力资源基础设施,达到随取随用的同时 降低算力资本,不仅仅能够赋能政府的公共服务,同时可以使中小企业、乃至个人都受益于智能 化,打破“强者恒强”的算力格局。 美国推行《国家信息基础设施行动计划》为三十年科技发展奠定基础。中国推动算力网络,有望 在新时代浪潮中夺得先机。美国于 1993 年宣布实施《国家信息基础设施行动计划》,建立了全 球的信息标准,为美国科技全方位的蓬勃发展奠定了基础。而现在,我国把握时代发展大方向, 在算力网络方面率先发力,积极探索路线、制定纲领与标准,借助举国体制优势持续推进。算力 网络的建设为科学计算、航空航天、军工等行业提供发展动力,使中国在新时代浪潮中夺得先机。
1.3 算力网络:一点接入,即取即用
1.3.1 算力网络的建设赋能算力作为基础资源普惠大众
算力要成为像水、电一样的公共资源,需要由算力网络扮演路、桥的角色。算力应该是水、电一 样普惠大众、随取随用的公共基础资源,早在 1961 年,美国教授 John McCarthy 就将算力类比 为电话服务,可以随取随用。到了 1990 年,美国 Ian Foster 教授将算力与电力类比,提出算力 是一种公共服务。今天,我们来到了数字经济时代,算力将成为水、电一样普惠大众、随取随用 的公共基础资源,为社会高效发展赋能,最终实现“网络无所不达、算力无所不在、智能无所不 及”的社会愿景。而为实现这一愿景,需通过算网来整合并调度各方算力资源,并分配给个需求 方。
1.3.2 计算场景愈加丰富,需求多元化对算网架构提出新要求
计算场景愈发丰富,不同应用对算力精度、延迟、带宽等提出不同需求。算力作为逻辑资源,本 身与水电等标准化资源相比就更加复杂、具备更多维度,而技术的发展催生了丰富的计算场景, 不同的行业、应用场景对算力更提出了不同的需求,进一步增加了构建网络的复杂度。例如,天 体物理、气象研究、航空航天等高精尖科研领域需要能够支持复杂运算、性能高的双精度算力, 即超算算力。而无人驾驶、智慧交通等 AI 主要用于处理语音、图片或视频等,单精度、半精度、 甚至整型的计算即可满足应用需要。 而一些产业数字化的场景对精度要求不高,通用算力(基础 算力)即可满足需求。除了算力精度,不同的应用场景对带宽和延时也提出了不同的需求。例如, 需要实时渲染的游戏、自动驾驶决策、远程手术、工业控制等领域对延迟的要求非常高,而模型 训练等场景则对延迟没有很高要求。同时,基于 AR、VR 等渲染场景,模型训练、超算类等场景 对大带宽的需求较高,工控、物联网采集等则对带宽要求不高。
1.3.3 算力网络:云边端节点全连接,动态感知、灵活调度
算力网络:云边端节点全连接,动态感知、灵活调度。算力网络是通过新型网络技术将云、边、 端等分散的算力节点连接起来,动态实时感知算力资源状态,根据业务需求进行统筹分配和调度。 不同的业务需要的算力种类、带宽、延时不同,然而在算力网络中用户无需关心网络中计算资源 的位置和部署状态。算力网络可以实时感知客户的算力需求,并根据算力资源池的情况,给客户 自动调配符合其需求的最优算力,获取算力将像获取水、电一样便捷、价低。
二、各地政策频频出台,聚焦算力供给、算力调度、 中小企业共建、算电一体四大方向
2.1 各地发布人工智能产业发展政策,算力体系建设最关键
多地发布政策推动人工智能发展,算力屡屡成为榜上第一条。大模型时代到来,各地纷纷印发促 进人工智能产业发展的相关政策。近期,北京、上海、深圳、杭州等地发布推进人工智能产业发 展的相关政策,算力体系建设最为关键,成为多个政策的第一条: 2023 年 5 月,北京印发《北京市促进通用人工智能创新发展的若干措施》,第一条强调提 升算力资源统筹供给能力。 2023 年 5 月,北京印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案 (2023-2025 年)》。重点强调推动国产替代以及算力资源并网互联。 2023 年 5 月,深圳印发《深圳市加快推动人工智能高质量发展高水平应用行动方案 (2023—2024 年)》的通知。第一条为强化智能算力集群供给。 2023 年 6 月,杭州发布《关于加快推进人工智能产业创新发展的实施意见(征求意见 稿)》。该意见中,主要任务的第一条即为建设多元融合算力支撑体系。 2022 年 9 月,上海发布《上海市促进人工智能产业发展条例》,该条例中,基本要素与科 技创新的第一条即为加强公共算力基础设施建设,推动绿色低碳发展。
响应全国算网一体化布局,各地算网政策纷纷出台。除了人工智能产业发展相关的政策,各地还 针对算力出台了相关政策规划,促进全国一体化算力网络的建设。 2023 年 4 月,上海发布《上海市推进算力资源统一调度指导意见》,强调加强全市算力资 源统筹、调度和共享。 2023 年 3 月,贵州印发《面向全国的算力保障基地建设规划的通知(2023-2025)》,强 调加快打造国家算力网。 2023 年 1 月,成都市发布《成都市围绕超算智算加快算力产业发展的政策措施》,强调提 升超算适配性、加快构建智算体系以及加快云计算中心提档升级。
2.2 算力体系建设聚焦:供给、调度、中小企业共建、算电一 体
在众多地方政策中,主要聚焦于公共算力平台建设、算力调度中心建设、鼓励中小企业参与共建、 算电一体四个方面。 1. 加强智能算力供给:推动算力基础设施建设,以智能算力供给为主,且需满足绿色低碳要求。 同时,一些文件对芯片、操作系统、开源深度学习框架的国产化提出要求。 2. 算力资源统筹调度:推动算力标准化和服务化,统筹算力资源,实现算网统一管理、编排和 调度。 3. 鼓励中小企业、第三方云厂商积极参与算网建设、接入算网:鼓励中小企业参与算网共建, 不仅可有效避免“帝国制”的垄断运营,同时也可使算力网络建设惠及更宽领域、带动产业健康 发展。 4. 推动“算电一体”新型供能体系建设,助力算网升级,赋能双碳目标: 鼓励超算中心、智算 中心、新型数据中心等因地制宜地配置储能设施,以提升电力自平衡能力,进一步推动了算力基 础设施与储能设施的融合发展。 下面四章,我们将从这四个重点发展方向进行论述,梳理相关政策、分析相关产业发展现状。
三、算力供给:智算供给是关键,国产化是发展重点
3.1 计算场景愈发丰富,智能算力赋能科技、经济发展
算力可分为通用算力、超算算力与智算算力三种,分别应用在不同场景中。通用算力主要来源于 通用处理器 CPU,应用场景非常广泛,可用于对精度要求不高的数字化场景中。而超算算力则主 要支持天体物理、气象研究、航空航天等高精尖科研领域。这些场景运算量大,且对精度要求高 (双精度算力)。智算算力则主要应用于 AI 场景中。对于 AI 模型训练及推理来说,处理文字、 语音、图片或视频等需求较大,单精度、半精度、甚至整型的计算即可满足应用需要。一般来说, 相比于模型训练,模型推理所需的算力精度较低,很多场景 Int8 即可满足需要。
据国家信息中心,未来 80%的场景都将基于人工智能,所需算力资源将主要由智算中心提供。AI 大模型已经成为国家、企业和科研院所积极发展、重点投入的大方向。而普惠大众的智能算力就 是 AI 发展的基础资源,智算中心正是实现这些科技创新的源泉。
3.2 我国人均智能算力不足,智算规模有望持续上涨
从智能算力总额来看,美、中处于领先地位。从人均智能算力的角度,中国仍处于全球中等水平。 据《中国算力指数发展白皮书(2022)》,美、中的智能算力处于全球领先地位,分别占全球比 重的 45%和 28%。然而从人均算力的高低来衡量,美国、英国、德国等国家的人均算力普遍高于 1000GFlops,而我国的人均算力处于中等水平。据 IMD 研究发现,人均算力的水平与一国 的智能化水平高度相关,我国积极发展智能算力、打造智算中心是打造国际竞争力、发展综合国 力的关键。
中国智能算力规模有望持续快速增长, 2021-2026 年期间,预计年复合增长率达到 52.3%。据 IDC 数据与预测,2021 年中国智能算力规模达到 155.2EFLOPS,并在之后的几年始终保持稳健增长 态势,预计到 2026 年将突破进入每秒十万亿亿次浮点计算级别,智能算力实现 1,271.4EFLOPS 的庞大规模,2021-2026 年期间,预计年复合增长率达到 52.3%。
中国 AI 芯片市场将保持高速增长。2022 年,中国的 AI 芯片市场规模约 385 亿元。随着 AI 发展 以及智算中心建设浪潮,该市场预计将保持高增长趋势。据艾瑞咨询测算,到 2027 年,中国的 AI 芯片市场规模预计将达到 2164 亿元。
2022 年,我国智能算力占比已达到 60%,预计于 2027 年达到 88%。我国智能算力占比连年快速 拉升。据头豹研究院,目前已从 2018 年的 12%快速增长至 2022 年的 60%,超过通用算力并且 持续保持稳健增长态势,预计智能算力的占比将在 2023 年达到 70%,在 2027 年达到 88%。因 此,建立智算平台成为大势所趋,AI 应用迫切呼唤充沛的算力养料。
3.3 各地兴建公共算力平台,设立智能算力规模目标
政策引导人工智能公共算力平台建设、提供可靠高效算力,国产化与普惠是发展重点。2022 年 6 月,科技部办印发《国家新一代人工智能公共算力开放创新平台建设指引(试行)》(下简称《指 引》),为各地建设公共算力平台提供指引。《指引》中对平台的国产化程度、算力规模与解决 方案等方面均进行要求,自主研发芯片所提供的算力标称值占比不低于 60%,并优先使用国产开 发框架,使用率不低于 60%。此外,在算力方面,对 AI 训练和推理的常用规格进行要求,16 位 浮点 (FP16)性能应达到 400PFLOPS,32 位浮点 (FP32)性能应达到 200PFLOPS,16 位整型 (INT16)性能应达到 400POPS。同时,《指引》针对如今大模型训练需求的井喷需求,同时对环 境承载能力提出要求,提出平台应配置成熟易用的人工智能全栈运行环境,能够运行千亿级参数 的预训练模型。
各地政策部署公共算力平台建设,致力实现大规模算力供应。在众多地方政策中,均明确提出要 建立公共算力平台,政策不仅聚焦于平台的新增或改建,同时也对算力规模、带宽、基站数等质 量指标提出要求,例如贵州在文件中对每年的算力建设目标都进行了细致部署,从能力指标、质 量指标、结构指标、通道指标、产业指标五个维度进行考核,促进规模与质量协调发展,为未来 工作提供明确指引,从而提供大规模、高质量的算力,满足人工智能与大模型高速发展所催生出 的澎湃需求。
3.4 华为、曙光深度参与各地智算中心建设
30+城市落地 40+智算中心。目前,各地智算中心如雨后春笋快速建立,全国各省市均有所布局, 《智能计算中心创新发展指南》显示,当前我国超过 30 个城市正在建设或提出建设智算中心,已 建成的、在建中的和规划的中心数量已逾 40 家。 各地智算中心建设分两种模式,大多数采取“政府主导+企业承建”模式。智算中心主要分为 “企业自建模式”与“政府主导+企业承建”模式。智算中心具有高投入、对地方经济发展具有 高影响等特点,因此 30 多座城市的智算中心建设项目大多数由政府主导、且紧密配合“东数西算” 等建设指引的推进节奏,用于支持地方产业 AI 化、AI 产业化以及智能化治理。同时,政府结合业 务需求与企业规模等因素进行综合考量、选取合适的承建单位。 中科曙光、华为、百度、商汤、腾讯、阿里、浪潮信息和寒武纪等众多厂商参与建设。华为由于 拥有雄厚财务基础、技术水平和全体系昇腾智算框架,成为众多智算中心的供应商,承建中心数 量超 20 家。此外,中科曙光率先提出 5A 级智算中心解决方案,其承建的智算中心在湖北、山东、 江苏、安徽、浙江、广东和湖南等多地生根。寒武纪也不断深入参与进智算中心建设中,接连中 标南京智能计算中心一期与二期项目,总预算金额超八亿。浪潮、天数智芯、燧源等企业也纷纷 加入智算公共平台建设。
3.4.1 曙光、海光性能生态俱佳,参建、运营多地智算中心
中科曙光致力打造新型智能算力基础设施,建立“5A级”核心优势。中科曙光作为新一代人工智 能算力平台参与方,提出要打造具备“开放、融合、绿色、普惠、服务” 能力的“5A 级”智算 基础设施,对智算中心的多方面性能提出了具体要求。中科曙光“5A 级”智算中心为基础设施建 设提供可参考的高质量范本,强力推动未来智算产业生态开放和协同发展、迈入发展快车道。
曙光形成“芯-端-云”全产业链布局,参与七省智算中心建设,承担多地智算中心运营。中科曙 光作为核心信息基础设施领军企业,凭借多年在计算领域的技术积淀,业已完成了“芯—端—云” 的全产业链布局,公司先后承建“巢湖明月”、“海之心”和芜湖智算中心等项目,已在湖北、 山东、江苏、安徽、浙江、广东和湖南进行落地或规划。其中,合肥、长沙等多地的中心运营由 曙光承担。经过多个智算中心项目实践,中科曙光已形成了成熟可行的智算中心落地方案,未来 实现更广地域落地值得期待。
曙光子公司海光信息 DCU(GPGPU)可用于大模型训练,参与智算中心建设。公司将加大 DCU 研发投入,持续迭代。海光信息除了 CPU 产品实力出众外,其 DCU 产品也性能、生态优异。公 司 DCU 第一代产品深算一号于 2022 年实现了在大数据处理、人工智能、商业计算等领域的商业 化应用,可以用于大模型的训练,主要客户是智算中心等“新基建”项目、行业用户、AI 厂商及互 联网企业。海光与百度、阿里等头部互联网厂商推出联合方案,打造全国产软硬件一体全栈 AI 基 础设施。另外,海光 DCU 二代也在有序研发中,公司也将加大其在 DCU 领域的研发投入。
海光信息 DCU(GPGPU)“类 CUDA”生态优异,工具链完整。CUDA 是 NVIDIA 开发的一种 并行计算平台和编程模型,它允许开发人员使用 C/C++语言在 NVIDIA GPU 上进行高性能计算, 在深度学习训练和推理领域被广泛应用。CUDA 被称为英伟达最深的护城河。而海光 DCU (GPGPU)海光的 DCU 脱胎于 AMD,兼容主流生态——开源 ROCm(类 CUDA)GPU 计算生 态,支持 TensorFlow、Pytorch 和 PaddlePaddle 等主流深度学习框架、适配主流应用软件。现 有 CUDA 上运行的应用可以低成本迁移到基于 ROCm 的海光平台上运行。 海光 DCU 具有全精度能力,双精度性能与英伟达的 A100、AMD 的 MI100 相近。海光 DCU 具 有全精度浮点数据和各种常见整型数据计算能力,且双精度计算能力突出。据北京大学高性能计 算系统中标公告(HCZB-2021-ZB0364),海光信息的DCU Z100的通用计算核心达到8192个。 其关键性能指标实现:FP64 10.8TFlops,显存 32GB HBM2,对比全球芯片巨头的高端 AI 芯片不遑多让。英伟达 A100 的相关指标为:FP64 9.7 TFlops、显存 40/80GB HBM2。 AMD MI100 的相关指标为:FP64 11.5 TFlops、显存 32GB HBM2。
3.4.2 华为昇腾深度参与多地智算中心建设,拓维、长虹有望持续受益
华为提供“昇腾”解决方案,业已为 20 余智算中心提供坚实算力底座。华为基于昇腾系列 AI 处 理器和基础软件构建 Atlas 人工智能计算解决方案,昇腾产品具备丰富形态,包括 Atlas 系列模块、 板卡、小站、服务器和集群等计算产品,覆盖深度学习推理与训练全流程,致力打造面向“端、 边、云”的全场景 AI 基础设施方案。其中,AI 集群 Atlas 900 由数千颗昇腾 910 AI 处理器构成, 并集成 HCCS、 PCIe 4.0 和 100G RoCE 三种高速接口、垂直整合通信库、拓扑、低时延网络, 线性度超过 80%,从而充分释放处理器的强大性能。集群提供 256P~1024P FLOPS @FP16 的 算力规模,代表着全球范围内的算力巅峰水平。
2023 世界人工智能大会上,华为宣布对其 Altas 900 人工智能集群进行全面升级。该集群利用昇 腾直出的参数网络以及具有 98%高吞吐量和零丢包的超融合以太网络在 2019 年支持了一个 4,000 卡片的集群,并将在今年年底达到 16,000 卡片,成为业界首个万卡 AI 集群。在 16,000 卡片的集 群下,它能够在半天内完成具有 1750 亿参数模型和 100B 数据的训练。稳定性方面,它能够实现 超过 30 天的长期稳定训练,并且其可用性是业界的十倍。日前,华为已部署了超过千台昇腾 AI 集群机柜,成为拥有最多 AI 集群部署数量的制造商。 昇腾全面赋能鹏城云南、多地智算中心。华为致力建设国家区域人工智能计算中心,提供从底层芯片算力释放到顶层应用使能的人工智能全栈能力,为算力基础设施的建设构筑坚实算力底座。 华为在 2020 年为鹏城云脑交付了首个拥有 1000P 算力的 AI 集群,在全国支持了 25 个城市,累 计交付 5000P 的计算能力,其中有六个城市已实现计算能力的饱和运营,并进行了扩展,以支持 本地人工智能产业的高速发展。近期,基于昇腾的七个人工智能计算中心已获得国家批准,并成 为科技部首批认可的“国家新一代人工智能公共计算能力开放创新平台”。华为将在不同行业中 复制在城市中积累的 AI 集群建设经验,支持运营商、金融、互联网等行业的集群建设,推动行业 模型的创新。
华为生态惠及生态伙伴,基于昇腾 AI 产品架构助力智算中心建设。华为昇腾生态伙伴包含整机硬 件伙伴、IHV 硬件伙伴、应用软件伙伴、一体机解决方案伙伴和生态运营伙伴。目前,华为昇腾 有 13 家整机硬件伙伴,包括宝德、华鲲振宇、湘江鲲鹏、安擎、神州数码等企业。华为的昇腾万 里伙伴计划分为四个等级:注册成员、认证等级、优选等级以及领先级。其中,四川长虹的参股 子公司华鲲振宇认证为领先级,拓维信息子公司湘江鲲鹏被认证为优选级。
四川长虹联合华为成立华鲲振宇,参见多省市智算中心建设。华鲲振宇基于华为昇腾开发的自研 AI 训练服务器 AT800 Model 9000 具有优越性能,可广泛应用于 AI 大模型开发、训练和推理。华 鲲振宇依托昇腾技术架构,积极参与包含江西、福建、成都、济南在内的多省市智算中心建设, 其中成都智算中心采用 Atlas 900 AI 集群,首期提供算力便达到 300 PFLOPS,相当于 15 万台高 性能计算机的计算能力,现已为蓉城·夔牛模型极速气候预测提供稳定“算力底座”。除却智算 中心建设,华鲲振宇还为云厂商提供可信计算底座。其中,中国电信天翼云与长虹电子控股集团 建立联合创新实验室,共同探索打造安全可信数字基础设施,合作中长虹将为天翼云构建稳定、 可靠、高性能的云底座,由华鲲振宇为其提供“天宫”服务器,并基于天翼云需求持续专注于提 升产品差异化竞争力。
3.4.3 云赛中标上海公共算力服务平台,出资参股上海智能算力科技公司
云赛智联子公司中标上海市公共算力服务平台,积极参与智算供给与算力调度。2022 年 10 月 10 日,上海仪电旗下云赛智联所属上海南洋万邦软件技术有限公司以 2.56 亿元人民币中标上海超级 计算中心市公共算力服务平台项目,主要包括算力平台及服务建设、算法平台及服务建设、算力 调度平台建设、配套基础设施建设。该平台以华为昇腾达芬奇架构核心芯片和服务器集群产品为 基础,计算峰值速度达到 100PFLOPS@FP16,支持 MindSpore1.7、TensorFlow1.15、PyTorch (自定义镜像)三种算法框架。
云赛智联股份有限公司与仪电集团等其他股东共同出资成立合资公司。云赛智联股份有限公司是 上海仪电(集团)有限公司的上市子公司,公司业务核心聚焦于提供高效的云计算、大数据分析 和智能化产品解决方案,以满足客户在数字化时代的科技需求。经第十二届二次董事会会议审议, 云赛智联与上海仪电(集团)有限公司、上海数据集团有限公司、上海市信息投资股份有限公司 和其他非关联股东方以向上海智能算力科技有限公司非同比例增资的方式,共同出资建立算力设 施公司。主要发起方仪电集团将在合资公司评估值基础上进行现金增资,计划增资至 88000 万元, 持股比例为 44%。云赛智联计划增资 22000 万元,持股比例为 11%。在此基础上,云赛智联主要 负责提供所需的算力设施,以支持和保障合资公司的日常运营,旨在创建城市级算力调度平台, 为人工智能模型的训练和应用推演提供算力支持。
3.4.4 天数智芯、燧原等国产 AI 芯片旗手,积极参与智算中心建设
天数智芯量产两款通用 GPU, 携手新华三推出 AI 服务器。目前,天数智芯已经发布了 2 款自主研 发的通用 GPU 产品天垓 100、智铠 100,国内众多主要服务器厂商也已陆续引入天数智芯天垓 100 产品、将公司加入其供应商目录,并将陆续发布搭载天垓 100 的服务器产品。今年 3 月,新 华三的主流 AI 服务器便已搭载天垓 100 加速卡、并正式在官网对外销售,两家企业强强联手、共 同推进算力的突破性提升。
积极参与智算中心建设,适配多种大模型。天数智芯还积极参与芜湖等地区的智算中心建设、以 支持大模型训练的算力需求,此前天数智芯搭建的 40P 自主算力集群,完成了国内自主研发的 70 亿参数大模型训练,而现在搭建的 200P 自主算力集群已可以支持 650 亿参数大模型的训练所需。 不仅如此,天数智芯注重硬件与主流框架的兼容,着力解决产品使用难、迁移成本大等痛点,广 泛支持主流 AI 生态和国内外开发框架,天垓 100 芯片已跑通多个大模型,包括智谱 AI 大模型 ChatGLM,国外主流的 LLaMA,以及北京智源研究院的 Aquila 等产品,支撑数百客户在人工智 能领域进行超过四百个算法模型训练。
燧原科技业已形成全系列 AI 产品线,与多家领先机构开展合作探索智算共建。目前,燧原科技已 拥有从邃思系列芯片、云燧训练和推理加速卡、云燧服务器和云燧智算机的全系列产品线。针对 AIGC 爆红带来的高算力需求,燧原科技还推出了面向大型智算中心的高性能人工智能加速集群 ——云燧智算集群,集群搭载公司自研邃思系列芯片,能够以超千卡规模集群突破 E 级算力;除 却算力表现优秀,云燧智算集群还是行业内首款基于 OAM 开放加速计算标准的液冷方案,PUE 最低可降至 1.1 以下。除却不断提升自身硬件创新实力,燧原科技还与多家领先企业与机构开展 合作,如加入飞桨“硬件生态共创计划”、助力西南核心省会 AI 算力中心建设、为之江实验室构 建超千卡规模 AI 液冷集群和为腾讯云服务器组供给芯片产品等,业已取得阶段性结果。燧原科技 还联合浪潮信息发布“钱塘江”智算中心方案,搭载燧原科技高能效 AI 算力芯片“邃思 2.0” , 单集群即可提供超过 200P 峰值 AI 算力(TF32)。
四、各地推进算力调度进程,新商业模式正在诞生
4.1 调度逐渐成为算网建设重点,各地发文推进算力编排调度 工作
算力网络的发展进程划分为初步协同、共同调度和融合一体三个阶段。在初步协同阶段,算力和 网络仍然各自为战,编排调度并不融通,但开始向协同运营发展转变,算力基础设施布局由集中 式走向分布式,逐渐实现资源按需调配、宽地域多行业协同的网络布局。紧接着进行的是算力和 网络的共同调度,虽然算力和网络仍然为独立的个体,但共享的调度中心实现算网资源的统一管 理、灵活编排,大大提高所有时空下的算力资源利用率。最后进行的融合一体阶段同时也是整个 算网发展的最终愿景,即建成算网一体化基础设施,用户在完全无感的情况下使用最佳调度分配 的低成本算力。 算网建设重点有望从“基建”转向“调度”,赋能计算基础设施升级为算力资源服务。算力网络 不只是简单的建设数据中心、智算中心进行算力对齐,而是寻求网络、算力调度等多方面的技术 发展与实践落地。当前算力基础设施建设如火如荼,智算中心犹如雨后春笋般在全国各地快速建 立。然而部署算力只完成工程的第一步,随着基础设施建设进度不断推进,接下来要进行的是各 节点之间的互联互通、实现算力统筹调度,将全国算力资源纳入总体布局,实现需求供给间的精 准对接。
从下述各地发布的算力相关政策可以看出。随着全国算网建设得逐渐深入,算网建设的重点将逐 步从“基建”转向“调度”,赋能算力像水电一样随取随用,使计算基础设施升级为算力资源服 务。实现算力一体化,完成节点互联与算力统筹调度成为接下来工作的难点与重点。 依托公共算力服务平台,各地设立算力编排调度目标。在近期各地发布的有关人工智能产业建设 或算力相关的政策中,无一例外提到了算力的编排调度。其中,北京提出要建设统一的多云算力 调度平台、提高环京地区算力一体化调度能力;上海着眼于技术研发,覆盖多云管理、云网协同、 算力度量、算力感知、算网融合等关键领域、提高算力调度,同时制定目标,2023 年接入并调度 4 个以上算力基础设施,可调度智能算力达到 1,000 PFLOPS(FP16)以上;深圳不仅致力于建 设城市级智能算力平台、积极推动鹏城云脑三期项目建设,还以深圳为核、打造大湾区智能算力 枢纽,谋划共建粤港澳大湾区智能算力统筹调度平台;贵州作为“东数西算”八大枢纽之一,大 力推动算力资源跨域调度,致力建设国家枢纽节点统一算力运营调度平台;成都积极优化“市内都市圈-成渝”整体算力资源,并建立与其他国家枢纽节点间的算力资源匹配对接机制。随着各地 先行先试不断推进,有望探索出可行的算力调度方案,实现全国范围内的算力跨地域流动值得期 待。 从各地政策中可以看出,地方政府主要由小到大、由近到远推动算力的统筹调度。从实现市内省 内的本地算力统筹调度,再到长三角、环京、粤港澳等区域性算力调度,最后到全国枢纽节点的 算力调度。
4.2 各地建设算力服务平台,推动算力调度交易
各地尝试打造区域性算力网络、东西部互联网络,争先实现高效互联与算力调度。随着算网“基 建”工作逐步推进,建设“算脑”——算力调度中心、实现算力高效无损跨地域流动成为了接下 来的重中之重。因此,各地域均因地制宜提出针对性方案、探索可行路径。甘肃、宁夏等多个枢 纽节点积极推进区域算网建设,旨在建成市内、省内统一的算力供给体系,建立算力调度平台, 实现省内算力资源的统一调配,同时,这些地区也对与长三角、京津冀等地的互联互通做出探索。
4.2.1 宁夏上线全国首个一体化算力交易调度平台,中科曙光提供关键技 术支持
今年 2 月,宁夏上线东数西算一体化算力服务平台,针对多样化算力需求提供算力调用、交易服 务。2023 年 2 月,东数西算一体化算力服务平台在宁夏银川发布,正式上线运营。该平台是国内 首个可以支持算力交易调度的应用系统,可以为智算、超算、通用算力提供算力发现、供需撮合、 交易购买、调度使用等服务。首先在宁夏实现零散算力资源整合,助力实现全国算力流通调度交 易。目前,平台已接入中科曙光、华为、中兴、阿里云、天翼云等企业。
中科曙光为东数西算一体化算力服务平台的建设提供了关键技术支持。该平台由数字宁夏公司、 中科曙光、中国电信、北京国家大数据交易所等主体共同建设。其中,中科曙光凭借自己在算力 调度运营方便积累的深厚技术和实践经验,在整体方案设计、平台建设、算力调度以及统一算力 接口等方面为该平台提供了重要技术支持。
4.2.2 南京城市算力网运营平台发布,中科院持续赋能
南京城市算力网运营平台发布,中科院持续赋能。2023 年 2 月,南京城市算力网运营平台正式发 布。该平台已经实现联邦模式的算力并网、全局调度、异构算力统一度量等关键技术。该平台是 中科院计算所牵头的信息高铁综合试验场项目的重要组成部分,未来将以南京测调中心为核心, 向全国各节点扩展,形成全国算力互联网。
4.2.3 贵州枢纽算力调度平台已迭代至 2.0 版本
清华与东数西算(贵州)成立算力实验室,共同探索算力调度。清华大学计算机系高性能计算研 究所与东数西算(贵州)产业有限公司成立“东数西算”算力实验室,旨在共同建设枢纽节点间 的算力网络、新型算力中心及算力调度服务平台,建设贵州枢纽与长三角枢纽间东西部互联的算 力网络与新型算力中心试验示范工程,实现东西部算力的高效互联与调度。
2022 年 5 月,全国一体化算力网络国家枢纽节点(贵州)算力调度平台发布,探索算力跨云异 构、云网、云边的智能调度和编排,形成异构算力资源的混合部署和统一调度。包括算力服务跨 平台、跨地域、跨网络的算力调度服务,以及区域内、跨区算网调度试点验证和东数西算场景验 证。 贵州省算力运营调度平台 2.0 版上线,以政策、场景、平台三个关键要素加快推动“东数西算” 工程。2023 年 5 月,经过一年的迭代和升华,贵州省发布算力运营调度平台 2.0 版。该平台从 数网、数纽、数链、数脑、数盾五个方面,构建覆盖能力、质量、结构、通道、产业等多个方面 的指标体系,对贵州枢纽节点建设进行全环节、全链条、全周期监测调度。目前,平台已经汇聚 18 个数据中心算力资源,形成了贵州省公共算力资源池,可调度的算力资源近 30PFlops,存力 资源超过 80Pb,面向全国提供通算、智算、超算等 64 种产品及服务,算力交易额累计超过 4 亿 元。
贵州数据中心集聚区业已形成,高水平建设面向全国的算力高质量保障基地。截至2023年5月, 贵州大数据发展和科技创新的重要展示平台——贵阳大数据科创城已招引 487 家企业。当前,贵 阳贵安已成为全国集聚超大型数据中心最多的地区之一,拥有中国移动、中国电信、中国联通、 华为、腾讯、网易等企业的大数据中心,形成了超强算力。贵州成为国家顶级互联网骨干节点, 与全国 32 座城市实现网络直达,成为全世界聚集超大型数据中心聚集最多的地区之一。
4.2.4 上海超算建设运营上海市人工智能公共算力服务平台
全国首个人工智能公共算力服务平台已在沪揭牌投用,探索算力调度新模式。2023 年 2 月,依托 上海超算中心建设并运营的上海市人工智能公共算力服务平台正式揭牌投用,将更好满足科研机 构和广大中小微企业实际算力需求,标志着上海市算力网络发展迈上新台阶。平台第一批客户包 括上海帆一尚行科技有限公司以及中科院上海药物研究所。目前,包括三大运营商,以及商汤、 华为、腾讯等智算中心的算力都在踊跃加盟平台。
上海发布上海算力交易平台,14 家算力产业链单位入驻。2023 年 4 月,国家(上海)新型互联 网交换中心(上海交换中心)发布国内首个基于交换中心的一体化算力调度总体建设方案和算力 交易平台,上海电信、上海移动、上海联通、上海铁塔、东方有线、腾讯云、有孚云、万国数据、 数讯信息、上海师范大学、二六三、数字发展、银基安全、七牛云等 14 家算力产业链相关单位入 驻平台。
4.2.5 郑庆哈推动建立城市算力网实验场
郑州市、庆阳市、哈密市签署协同建设城市算力网实验场合作协议。2023 年 4 月,河南省郑州 市、甘肃省庆阳市、新疆维吾尔自治区哈密市签署了《郑州庆阳哈密协同建设城市算力网实验场 合作协议》。根据协议,三方将聚焦算力网建设关键,发挥各自优势,高效协同调度资源,联动 打造智能算力新引擎,赋能数字经济高质量发展。郑庆哈城市算力网实验场合作协议的签署,标 志着以庆阳为“算力供给站”、郑州为“算力中继站”的数算电融合“东数西算”工程逐步迈入 实施阶段。
4.2.6 北京经开区公共智能算力中心启动和算力调度服务平台
北京经开区推出我国首个“算力资源+运营服务+场景应用”一体化建设工程。2023 年 7 月,经 开区组织北京亦庄智能城市研究院,与电信、京东、华为、阿里、曙光、腾讯等算力伙伴,共同 发布公共智能算力中心启动和算力调度服务平台。经开区公共智能算力中心总体规划 1000P 建设 规模,将以“微利、惠企”原则用成本价格、先进液冷技术、自主可控的软硬件信创产品和技术 架构,构建数字经济时代的新型算力基础设施。为实现及时、快速、经济地算力服务传输,经开 区打造了国内首个超大规模、多源异构、多算一体、安全可信、生态融合的算力调度服务平台, 计划开展通算、智算、超算等累计 9000P 以上算力资源的统筹调度,以实现京津冀、东西部和国 际算力资源优化配置。
4.3 算力调度运营发展为新商业模式,科技大厂、科研事业单 位、三大运营商、纷纷“入场”
算力网络生态由算力提供方、算力调度运营方以及算力需求方构成,算力调度运营有望发展为新 的商业模式。电网的生态由发电厂、电网侧以及用电方。类比于电网,算网生态主要由算力提供 方、算力调度运营方以及算力需求方组成。其中,芯片、服务器、IDC、云服务等厂商都是算力 供给方的重要角色,有望持续受益于全国一体化算力网络的推进。而算力调度运营有望成为新的 商业模式,通信运营商、云厂商、科研机构等多方角色纷纷积极参与算力调度发展,有望成为算 力运营商、受益于算力网络产业发展。算力交易还在持续探索中,未来或将形成多元化交易模式。算力调度运营方有些类似于淘宝平台, 可基于自有或第三方算力,提供自营、代理等多元服务,将合适的算力供给匹配给相应的算力需 求方。目前,算力交易模式还未定型,初步探索为算力供给厂商定价,用户选择合适算力下单。 未来也可能出现,运营方统一购买算力,再进行出售。
4.3.1 中科曙光持续迭代曙光算力平台,中科院计算所打造 “信息高铁”
曙光全国一体化算力服务平台迭代更新至 4.0,推动数字经济产业升级创新。2021 年 7 月,中科 曙光推出了全国一体化算力服务平台,由子公司曙光智算进行运营管理。该平台连接全国各地的 数据中心算力资源,实现算力互通互联、统一调度管理,为用户提供一站式的计算、应用、数据、 调优、咨询和运维等服务。此外该平台基于中科曙光在计算领域的经验,在算力资源、服务水平、 运维保障和行业应用等方面具备专业优势,构建了算力网络体系,汇聚了大量算力资源,提供了 融合计算服务,对于贯彻国家重大战略部署和推动产业升级具有重要意义。2022 年 10 月,曙光 4.0平台更新上线,以客户体验为中心,对平台设计、核心功能、交互方式和后台技术等进行了重 构,并新增了多个功能,如跨域传输、升级版的 Portal 和快捷入口等,具备更直观,更自由,更 高效三大特征。目前曙光平台已在多个行业广泛应用,为科教、人工智能推理、工业、政企等行业提供稳定作业环境、计算加速能力和模拟仿真服务。
曙光支撑多领域范式创新,携手行业龙头与科研机构共建算力生态。自曙光全国一体化算力服务 平台上线以来,凭借其在技术、产品、生态、资源和服务等多维度的复合优势,助力气象、生信、 材料、智能制造等领域进行交叉融合应用创新,目前,平台已服务国内 10 万+用户,助力作业提 交量业已突破3000万。算力平台不仅在用户数量方面表现卓越,还正在成为千行百业的首选合作 伙伴,现已在平台适配、落地孵化与生态建设等方面与众多企业与科研院所建立起了深入合作, 包括百度飞浆、深势科技、云庐科技、东方地球物理、中国石化胜利油田和上海交大等,并携手 开展粤港澳大湾区国际 AI 算法算例大赛、 “东方杯” GeoEast 应用大赛、海洋工程智能感知大 赛、广西公共数据创新应用大赛、山大引航计划等人工智能公益项目。近期中科曙光还与工信部 五所赛宝实验室签约,将基于双方优势在工业领域打造创新高地。未来,随着全国一体化算力平 台不断深化发展,持续为用户提供更高质量、更低门槛的算力服务,源源不断地向数字经济传递 算力的普惠价值。
计算所建设信息高铁综合试验场,曙光、寒武纪深度参与,多地多样算力中心接入。2019年开始, 孙凝晖院士带领计算机所在南京开展信息高铁相关的研究和试验,建立了一个综合试验场。其中, 信息高铁的综合试验场的内场包含了卫星网络、工业 5G 网络、面向管理的全局测调中心以及面 向用户的全局运营中心。这个内场可被视作“信息高铁总站”,起到全网资源测调的作用。而相 对于内场的外场,则是计算所与其旗下众多公司(曙光、寒武纪等)携手合作,在全国各地建不 同类别的信息高铁站,包含多地的超算中心、智能计算中心、高通量中心、大数据中心等,这些 算力提供方由发改委支持的大科学装置“CENI未来网络”连接,是信息高铁的分站们。另外,各 地还设立了十几个计算所分所,各地的企业、政府可通过这些分所接入到算力网络中,获取所需 算力及服务。这些各地的信息高铁站是产权独立的个体,同时可以通过信息高铁总站进行统一的 计价和结算。信息高铁的建设可以真正使算力流通起来,打破垄断,普惠中小企业及大众。
4.3.2 鹏城实验室领头、华为助力,打造“中国算力网”
鹏城实验室打造“中国算力网(China Computing NET, C²NET)” ,已接入全国多个超算、 智算节点。早在 2019 年,鹏城实验室就在发改委的部署下开始了中国智算网建设预研项目,研 发了兼容多种异构 AI 芯片的核心软件栈与分布式调度平台。集合的算力总量为超过 2.3E 半浮点 精度的运算能力,算力资源包括华为的 NPU、寒武纪的 MLU、英伟达的 GPU 等,该预研项目 已经于 2022 年 6 月完成验收。2022 年 5 月 29 日,鹏城实验室主任高文院士公布 “中国算力 网(China Computing NET, C²NET)”研究计划,其目标是像建设电网一样建设国家算力网, 像运营互联网一样运营算力网,让用户像用电一样方便地使用算力。2022 年 6 月 15 日,鹏城实 验室联合华为共同打造的“中国算力网-智算网络一期”正式上线。目前,已有鹏城云脑、西安、 武汉、青岛、济南、沈阳、广州、重庆、昆明、福州、长沙、河北(廊坊)等 20 多个节点接入 中国算力网,包括人工智能计算中心、超算中心、一体化大数据中心等。未来,中国算力网计划 接入更多节点,建立全国一体化算力网络。
华为发布跨区域算力调度 IP 网络解决方案,智能云图算法可将算力运输效率提高 30%以上。经 过三十年的技术积累,华为依托于自主研发的智能无损算法和智能云图算法,发布了业界领先的 跨区域算力调度 IP 网络解决方案。华为开发了智能云图算法(智能云图 Edge-Disjoint KSP 算法) 以解决传统广域网采用的最短路径调度造成的链路利用率不均衡、多路负载分担的业务对网络的 差异化需求问题以及过往对云池因素(如算力负载、成本、存储)的忽视等问题。该算法基于云 因子与网因子的一体化调度,可根据企业的需求选择最佳云池,实现多源到多宿的云网资源平衡, 提高算力运输效率 30%以上。2022 年 12 月,面向分布式云场景下的新一代云原生产品华为云 UCS 正式商用。UCS 基于华为云贡献至 CNCF 的开源项目 Karmada,结合分布式调度器可实现 算力跨云跨地域统一调度。
鹏城云脑与华为昇腾 AI 解决方案深度耦合,构建完整生态、实现全栈自主可控。鹏城云脑 II 期全 面使用华为昇腾 AI 底座,由 4096 颗 AI 处理器、2048 颗 CPU 处理器构成,共有 4 个集群架构, 集群之间使用全互联高速网络。然而,提供强力智算服务不仅仅只依靠芯片的性能表现,更需要 构建从底层、到基础软件、再到应用软件的自下而上的完整产业链。因此鹏城云脑 II 期在建设过 程中采取华为全栈计算结构,鹏城实验室与华为共同努力、将底层硬件昇腾 910 服务器、中间算 子层的异构计算架构 CANN、上层 AI 框架昇思 MindSpore、基础软件 MindX、ModelArts 全面打 通,并进行大量验证与仿真,最终建成了全栈自主可控的智算框架。在完备生态加持下,相比于 1000 多亿参数规模的 GPT-3 的模型训练需要几百万美元、用时两三个月,鹏城云脑训练 2600 亿 参数的盘古大模型只需要一个月左右的时间,成本只占前者的十分之一、甚至更小,即使现在鹏 城云脑Ⅱ依然具备国内领先的 AI 计算能力。在即将建设的鹏城云脑 III 期中,将采取华为在乌兰察 布云计算中心的集群部署方式,可在同等算力的情况下实现 10%以上的效率提升。”
4.3.3 中国电信携手信通院,发布全国一体化算力算网调度平台
中国信通院联合中国电信共同发布“全国一体化算力算网调度平台(1.0 版)”,为首个实现多 元异构算力调度全国性平台。其中异构计算即整合多种算力架构、提供集成化的算力供应解决方 案,目前该平台已汇聚通用算力、智能算力、高性能算力、边缘算力等多元算力资源。此外,平 台还实现了不同厂商的异构资源池的算力动态感知与作业智能分发调度,即针对不同需求提供相 应不同架构的算力资源,而对单一客户,不仅可以供给某一种特定算力、也可为多种算力架构的 组合。值得一提的是,平台在 AI 训练作业调度流程中,可实现跨资源池/跨架构/跨厂商的“三跨” 异构算力资源调度。平台通过实现“三跨四互联”,着力解决了算力可管可控可调度的问题。目 前,天翼云、华为云、阿里云等已接入该平台,提供可用于调度的算力资源。未来,中国电信将 携手中国信通院,在算力调度的平台建设与标准制定方面持续开展合作,探索可行的算力调度范 式,助力算力供需进一步精准匹配。
4.3.4 浪潮携手未来网络研究院,助力算网资源协同调度
浪潮携手山东未来网络研究院,实现算网统一调度。在浪潮和山东未来网络研究院的共同助力之 下,云网数协同联合实验室应运而生,在数字政府建设引领的数字化转型时代呼唤下,依托浪潮 在分布式云计算领域区块链、数据分发、资源调配等技术积累,建设一体化大数据平台并研发浪 潮云洲算网一体机,实现算力、数据、技术、系统等资源的一体化管理和协同调度。一体化大数 据平台对闲散算力、超算资源和智算资源三种类型的算力均有高度兼容性,算力以私有云、公有 云和边缘云三种可选方式接入平台后,通过算力纳管、算力调度和算力应用三种算网一体机设备 实现快速部署和算网资源高效调度,在网络控制层次实现资源协同,进行“云-边-端”间的算力 合理调配,从根本上打通了当前算力与网络之间难以融合的痛点堵点,针对工业生产企业提供性 能、安全、成本兼备的算力服务。浪潮深耕算网发展领域多年,秉持分布式云概念来建设算网产 业,目前已成功构建了覆盖全国的算力网络生态体系,满足政府和不同领域的企业的计算需求, 催化中国数字经济的高速发展。
4.3.5 并行科技:国内“算力网络”服务模式先行者
并行科技打造算力网络资源池,积极参与构建“全国算力一张网”。并行科技作为国内领先的超 算云服务和运营服务提供商,自 2015 年起,率先着手布局“算力网络”建设。在国家“东数西 算”发展政策的大背景之下,并行科技凭借 16 年技术积累,积极响应国家政策,致力于聚合国内 优质超算算力,实现超算算力资源、应用资源、数据资源的共享与交易,面向终端用户提供多样 化的算力服务。 接入超算算力资源及三大运营商算力资源。截至目前,并行科技目前已上线包括天翼云、广东联 通、福建移动在内的“三大运营商”算力资源,并与广州超算、北京超算、济南超算、中科院超 算、浙江超算、宁夏超算等国产算力资源在内的大批优质算力资源结合,共计接入超 80,000 台服 务器,总计算力超 1,000PFlops,存储资源超 800PB。并行科技致力于为国内“算力网络”建设 提供更多高性价比资源选项,有效缓解算力紧缺、算力分配不均等难题。
4.3.6 中软国际:从政务多云管理平台,到算力调度平台
中软国际深耕云计算领域,搭建算力调度平台。作为国内领先的 ICT 软件产品和服务、行业解决 方案提供商,中软国际造了适用于省级和市级的政务多云管理平台,具有丰富的云服务管理及运 营经验。随着政务云的发展,政务云管理平台功能愈发复杂。为了解决政务云发展过程中的需求 和痛点,中软国际有针对性地升级了相关软件平台,从政务多云管理平台到算力调度平台。
五、鼓励中小企业共建,中立云厂商有望接入算网
5.1 告别垄断,拥抱多元,促进算力网络健康发展
全国一体化算力网络建设参与主体众多,避免单一“帝国制”垄断运营,激发中小企业热情、探 索“联邦制”运营。李国杰院士从顶层设计角度将算网建设分为三部分: 国家或地方财政建立的公共算力基础设施; 电信运营商和龙头云服务商建设的骨干企业级算力基础设施; 由大量中小型信息服务企业协作建立的算力网 其中,算力的生命力在于协同,单独企业的端到端一体化不利于全国算网的发展。因此李院士提 出要避免“帝国制”的垄断运营,鼓励中小企业积极参与,探索联邦制。
5.2 国家、地方引导云厂商、中小企业接入算力网络
国家鼓励云厂商、中小企业积极参与算力网络建设,第三方中立云厂商有望持续获益。国家鼓励 中小企业积极参与全国算网建设。首先,鼓励各云厂商接入公共算力平台,在扩大算力资源供给 的同时、帮助云厂商与需求方进行算力交易。鼓励中小厂商参与人工智能算力基础设施建设,不 仅可以有效防止单一企业的帝国制垄断运营,还可使众多厂商在算力快速发展的浪潮中受益,促 进数字经济的快速发展。
5.3 第三方云厂商有望接入算力网络、持续受益
在全国一体化算网建设快速推进的时代背景下,云厂商受益于政策红利,有望接入算力网络、持 续获益。在国家与地方算网建设浪潮推动下,各云厂商均注重强化自身算力资源布局、同时大力 推动自身技术创新,有望将自有算力资源接入到区域算网甚至全国算网中。其中,深桑达、首都 在线、优刻得、铜牛信息、云赛智联等第三方云厂商有望在全国算网建设浪潮中持续获益。 优刻得迎合“东数西算”需求,布局青浦与乌兰察布两大云计算中心,A800 即将上线。优刻得 凭借在数据中心、服务器、乃至计算、存储网络和安全等方面的多年积累,具备全栈云计算技术 能力和工程实践能力,可为大模型行业快速构建稳定可靠的智算基础设施服务。公司布局两大数 据中心,其中“东数”上海青浦数据中心将于 2023 年开放商用,机柜数量超 5000R,而“西 算”乌兰察布数据中心部署 12000R 机柜数量,凭借低于低温自然制冷、电价低廉和公司自研 “白露”间接蒸发冷却技术,实现精准成本控制,可为大模型训练降低 30%-50%的运营成本。 优刻得自建数据中心内部署多种 GPU 高性能计算产品,不仅包含 NVIDIA 的 V100S 及 A100 等多款显卡,A800 也即将上线。此外,两大中心相互呼应、帮助客户进行成本控制。用户可将 热数据部署在距离更近的东部中心、而将时效性要求不高的数据业务布局在成本更低的西部中心, 通过使用混合型的云部署方式帮助客户实现最大程度的降本增效。
云赛智联依托上海国资委,集云计算业务架构和云计算服务能力为一体。云赛智联旗下上海科技 网松江大数据计算中心(二期)通过市经信委拟建数据中心符合性评估,取得数据中心建设能耗 指标。建成后,将进一步夯实云赛智联“做优 IDC,做强云服务,做深大数据,布局行业应用” 战略,为上海数字化转型发挥更大作用。同时,云赛智联子公司南洋万邦承建的上海市人工智能 公共算力服务平台计算机集群已上电开机,为上海市培育创新发展新动能提供坚实可靠的算力保 障。此外,近期云赛智联公告,拟与仪电集团等方共同出资 20 亿元建立算力设施公司。其中云赛 智联拟增资 2.2 亿元,持股 11%,以推动建设市级智能算力集群,满足大模型集群训练的需求, 进而有望为公司带来优质客户,且有利于服务人工智能发展并吸引更多的创新团队集聚以及产业 发展,从而提升公司产业地位及市场影响力。
铜牛信息自建数据中心,国资背景提供可靠背书、构造安全算力底座。铜牛信息是北京市国资委 旗下唯一一家以互联网综合服务为主营业务的创业板上市企业,其客户也以北京国企为主。铜牛 信息在北京城区运营三处自建 IDC 北京天坛数据中心、CBD 数据中心、国门数据中心,并且在公 司在天津自贸区也打造了 IDC。铜牛信息拥有稀缺北京城区 IDC 资源,同时自主搭建云平台,有 望承接随之而来的算力需求浪潮。未来,公司将继续以现有数据中心为基础,持续在京津冀、特 别是北京地区布局新的大型云数据中心项目,市场占有率有望进一步扩大。
六、算电一体助力双碳目标实现
2022 年 "东数西算" 工程盛大登场,算力与电力共谋数字经济腾飞。在电气时代,电力作为经济 社会发展的动力保障,稳定、高效的电力供应至关重要,进入数字经济时代,算力作为计算能力 的衡量标准,同样成为经济发展的关键。延续着"南水北调","西电东送","西气东输"的资源调度 逻辑,"东数西算"工程以算力为主体,旨在实现全国范围内的算力资源共享与协同。通过构建算 力网络,实现算力资源的弹性按需调动,进一步优化资源分布,同时建立统一的算力交易平台, 促进算力资源的合理配置与交易,使算力成为类似电力一样的公共资源。正如电网为电力供应提 供基础设施支持,算力网络为数据计算提供算力服务,两者的发展路径相似,都旨在实现资源的 高效流动和优化分配。而随着数字经济的迅猛发展,电力与算力的关系变得更为密切。算力的提 升需要更多的能源供给,而电力的稳定供应又依赖于算力网络的支持。这种相互依赖关系将推动 算力网络与电力网的协同发展,为数字经济的蓬勃发展提供稳定动力。
“东数西算”工程的推进将引导算力资源随电力资源的分布走向,推动绿色低碳电源中心与算力 资源供给中心的协同建设,实现“算电一体”的新型供能体系。在“双碳”目标下,国家对数据 中心集群作为大型电力工业用户和新负荷主体的电能使用效率和可再生能源利用率有更为严格的 要求。据《中国“新基建”发展研究报告》,预计到 2025 年,数据中心能耗将占到全球能耗的 33%。与此同时,由于数据采集和处理量的指数级增长,数据中心对算力的需求也将显著增加, 因此数据中心企业正在进军新能源领域,与电力企业合作开发“数据中心+新能源+储能”模式, 以降低用电成本,满足电力系统的灵活性调节需求,并为新型电力系统的算力需求提供支撑。在 “东数西算”框架下,大型数据中心将逐步提供资源租赁、数据托管、代建代维等增值服务,电 力企业则提供站址、电力、网络等共享资源,从而推动电力基础设施形态变化,成为“电力+算 力”资源服务商。此外,项目也将推动数据中心集群的集约化和联网化发展,以满足越来越多的 算力需求。最终,算力基础设施和电力基础设施将呈现更强的相关性,并在规划和运行机制上呈 现协同发展的趋势。
河南政府政策引领,中国大力支持算力基础设施与储能设施融合发展。2023 年 7 月 28 日河南 省人民政府办公厅发布了一项重要政策,旨在支持并鼓励超算中心、智算中心、新型数据中心等 因地制宜地配置储能设施,以提升电力自平衡能力,进一步推动了算力基础设施与储能设施的融 合发展。该政策的核心亮点在于对配套建设储能规模在 1000 千瓦时以上的储能设施,省财政将 给予一次性奖励。这一举措不仅在激励企业投身于算力基础设施的发展,同时也为储能技术的应 用提供了强有力的政策支持。中国作为全球数字经济的重要引擎之一,也正处于算力网络深化建 设的发展时期,算力基础设施的发展至关重要。而储能技术的引入,则为其提供了稳定可靠的能 源支持。河南此次政策的出台,也将为其他地区在推动算力与储能融合方面提供宝贵的经验。可 以预见,在政策的引领下,中国将进一步加强在数字经济领域的竞争力,为未来的科技创新和经 济增长注入新的活力。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。「链接」
-
少前云图计划中立函数怎么选 中立函数选择攻略,少前云图计划讲解 2023-10-07
-
少前云图计划6-26赫波主C怎么打 6-26赫波主C打法技巧教学, 2023-10-07
-
少前云图计划 少前云图计划愿拳战晓商店购买图文教程, 2023-10-07
-
少前2追放开枪抖屏幕如何关闭, 2023-10-07
-
少前2追放妖精套装搭配大全, 2023-10-07
-
少前2追放什么时候上线 少前2追放上线时间预测, 2023-10-07
-
少儿街舞盛会“引燃”重庆 网络红人重庆市怎样“舞”更新产业链?,重庆街舞大赛少儿团舞 2023-10-07
-
少儿街舞动能俱乐部队成都站完美收官 殿堂级舞蹈家具体指导学生, 2023-10-07
-
少儿街舞动能俱乐部队东莞站完美收官 大将现身共享成长经历,少儿街舞大赛东莞赛区 2023-10-07
-
少儿编程哪个好,比较好的少儿编程教育机构有哪些?,畅学编程和少儿编程有什么区别 2023-10-07