C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  新兵

注册:2023-5-15
发表于 2023-6-25 11:53:29 |显示全部楼层
产业链研究 | 计算机行业专题报告:算力网络迎来黄金时代
一、算力需求高速增长、算力供给陷入困局,算力网络应运而生
1.1、算力需求指数型增长,需求多样性凸显
全球、中国算力需求或将快速提升,需求多元化驱动算力多样化。随着大家走进数字时代,计算 场景愈加丰富,人工智能、物联网等技术飞速发展、数据高速增长,在中国乃至全球范围内算力 需求也随之提高到了前所未有的高度。据中国信息通信研究院,2021 年全球计算设备算力总规 模达到 615EFlops, 增速为 44%;预计到 2030 年,全球算力总规模将实现 56ZFlops,平均年 增速将达到 65%。作为总规模位居全球第二的国家,我国算力需求同样处高速增长态势,工信部 数据显示,2020 年我国算力总规模达到 135EFlops,占全球总规模的 31%,截至 2022 年 6 月 底,我国算力总规模超过 150EFlops,年均增速超过 35%。除了需求量的提升,随着多样化智 能场景的出现,需求的多元化也对算力的多样化提出要求。
1.1.1、AI性能突破、数据价值挖掘需求提升,驱动算力需求高速增长
数据、算法、算力三者已经成为推动数字经济发展的关键驱动力,三者相互促进。其中,算力是 支撑数字化时代发展的基础与核心。随着大家走入数字经济时代,数据、算法、算力已经成为推 动数字经济发展的关键驱动力。数据、算法、算力缺一不可,相互驱动。近日,ChatGPT 的诞 生重新让大家看到了 AI 算法的力量,而国家大力发展数据要素,也凸显了数据作为新时代石油的 价值。算法的技术突破、数据的增长以及对数据价值挖掘的需求,极大驱动了社会对算力的需求。未来已来,算力正是支撑数字化时代发展的基础与核心。
通用大模型的性能依赖于大量参数和数据的训练,需要大算力支撑。以 ChatGPT 为代表的 AI 算 法的突破将极大驱动算力需求。ChatGPT 近日引爆市场,人工智能取得重大突破。GPT 模型的 发展印证了通用大模型性能的提升依赖于大量参数和数据的训练,需要大量算力支撑。GPT 系列 模型经历了多次迭代:GPT-1、GPT-2 和 GPT-3,ChatGPT 是由 GPT-3 微调得到的一个聚焦于 对话交互的过渡版本。目前,ChatGPT 的训练参数 1750 亿、训练数据 45TB ,每天生成 45 亿字 的内容,支撑其算力至少需要上万颗英伟达的 GPU A100,单次模型训练成本超过 1200 万美金。另外,人工智能的算法呈指数增长的发展趋势,未来对算力的需求将随着 AI 算法的发展持续增长。
1.png
数据量的高速增长、以及对数据价值需求的增长将驱动对算力的进一步需求。数字时代到来,数 据是生产要素,而算力则是生产力,数据价值的挖掘依赖于算力的支撑。近年来,5G 网络、区块 链、物联网、VR/AR 等新兴技术的发展促进了数据的指数型增长。据 Statista 统计, 2020 年,全 球产生、采集或复制的数据量达到 64.2 zettabytes(1 zettabyte = 1021 bytes)。同时,Statista 预测未来数据将持续高速增长,预计到 2025 年,全球数据产量将达到 181 zettabytes。其中,中 国在数据量以及相关技术上均保持领先。据 IDC 预测, 到 2025 年, 中国将产生全球最多的数据 量,近全球数据产量的三分之一。同时,我国越来越重视数据要素发展,从理论到实践做了一系 列探索,发布多项重要文件支撑数据要素发展。我国数据量的指数增长及对数据价值挖掘需求的 增长将持续驱动对算力的需求。
1.1.2、计算场景愈加丰富,需求多元化对算力多样化提出新要求
计算场景愈发丰富,不同应用对算力精度、延迟、带宽等提出不同需求。技术的发展催生了丰富 的计算场景,不同的行业、应用场景对算力提出的需求不同。例如,天体物理、气象研究、航空 航天等高精尖科研领域需要能够支撑复杂运算、性能高的双精度算力,即超算算力。而无人驾驶、 智慧交通等 AI 主要用于处理语音、图片或视频等,单精度、半精度、甚至整型的计算即可满足应 用需要。而一些产业数字化的场景对精度要求不高,通用算力(基础算力)即可满足需求。除了 算力精度,不同的应用场景对带宽和延时也提出了不同的需求。例如,需要实时渲染的游戏、自 动驾驶决策、远程手术、工业控制等领域对延迟的要求非常高,而模型训练等场景则对延迟没有 很高要求。同时,基于 AR、VR 等渲染场景,模型训练、超算类等场景对大带宽的需求较高,工 控、物联网采集等则对带宽要求不高。
1.2、算力供给众多问题亟待解决
1.2.1、芯片性能受限,算力网络化是必经之路
从技术发展角度来看,摩尔定律走向尽头,算力向网络化成为趋势。随着摩尔定律逐渐走向尽头, 各界对 More Moore 和 More than Moore 两类技术路线争论不休。不可否认的是,单核硅基芯片 的算力以及多核堆叠带来的算力提升逐渐走向尽头。当单点算力无法持续倍增,通过网络将算力 资源整合到一起为算力不足提供了很好的解决方案。
从国际争端角度看,美国对中国进行先进计算全产业链封锁。芯片产业链壁垒较高,自主打造先 进计算芯片需要时间沉淀,算力网络是打造我国数字基石的另一重要方法。2022 年 10 月,美国 对华制裁政策进一步升级,对华禁售应用在超算领域及人工智能领域的各类高性能集成电路,并 且开启了相关产业链的全面打压。先进计算是军工、生物等多行业高科技发展的关键,是我国建 设“数字基石”最重要的环节之一。美国斩断我国获取先进计算相关芯片的途径,除了自主打造 先进计算芯片,打造算力网络也是我国建设数字基石的另一重要手段。
2.png
1.2.2、算力成本高,目前无法普惠大众,依然是“豪侈品”
当前算力成本高,无法普惠个人及中小企业,制约科学研究发展。在数字经济时代,算力将成为 水电一样的,能够普惠大众的新型公共资源。然而,昂贵的算力导致普罗大众无法受益于人工智 能发展和数字化转型,同时,算力因其高额成本也无法很好的支撑科学研发及暂时无法商业化的企业研发。HUAWEI集群计算总经理朱照群曾举例:“在计算流体力学领域中,一个发动机叶片的仿 真需要 1000 核计算 1 周的时间”,当前,很多机构是无法承受如此高额的算力成本。算力贵的主要在于高昂的电力及土地成本。电力成本以及土地成本在数据中心建设运营支出中占 比较高。
电力成本占数据中心运营成本的 60%-70%。数据中心需 7x24 小时全天候运营,需要充足的 电力供给保障IT设备及散热设备运营,因此数据中心的耗电量积极庞大。据中国信通院,数 据中心的电力成本占其运营总成本的 60%-70%。而全国数据中心的能耗规模约等于两个三 峡电站的发电量。截至 2020 年底,中国数据中心的耗电量占全国总用电量的 2.7%,预计 2030 年将占全国用电总量的 4%。因此,电价对算力成本的多少起到决定性作用。
数据中心占地面积大,土地成本高。数据中心占地面积大,需要部署各类 IT 硬件、供配电 系统、降温散热设备、安全监控设备等。据HUAWEI,单个数据中心的面积达到了 60 个足球场 的面积。例如在贵州枢纽中,Tencent投产的贵安七星数据中心,总占地面积约为 47 万平方米。因此,土地价格对算力成本的影响非常大。供需存在错配:东部算力需求大,西部算力供给便宜。我国上海等东部地区信息产业高度发达, 是计算需求最旺盛的地区,然而其较高的电费和土地价格导致东部地区算力成本高昂。贵州、内 蒙等中西部算力需求较低,但其较低的电力成本和土地价格更适合算力基础设施的建设。
1.2.3、制冷散热耗能高,不利于实现碳排放目标
数据中心耗能高,不利于“双碳”目标的实现。数据中心的用电量不断增长,不利于碳排放目标 的实现。数据中心运转会产生大量的热量,制冷和散热是保障数据中心平稳运行的关键,这个过 程会消耗大量的能量。据HUAWEI,数据中心在降温过程中所消耗的能量占数据中心总耗能的 40%左 右。
采取清洁能源供电、自然降温等方法是数据中心减少碳排放的关键。从供给侧来说,数据中心可 以通过采用节能技术,使用清洁能源等方式改善碳排放过量等问题。另一方面,用自然方式降温 辅助制冷能够有效减少数据中心耗能。各大云厂商为了服务器降温也各显神通,如Tencent在贵安的 隧洞内建立了一个绿色高效的灾备数据中心,MicroSoft曾在将数据中心投放到苏格兰附近的北海中。
供需存在错配:东部算力需求大,西部建设数据中心更利于减少碳排放。我国东部信息产业发达, 算力需求大。而我国中西部地区具备丰富的风电、光伏、水电等清洁能源,显著减少碳排放。同 时,西部地区适宜的气候与地理条件还为散热、制冷等环节提供了天然环境,以乌兰察布市为例, 只有 4.3 摄氏度的年平均气温意味着每年有近 10 个月可以不使用设备,而是利用环境实现自然冷 却,更加适合数据中心的建设,利于达成“双碳”目标。
1.2.4、计算资源利用率有待提升
高时延、窄带宽等问题制约网络传输效率。以目前的传输速度,中长距离传输仍会产生较大时延, 网络难以承载如电子交易、高清视频直播、虚拟现实、云支付等对低时延要求较高的业务。此外, 面对复杂多样、要求不一的计算任务,网络对于高带宽的需求也不断增加,如气象预测就需要超 大带宽。当网络负载超过网络容量上限时,就会产生网络拥塞,出现丢包等问题。网络互联效率成为算力提升瓶颈。在算力供给侧,数据中心存在“1+1 远小于 2”的业界难题。由于大规模服务器集群依赖于网络实现互联,因此,当多台服务器向一台服务器同时发送大量报 文时,会导致报文数量超过交换机的缓存承受能力而产生丢包。而丢包造成的数据重传,又将极 大地影响计算和存储的效率。在近些年备受业界青睐的 RoCE(RDMA over Converged Ethernet)网络中,0.1%的丢包率就会导致 50%的算力下降,造成服务器 CPU 资源的严重浪费,成为算力 提升的瓶颈。
4.png
1.3、算力网络的建设赋能算力作为基础资源普惠大众
算力应该是水、电一样普惠大众、随取随用的公共基础资源。早在 1961 年,美国教授 John McCarthy 就将算力类比为电话服务,可以随取随用。到了 1990 年,美国 Ian Foster 教授将算力 与电力类比,提出算力是一种公共服务。今天,大家来到了数字经济时代,算力将成为水、电一 样普惠大众、随取随用的公共基础资源,为社会高效发展赋能,最终实现“网络无所不达、算力 无所不在、智能无所不及”的社会愿景。
算力网络是提供普惠算力的最优解,或将成为智能时代的标志性基础设施。目前,算力对大部分 企业、科研院所、个人来说都是豪侈品,没有成为普惠大众的基础资源。像上述所讨论的那样, 我国算力存在着供需失衡、成本较高、鲁棒性不足等问题。急剧增长的全行业计算需求与相对较 慢的迭代发展速度造成了算力供需失衡;同时,地理位置上聚集于东部、行业上大量存在于互联 网企业等分布特点也对算力资源的合理分配构成阻碍,算力流动进而导致成本不能有效满足普惠 发展需求;此外,数据中心的建设带来了更加复杂的算力应用场景,随之带来的偶发性算力需求 激增和隐私数据安全保护诉求对各节点的鲁棒性、安全性提出了更高的要求。为解决以上难点, 实现跨地域与跨行业共享、弹性按需调动,算力网络应运而生,成为算力资源健康发展的最优解。在不久的将来,算力网络将成为这个数字经济时代、智能时代的标志性基础设施。
算力网络:云边端节点全连接,动态感知、灵活调度。算力网络是通过新型网络技术将云、边、 端等分散的算力节点连接起来,动态实时感知算力资源状态,根据业务需求进行统筹分配和调度。不同的业务需要的算力种类、带宽、延时不同,然而在算力网络中用户无需关心网络中计算资源 的位置和部署状态。算力网络可以实时感知客户的算力需求,并根据算力资源池的情况,给客户 自动调配符合其需求的最优算力,获取算力将像获取水、电一样便捷、价低。

3.png
14.png
13.png
11.jpeg
12.png
10.png
9.png
6.jpeg
7.png
5.jpeg
8.png

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-11-24 20:47 , Processed in 0.288945 second(s), 19 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图