导图社区 AIDC智算中心
这是一篇关于AIDC智算中心的思维导图,介绍了AIDC智算中心的相关知识,从基础的算力概念到智算中心的架构,再到我国智算中心的发展现状、面临的问题以及完整的产业链结构。
这是一篇关于短剧的思维导图,主要内容包括:核心赛道龙头企业,风险提示,有助于了解短剧行业的竞争格局和发展挑战。
这是一篇关于新消费的思维导图,主要内容包括:消费GDP占比,核心特征与趋势分析,挑战与瓶颈,未来图景。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
AIDC智算中心
算力基础知识
算力定义
广义:数字经济时代新生产力,支撑数字经济发展的坚实基础
狭义:设备通过处理数据,实现特定结果输出的计算能力
实现的核心
CPU、GPU、NPU、FPGA、ASIC
算力单位和精度
算力单位:FLOPS(FloatingPointOperations Per Second)
浮点运算:是带小数的加减乘除运算
根据运算数据精度分类
双精度算力(64位,FP64):用于大规模科学计算、工程计算,适用于超算服务器;
单精度算力(32位,FP32):使用普通的同用计算,衡量算力中心IDC的基本水平;
半精度算力(16位,FP16):常用于模型训练过程中参数和梯度计算。适用于AI服务器;
整型算力 (INT8、INT4):用于量化神经网络的计算,在低功耗、嵌入式系统和边缘设备等领域。
与智算中心或者AI相关(默认是FP16)、超算HPC(默认是FP64
算力分类
通算
通用性强,适合日常任务,以CPU为主,单精度运算(FP32)建设灵活。
智算
专注于AI任务,以GPU和AI芯片(GPU、NPU、ASIC、FPGA)为主,适合AI和机器学习等低精度计算。
超算
高性能计算,以高精度为主(双精度浮点运算FP64以上),适合科学计算、大规模和复杂模型,建设规模大、成本高。
智算中心内涵&架构
智算中心 AIDC (Artifical Intelligence Data Center )
狭义智算中心
机房+网络+GPU 服务器+算力调度平台”的融合基础设施,是传统数据中心的增值性延伸。
广义智算中心
是融合算力+数据+算法的新型基础设施,是AI件技术一体化的载体,是传统云的智能化升级。
智算中心架构组成
硬件设施
1. 服务器--高性能计算硬件
2. 高速存储设备
3. 高速网络连接与交换机
算法软件
1. AI大模型
2. 分布式计算框架
3. 智算调度操作系统
配电制冷等-基础设施
我国智算中心的现状和卡点
主要建设主题
“地方政府主导+互联网巨头企业主导”的两条主线
商业模式
机房托管服务、算力租赁服务、AI平台服务、模型定制服务及AI应用服务多个维度
国内:算力租赁合机房托管
工艺合生态壁垒
芯片工艺受限
华为、龙芯、寒武纪、曙光、沐曦、海光
CUDA生态垄断
英伟达已形成技术和事实上的垄断
技术迷宫
面临异构计算的难度
需要资深团队保证高效稳定的运行
网络数据层面
产业链详解&关联公司
上游:硬件与基础设施(金字塔尖)
(1)计算芯片
GPU
用于进行计算和深度学习
英伟达NVIDIA
超威AMD
国内:华为昇腾、寒武纪、昆仑芯、摩尔线程
TPU
Google自研,专为AI任务优化
AI加速芯片
华为:昇腾(Ascend)系列
寒武纪:思元(MLU)
Graphcore:IPU(智能处理器)
CPU
Intel:Xeon系列,负责同用计算
AMD:EPYC系列
ARM:低功耗CPU框架
龙芯中科:中国CPU龙头
(2)存储设施
SSD:固态硬盘
三星、海力士、美光、铠侠、西数
国内:长江储存、长鑫、澜起、兆易
HDD:机械硬盘
希捷、西部、东芝
NVMe:非易失性存储(高性能计算并计算存储)
迈络思Mellanox
(3)网络设备--核心桥梁
网络设备技术特点
网络宽带
组网规模
网络拓扑
时延要求
系统维护
交换机
全球:思科-霸主、英伟达-Mellanox
国内:华为、紫光股份、锐捷网络
连接方式
1. 光模块+光纤
2. AOC(有源光纤)+光纤
3. DAC(直连铜缆)+铜线
光模块
中际迅创、光迅科技、新易盛、天孚通信、华工科技
高速铜缆连接(DAC,Direct attach cable)
线材&线缆供应商:尔核材(乐庭智联)、精达股份(恒丰特导)、鸿腾精密、立讯精密(含立讯技术、汇聚科技)
国产高速背板连接器:华丰科技、中航光电
国产高速I/O连接器:意华股份、立讯精密
连接器组件&代工商:鼎通科技
(4)基础设施-配电系统
配变电系统
不间断电源系统(即交流UPS电源或HBDC(高压直流电源))
HVDC/UPS 电源变换:禾望电气、科华数据、科士达
高低压配变电:明阳电气、思源电气
电能质量:盛弘股份
备用电源系统(柴油发动机组)
(5)基础设施-液冷系统
分类&区别
液冷
冷板式液冷
起步早、可靠性、维护性、技术成熟度有优势
标的:华为、浪潮、曙光、新华三、英维克(国内温控龙头)
浸没式液冷
散热能力强、噪音小,但定制化程度较高
相变浸没式:曙光、诺亚
单相浸没式:阿里、绿色云图、云酷
喷淋式液冷
噪音低,节省冷却液,但目前生态不完善
广东合一、中国长城
中游:软件与平台(运营和调度)
(1)AI框架
TensorFlow(Google):主流深度学习框架
Tytorch(Meta): 广泛用于科研和工业界
MindSpore(华为): 华为自研AI框架
PaddlePaddle(百度):百度自研AI框架
(2)操作系统与资源调度
算力调度:算力资源效率最大化的路径
算力池化
谷歌Kubernetes平台:Slurm计算任务调度系统
趋动科技:OrionX池化平台
VMware:BItFusion池化平台
中兴OpenPalette平台:Tec
华为Volcano平台:CCE
(3)云计算与智算平台
亚马逊AWS、Google Cloud、Microsoft Azure:全球领先的云服务提供商。
阿里云、腾讯云、华为云:中国领先的云服务提供商。
浪潮信息、商汤科技、旷视科技:提供AI计算平台和解决方案。
下游:应用与服务
智慧城市
海康威视、大华股份:提供智能安防和城市大脑解决方案。
百度、阿里:提供智慧交通和城市管理服务。
医疗健康
联影医疗、东软集团:提供医学影像AI分析服务。
华大基因、贝瑞基因:提供基因测序和生物信息分析服务。
自动驾驶
特斯拉、Waymo:自动驾驶技术研发。
百度Apollo、小马智行:提供自动驾驶解决方案。
金融科技
蚂蚁集团、腾讯金融科技:提供智能风控和金融服务。
同花顺、东方财富:提供智能投顾和量化交易服务。
科学研究
中科院、清华大学:利用智算中心进行气候模拟、天体物理等研究。
OpenAl、DeepMind:利用智算中心进行AI算法研究。