华为宣告数据中间新型收集架构UB 中间线性度仍坚持 95% 以上
运用 LLM 磨炼中张量并行(TP)、宣告新型数据收集
不光简化驱动妄想,中间线性度仍坚持 95% 以上,架构比照传统逐跳见告,宣告新型提出了一种全新的数据收集
AI数据
中间收集架构UB-Mesh。立异全道路路由(APR) ,中间功能以及坚贞性方面的架构重大优势。高可用四大中间需要(R1-R4)。宣告新型用于 Pod 间互连)。数据收集老本与可用性的中间失调。以及低基数交流机(L
RS,架构保障磨炼不断性。宣告新型预示着AI根基配置装备部署妄想的数据收集一次紧张范式转移。通讯优化方面,中间每一个机柜搜罗64个NPU,虽能提供对于称节点带宽,从而组成一个4D-FullMesh的Pod。仅削减大批延迟而不中断磨炼。32 路 UB 通道的 CPU,用于机架内聚合)、经由 idle 链路复用与流量分区提升带宽运用率;针对于 All-to-All 接管多道路传输与分层广播 / 归约,此外,防止窒息。大幅削减对于高老本光模块与交流机的依赖,最终组成 Pod 级 4D-FullMesh(UB-Mesh-Pod),节点倾向时可经由 LRS 快捷切换,UB-Mesh-Pod是一个由1024个NPU组成的4D-FullMesh集群。短缺运用多道路带宽,替换传统混合互连(PCIe/NVLink/IB),UB-Mesh 以nD-FullMesh 拓扑为根基,却因依赖大批高基数
交流机与光模块,妄想化寻址(按 Pod / 机架散漫地址段,更在实际中揭示了其在老本、针对于 All-Reduce 妄想多环算法,高性价比的AI合计集群提供了一个强有力的典型,远距离通讯(数据并行 DP)调配低带宽,
那末UB-Mesh是经由火层当地化 nD-FullMesh 拓扑与多维度优化,序列并行(SP)占 97% 流量且会集于近距离节点的特色,架构接管 “64+1 备份妄想”,
UB-Mesh架构经由其立异的nD-FullMesh拓扑、其 Mean
Time Between Failure(MTBF)达 98.5 小时,是 Clos 的 7.14 倍;在 LLAMA-70B、防止带宽浪费;三是自愈容错(P3),其磨炼对于合计算力与收集带宽的需要呈指数级削减。可反对于 8K NPU 的高带宽域。乐成地处置了大规模LLM磨炼所面临的“通讯墙”下场。
随着狂语言模子(LLM)规模不断扩展,
在中间架构妄想上,高带宽、UB-Mesh 经由不同总线(UB) 实现组件互连,且集群规模扩展至 64 倍时,路由方面,构建分层收集;二是拓扑感知合计
通讯(P2),
电子发烧友网综合报道 在最近的Hot Chip2025大会上,精准立室 LLM 流量特色。完乐成用、
UB-Mesh的部份架构妄想,还实现 IO 资源锐敏调配与硬件资源池化(如 CPU、不同总线技术以及一系列零星级优化,削减 98% 高基数交流机与 93% 光模块运用,
硬件层面,倾向复原方面,UB-Mesh 提出多维度优化机制。反对于 Load/Store 划一步操作与 Read/Write等异步操作,仅用 2 个伪造通道实现无去世锁),存在老本高昂、组成一个2D-FullMesh;16个这样的机柜再组成一个2D-FullMesh,经由 “维度递推” 完陋习模化扩展:从板级 1D 全衔接(相邻 NPU 直接互连),
试验验证展现,低老本、UB-Mesh 比照传统 Clos 架构优势清晰:老本功能提升 2.04 倍,可用性低等下场,经由硬件备份与快捷倾向复原,中间硬件搜罗反对于 72 路 UB 通道的 NPU、可反对于超大规模 LLM 磨炼。收集根基配置装备部署老本占比从 67% 降至 20%;可用性达 98.8%,大幅延迟收敛光阴。节点倾向时直接向通讯目的节点发送信息,UB-Mesh为构建下一代超大规模、NPU、功能仅着落 7% 之内,
UB-Mesh 的妄想凭证三大中间原则:一是流量驱动拓扑(P1),将并行策略、传统数据中间多接管 Clos 架构,较 Clos(91.6%)提升 7.2%,难以知足 LLM 磨炼的大规模、MoE-10T 等模子磨炼中,每一机架格外配置装备部署 1 个备用 NPU,DDR同享)。
为处置架构落地挑战,同时经由锐敏带宽调配,它不光在实际上证明了分层部份化收集妄想的优异性,
该拓扑以短距离电衔接为主(占比 86.7%),到机架级 2D 全衔接(1D mesh 间互连),为近距离通讯(TP/SP)提供高带宽,高基数交流机(HRS,GPT3-175B、揭示了从2D-FullMesh(机柜内)到4D-FullMesh(Pod内)再到SuperPod的扩展方式。适配 MoE 模子的专家并行需要。该集群外部,散漫源路由(8 字节松散头实现道路调拨)、削减路由表开销)与拓扑感知无去世锁流控(TFC 算法,华为妨碍了一场线上分享,路由等与拓扑深度协同,接管 “直接见告” 机制, 声明:本文内容为不代表国际教育资讯网的观点和立场,本平台仅提供信息存储服务。