华为Fellow廖恒博士Hot Chips 2025演讲:UB-Mesh超节点互联架构详解
由于超级节点系统规模更大,我们需要花很多心思考虑系统的弹性设计,以应对各种故障,包括链路级别、节点级别和机架级别。所以当我们谈论高带宽时覆盖大规模的低延迟网络,也能观察到一个趋势:每个节点的带宽正从每秒百千兆位扩展到每秒10甚至更多TB,这代表了网络带宽大约增加100倍。这就引出了一个问题:如何实现物理网络在增加100倍总带宽时,而不会导致其成本增加百倍?
要解决这个成本问题,还需要深入思考并采取针对性方案。我们相信这需要一种新的物理拓扑,也许是传统拓扑和其他组合在一起的新型拓扑混合体,以在满足特定工作负载所需带宽的同时,也维持合理水平的互连成本。
mp.weixin.qq.com
由于超级节点系统规模更大,我们需要花很多心思考虑系统的弹性设计,以应对各种故障,包括链路级别、节点级别和机架级别。所以当我们谈论高带宽时覆盖大规模的低延迟网络,也能观察到一个趋势:每个节点的带宽正从每秒百千兆位扩展到每秒10甚至更多TB,这代表了网络带宽大约增加100倍。这就引出了一个问题:如何实现物理网络在增加100倍总带宽时,而不会导致其成本增加百倍?
要解决这个成本问题,还需要深入思考并采取针对性方案。我们相信这需要一种新的物理拓扑,也许是传统拓扑和其他组合在一起的新型拓扑混合体,以在满足特定工作负载所需带宽的同时,也维持合理水平的互连成本。
mp.weixin.qq.com