首页 > 其他分享 >DDCA —— 网络、数据中心与可靠性

DDCA —— 网络、数据中心与可靠性

时间:2024-12-21 20:20:29浏览次数:6  
标签:数据中心 可靠性 frac 互连 网络 DDCA 数据包 节点 延迟

1. Ring

每个节点连接到一个 \(3 \times 3\) switch,该 switch 负责在节点和其两个相邻节点之间传递消息。

实际上,它是一个重复的总线:可以同时传输多条消息

缺点:二等分带宽为 2,平均需要 \(N/2\) 跳。

image-20241216105448642

2. 拓扑示例

image-20241216113358265

3. k-ary d-Cube

k-ary d-cube 是一个 d 维数组,每个维度包含 k 个元素。数组中两个元素如果在某一维度上的值相差 1(取模 k),则它们之间有一条连接。

节点数量:\(N=k^d\)

当 \(N = 64\),对于 Torus 为 \(8^2\),对于 Hypercube 为 \(2^6\)。

所以该 Torus 为一个 2 维网络,该 Hypercube 为一个 6 维网络。

Torus 网络的坐标可以用 (5,6) 表示,Hypercube 网络的坐标可以用 000001 表示。

  • switch 数量:\(N\)

  • switch 度数:\(2d+1\)

  • 链路数量:\(Nd\)

  • 每个节点的引脚数:\(2wd\)

  • 平均路由距离:\(\frac{d(k-1)}{4}\)

  • 直径:\(\frac{d(k-1)}{2}\)

  • 二分带宽:\(2wk^{d-1}\)

  • switch 复杂度:\((2d+1)^2\)

对于超立方体的调整

  • 超立方体的 switch 度数、链路数量、每个节点的引脚数、二分带宽均为上述值的一半。
  • 超立方体的直径和平均路由距离是上述值的两倍。
  • 超立方体的交换机复杂度为 \((d+1)^2\)。
  • 超立方体与 k-ary d-cube 的主要区别是,它没有左右邻居连接。

维度的取舍

  1. 维度 \(d\) 增大时!!!k 和 d 是相互制约的关系!!!
  • 优点:
    • 平均路由距离 \(\frac{d(k-1)}{4}\) 减小,意味着数据包在网络中传播的跳数减少,从而提升通信效率。
    • 网络直径 \(\frac{d(k-1)}{2}\) 减小,意味着任意两个节点之间的最远距离缩短,通信时延降低。
  • 缺点:
    • 每个交换机的度数 \(2d+1\) 增加,意味着每个 switch 需要支持更多的端口,硬件复杂度和成本上升。
    • 链路数量 \(Nd\) 增加,网络的布线复杂度上升。
    • 二分带宽 \(2wk^{d-1}\) 增加,对网络性能是好事,但实现成本也会提升。

3. 互联网络

性能

image-20241216151111252

横轴Injection rate into the network,即网络负载的注入速率,也可理解为数据发送的速率。

纵轴Latency,即数据在网络中传输所需的时间。

绿色曲线显示了随着负载(Injection Rate)的增加,网络的延迟表现。

  • 在低负载下,延迟接近零负载延迟 (Zero Load Latency)
  • 随着负载增加,网络资源变得拥塞,延迟迅速上升。
  • 在接近饱和吞吐量 (Saturation Throughput) 时,延迟会急剧增长。

3.1 理想延迟

仅由源节点到目的节点之间的线延迟 (Wire Delay) 决定。

\[T_{ideal} = \frac{D}{v} + \frac{L}{b} \]

  • D = 曼哈顿距离 (Manhattan Distance)

    • 两个点之间的距离,沿着相互垂直的轴测量。

    • 例如:在网格中,从源到目的地只能沿着水平和垂直方向移动,而不能沿对角线直接穿过。

  • v = 传播速度 (Propagation Velocity):信号在网络中传播的速度。

  • L = 包大小 (Packet Size):数据包的总大小。

  • b = 信道带宽 (Channel Bandwidth):信道每单位时间可以传输的数据量。

3.2 真实延迟

专用布线不切实际 (Dedicated wiring impractical)

  • 在实际互连网络中,使用长距离专用布线的成本和实现难度较高,因此需要其他方法来优化布线。

  • 为了克服长导线的时延问题,将长导线分成多段,每一段之间插入路由器来进行数据中继传输。

\[T_{actual} = \frac{D}{v} + \frac{L}{b} + H \cdot T_{router} + T_c \]

  • D = 曼哈顿距离 (Manhattan Distance)

  • v = 传播速度 (Propagation Velocity)

  • L = 包大小 (Packet Size)

  • b = 信道带宽 (Channel Bandwidth)

  • H = 跳数 (Hops):数据包在网络中从源节点到目标节点所经过的路由器数量。

  • \(T_{router} =\) 路由器延迟(Router latency):数据包通过一个路由器所需的时间,包括存储、转发和处理的时间。

  • \(T_c =\) 由竞争引起的延迟 (Latency due to contention):由于网络中多个数据包同时争用同一信道或资源而导致的延迟。

3.3 负载延迟曲线

image-20241216152400093 image-20241216152443041

3.4 网络性能指标

数据包延迟 (Packet latency, 平均/最大)

  • 平均延迟:数据包从源点到目的地的平均传输时间。
  • 最大延迟:所有数据包中最长的传输时间。

往返延迟 (Round trip latency, 平均/最大)

  • 请求-响应层面:指从发送请求到接收响应所需的时间。
  • 缓存未命中服务时间 (Cache miss service time):当缓存未命中时,数据被获取并返回所花费的时间。

饱和吞吐量 (Saturation throughput)

  • 网络在达到饱和状态时,仍然能够维持的最大数据传输速率。

应用级性能 (Application-level performance)

  • 执行时间 (Execution time):应用程序完成其任务所需的时间。

系统性能 (System performance)

  • 作业吞吐量 (Job throughput):系统在单位时间内能够完成的任务数量。
  • 受到线程/应用之间干扰的影响 (Affected by interference among threads/applications):不同线程或应用之间的资源争用会影响整体系统性能。

4. On-Chip Networks

image-20241216152900738

连接核心、缓存、内存控制器等:主要目标是将处理核心缓存内存控制器等模块连接起来。

总线和交叉开关不具备可扩展性:传统的总线(Bus)和交叉开关(Crossbar)结构在规模增大时会遇到性能瓶颈,不适用于大规模片上网络。

通常采用分组交换(Packet Switched):数据在网络中通过分组的方式进行传输,而不是传统的电路交换。

二维网格(2D Mesh):常用的拓扑结构2D网格是片上网络中最常用的拓扑结构,简单且易于实现。

XY路由与FIFO或轮询端口仲裁常见

  • XY路由:数据先沿X轴移动,再沿Y轴移动到达目标节点。
  • FIFO(先进先出)或轮询仲裁(Round Robin Port Arbitration)常用于端口资源分配。

虚拟信道缓冲常见:使用虚拟信道(Virtual Channel)来缓冲数据,有助于缓解拥塞并提高网络效率。

主要用于缓存未命中和内存请求:片上网络的主要任务是服务于缓存未命中(Cache Misses)和内存请求(Memory Requests),以加速数据传输。

image-20241216153408100

4.1 On-Chip vs. Off-Chip Interconnects(片上互连与片外互连的比较)

  1. 片上互连的优势
  • 核心之间的低延迟
  • 没有引脚限制
  • 丰富且低功耗的布线资源
  • 带宽非常高
  • 全局协调更简单
  1. 片上互连的约束/劣势
  • 2D基底限制了易于实现的拓扑结构*

  • 能量/功耗是关键问题

    • 复杂算法不可取

    • 大型缓冲器不可取

  • 逻辑面积和金属层限制了布线资源的使用

  1. 成本对比
  • 片外互连:主要成本来自通道、引脚、连接器和电缆等。

  • 片上互连:主要成本是存储和交换结构(布线资源丰富)。

4. 设计趋势

  • 结果:设计出带宽非常宽但缓冲较少的网络。

5. 通道特性

  • 片上互连:传输距离短,延迟低。

6. 工作负载

  • 片外互连:大型并行应用程序中的多芯片通信流量。
  • 片上互连:多核架构下的缓存/内存通信流量

标签:数据中心,可靠性,frac,互连,网络,DDCA,数据包,节点,延迟
From: https://www.cnblogs.com/Astron-fjh/p/18621120

相关文章

  • DDCA —— 片上网络互联
    DDCA——片上网络互联 CS6810AppendixF.InterconnectionNetworks.的学习笔记,详细介绍了片上网络中的路由、死锁、数据包、流控单元、流量控制、虚拟信道、路由器流水线、Crossbar和双向带宽。 1.路由1.1网络拓扑示例Grid(网格)网络拓扑通常是一个二维矩阵形式,每......
  • 数据中心UPS电池维护详细攻略
    数据中心作为现代社会信息处理和存储的核心,UPS系统作为其电力保障,能够在电力中断时提供紧急电力支持,避免数据丢失和服务中断。UPS系统的高效、安全运维已成为数据中心管理中的一个核心任务。尽管现代UPS系统中使用的大多数电池都是“免维护”的,但它们仍然容易因电池量下降、极......
  • 数字乡村大数据中心及大数据运营管理平台建设方案
    1.方案概述本方案旨在构建数字乡村大数据中心及大数据运营管理平台,通过数字化手段推动乡村治理现代化,提升乡村公共服务水平,促进乡村经济持续发展。2.数字乡村大数据中心建设数字乡村大数据中心是整个方案的核心,负责收集、存储、处理和分析乡村各类数据。通过整合政府、企......
  • DDCA —— 内存一致性
    1.同步(Synchronization)1.1构造锁(Locks)原子(atomic)执行:应用程序的某些部分必须独占执行(原子性),这意味着在这些部分执行期间,其他并行进程无法访问或修改相关数据。比如一个账户转账操作,需要保证资金不会被同时修改,避免出现不一致的状态。锁的作用:锁(Lock)用于保护数据或代码块,确保......
  • 城域网与数据中心互联 保姆级讲解(BGP综合选路)的配置过程及验证 HCIP大型网络设计必备
    本实验模拟某市ISP骨干网与两个数据中心互联的网络一、   实验拓扑二、   基础构思规划1.预配置包括:1.1所有设备互联IP已配置,且所有设备都有Loopback0地址。1.2SW1与SW2已创建vlan、划分vlan、并创建vlanif。1.3PC已配置IP和网关。2.在所有设备的系统......
  • TCP的“可靠性”(上)
    目录TCP的“可靠性”(上)确认应答(可靠性传输的基础)超时重传连接管理(三次握手,四次挥手)TCP的“可靠性”(上)想必大家都或多或少的听说过TCP的特性:有连接,可靠传输,面向字节流,全双工本文重点讲讲TCP的“可靠性”网络通信过程是复杂的,无法确保发送方发送出去的数据,100%能够......
  • 一次彻底掌握数据中心级的JVM调优实战经验
    出现内存溢出的场景通常发生在应用程序中存在内存泄漏、对象生命周期过长、对象频繁创建但未能及时回收等问题。以下是几个真实的业务场景,结合内存溢出问题,并从多个角度提出优化方法,来提高内存使用效率。场景1:大量业务数据缓存导致堆内存溢出场景描述:一个企业级Web应......
  • 企业三要素核验确保企业真实合法性和信用可靠性
    企业三要素核验是确保企业真实合法性和信用可靠性的重要步骤,主要涉及对企业名称、统一社会信用代码(或注册号)以及法定代表人姓名这三个关键要素的验证。以下是对企业三要素核验的详细阐述:一、企业三要素核验的意义确保企业真实性:通过核验企业名称、统一社会信用代码和法定......
  • 读数据质量管理:数据可靠性与数据质量问题解决之道19数据未来
    1. 开创可靠数据系统的未来1.1. 数据作为一个行业很可能正在经历一场巨大且不可逆转的巨变1.2. 分析型数据正变成现代企业最关键和最具竞争力的核心资产1.2.1. 不再是公司是否依赖数据的问题1.2.2. 是使用多少数据以及将数据用于什么场景的问题1.3. 仅仅收集更......
  • 不间断电源 (UPS) 对现代技术可靠性的影响
    在这个技术型世界里,无论是在个人还是商业环境中,电力供应商提供的稳定供电都变得越来越重要。不间断电源(UPS)系统是一种不可或缺的解决方案,可保证终端设备不受干扰地运行,在出现电源问题或故障时让用户继续工作。这篇文章探讨了UPS用途的重要性、其优势以及它们在各种技......