数据中心是一种物理设施,提供操作程序的计算能力,处理信息的存储,以及将人们连接到执行任务和支持企业运营所需的资源的网络。
一、什么是数据中心?
数据中心是一个房间、一座建筑物或一组建筑物,用于容纳后端计算机系统,设有用户界面和冷却能力、物理安全、网络设备等支持系统。远程数据中心为所有云基础设施提供动力。
数据中心是一种物理设施,提供操作程序的计算能力,处理信息的存储,以及将人们连接到执行任务和支持企业运营所需的资源的网络。
由于服务器的密集集中,有时数据中心被称为服务器场。它们提供信息存储、恢复和备份信息管理以及网络等基本服务。
几乎每个企业和政府机构都需要自己的数据中心或访问第三方设施。一些企业在内部建造和运营服务器,还有一些企业从托管设施租用服务器。相比之下,其他人仍然利用谷歌、微软和亚马逊网络服务等主机提供的基于公共云的服务。
一般来说,有四个公认的数据中心级别。分配给这些数据中心的数值层表示冗余基础设施、电源和冷却系统。通常分配给这些级别的是以下值或功能:
第一层:不提供内置冗余,以确保最佳可用性和数小时的年度停机时间。
第二层:由于合并了部分冗余,以确保电力和空调继续支持运营,因此减少了每年的停机时间。
第三层:确保更大的正常运行时间和对电源和冷却问题的保护,每年的停机时间不到几个小时。
第四层:每年提供99.995%的正常运行时间,每年停机时间不到1小时。
应用、信息和内容的存储和计算能力都位于数据中心。在这个基于云计算、应用驱动的世界中,访问这些数据是一个主要问题。使用高速分组光通信,数据中心互连技术跨短、中或长距离连接两个或多个数据中心。
此外,超融合数据中心建立在超融合基础设施之上,该基础设施是一种整合计算、网络和存储商品硬件的软件架构。将软件和硬件组件合并到一个数据中心,简化了处理和管理过程,并带来了降低组织IT基础设施和管理成本的额外好处。
二、数据中心如何工作?
数据中心的工作是建立在成功执行数据中心操作的基础上的。数据中心的运营包括日常维护数据中心的系统和流程。
数据中心的运营包括建立和管理网络资源、保证数据中心的安全、监控电源和冷却系统。不同类型的数据中心在大小、可靠性和冗余方面存在差异,且是由运营数据中心的企业的IT需求定义的。云计算的扩展正在推动它们的现代化,包括自动化和虚拟化。
数据中心包括通过通信和网络设备在外部和内部连接的真实或虚拟服务器,以存储、传输和访问数字数据。每台服务器都与家用计算机相当,因为它包含CPU、存储空间和内存,但功能更强大。数据中心使用软件将计算机集群,并在它们之间分配负载。为了保持所有这些正常运行,数据中心使用以下关键元素:
1、高可用性系统和冗余
数据中心中的可用性是指在任何时候都处于操作状态的组件。定期对系统进行维护,以保证未来的活动顺利进行。我们可以安排故障转移,其中服务器将职责切换到远程服务器以增加冗余。在IT基础设施中,冗余系统降低了单点故障的风险。
2、网络运营中心
网络运营中心是为负责监控、管理和维护数据中心计算机资源的员工或专职人员提供的工作空间。网络运营中心可以提供数据中心的所有信息并更新所有活动。其负责人可以查看和控制正在监控的网络可视化。
3、不间断电源
毫无疑问,电源是数据中心最关键的方面。托管设备或网络托管服务器使用数据中心内部的专用电源。每个数据中心都需要电源备份,以确保其服务器持续运行,并保持整体服务可用性。
4、物理安全措施
安全的数据中心需要实施安全机制。首先必须确定DC基础设施中的弱点。多因素身份识别、整个建筑的监控、金属探测器和生物识别系统是确保最高安全水平的一些措施,数据中心还需要现场安全人员。
5、强大的冷却系统
电源和冷却在数据中心中同样重要。主机托管设备和网络托管服务器需要足够的冷却以防止过热并保证其持续运行。数据中心的建设应该保证有足够的气流,并且系统始终保持凉爽。
6、备用电源系统
不间断电源和发电机都是备用系统的组成部分。在电力中断期间,发电机可以配置为自动启动。只要发电机有燃料,它们就会在停电期间继续运行。UPS系统应提供冗余,以便故障模块不会影响整个系统的能力。定期维护UPS和电池可降低停电期间发生故障的可能性。
7、数据中心计算机化维护管理系统
CMMS是监控、测量和增强维护计划的最有效方法之一。该计划使数据中心管理层能够跟踪对其资产执行的维护工作的进度和相关成本。该计划将有助于降低维护成本,提高内部效率。
在现代数据中心中,人工智能也在其工作中发挥着重要作用。通过人工智能,算法可以实时监控能量分配、冷却能力、服务器流量和网络威胁,并自动调整效率,完成传统的DCIM任务。人工智能可以将工作负载转移到未充分利用的资源,识别可能的组件故障,并平衡池中的资源。它以最少的人为干预来实现这一点。
三、数据中心类型
1、企业级数据中心
企业为其终端客户构建并拥有这些私有数据中心。它们可以放置在内部和外部,服务于单个企业的IT流程和基本应用。在自然灾害中,企业可以将业务活动与数据中心操作隔离开来。或者,它可以在较冷的环境中建造数据中心,以减少能源消耗。
2、主机托管设施
多租户数据中心,称为托管数据中心,为希望远程托管其计算机设备和服务器的企业提供数据中心空间。
托管中心内的这些出租空间是其他方的财产。租赁公司负责提供硬件,而数据中心负责提供和管理基础设施,包括物理区域、连接、通风和安全系统。
对于那些希望避免开发和运营自己的数据中心所涉及的高资本成本的企业来说,托管很有吸引力。
3、边缘计算数据中心
对即时连接的渴望、物联网的扩展以及对洞察力和机器人技术的需求正在推动边缘技术的出现,这些技术使处理能够更接近实际数据源。边缘数据中心是一种紧凑的设施,通过位于网络边缘和数据源附近来解决延迟问题。
这些数据中心很小,而且靠近其服务的用户,允许与智能设备进行低延迟连接。通过处理尽可能接近终端用户的多种服务,边缘数据中心使企业能够减少通信延迟并增强客户体验。
4、超大型数据中心
超大规模数据中心旨在承载大规模的IT基础设施。这些超大规模计算基础设施是亚马逊、Meta和谷歌等大规模提供商的同义词,它们优化了硬件密度,同时降低冷却成本和管理开销。
与业务数据中心一样,超大规模数据中心由其所服务的企业拥有和维护,尽管对于云计算和大数据保留平台而言,其范围更广。超大规模数据中心的最低要求是5000台服务器、500个机柜和10000平方英尺的占地面积。
5、云数据中心
这些分散的数据中心由AWS、MicrosoftAzure和Googlecloud等第三方或公共云提供商运营。租用的基础设施基于基础设施即服务的方法,允许用户在几分钟内建立虚拟数据中心。请记住,对于管理云数据中心的云提供商来说,云数据中心与任何其他类型的物理数据中心一样运行。
6、模块化数据中心
模块化数据中心是与即用即插即用数据中心元素捆绑在一起的模块或物理容器:服务器、存储、网络硬件、UPS、稳定器、空调等。在永久性的情况下,它们的实施是为了腾出空间或让组织快速发展,例如安装IT设备以支持教育机构的教室。
7、托管数据中心
在托管数据中心中,第三方提供商为企业提供处理、数据存储和其他相关服务,以帮助管理其IT运营。这种数据中心类型由服务提供者部署、监视和维护,服务提供者通过受控平台提供功能。
也可以通过托管设施、基于云的数据中心或固定的托管位置获得托管数据中心服务。托管数据中心可能完全或部分托管,但与托管不同,默认情况下这些数据中心不是多租户的。
四、数据中心架构
现代数据中心的设计已经从本地基础设施,转变为将本地硬件与云环境混合在一起,其中网络、应用或工作负载跨多个私有和公共云进行虚拟化。这一创新彻底改变了数据中心的设计,因为所有组件不再位于同一位置,只能通过互联网访问。
一般来说,数据中心结构有四种:网格结构、三层或多层结构、网格交付点结构和超级脊柱网格结构。
而由基础层、聚合层和访问层组成的多层结构已成为企业数据中心最流行的体系结构方法。
核心:它允许连接到多个聚合模块和网络,以便在多个聚合单元之间进行分组交换。
聚合:它包括服务模块集成、第二层域的设置、跨树分析扩展和冗余默认网关。
访问:它提供对系统资源的物理级访问,并以第2层和第3层模式运行。此外,它对于处理特定的服务器需求也是必不可少的。
接下来是网状数据中心架构。网状网络模型是指通过链接交换机在组件之间交换数据的拓扑结构。由于其可靠的容量和最小的延迟,它可以提供基本的云服务。此外,由于其分散的网络拓扑结构,网格配置可以快速实现任何连接,并且构建成本更低。
该网状传输点(PoD)包括连接在PoD内部的多个叶交换机。这是一种反复出现的设计模式,其中组件可以提高数据中心的模块化、可扩展性和管理能力。因此,数据中心经理可能会在其现有的三层拓扑结构中快速添加新的数据中心架构,以满足新云应用的极低延迟数据流。
综上所述,超级脊柱架构适用于大型校园式数据中心。这种数据中心架构通过东西向的数据通道处理大量数据。
数据中心将在这些替代架构中包含一个设施及其内部基础设施。站点是数据中心的物理位置。数据中心是一个巨大的开放空间,其中安装了基础设施。几乎每个地方都能容纳IT基础设施。
基础设施是安装在设施内的大量IT设备。这是指负责运行应用程序并提供业务和用户服务的硬件。传统的IT基础设施包括服务器、存储、计算机网络和机架等。
设计或建造数据中心没有强制性或必要的标准,数据中心旨在满足组织的独特需求。然而,任何标准的根本目的都是为最佳实践提供一致的基础。存在几种现代数据中心规范,企业可能采用其中的一些或全部。
EN50600系列:IT电缆和网络标准化包括各种基础设施冗余和可靠性概念,前提是UptimeInstitute的Tier标准。
UptimeInstituteTierStandard:通过数据中心的设计、建造和调试,建立了设施的恢复能力。
ANSI/TIA942-B:包括建筑设计、规划、施工和调试、消防、信息技术和维护。
五、数据中心最佳实践
在设计、管理和优化数据中心时,可以遵循以下最佳实践:
1、计划未来
在开发数据中心时,提供增长空间是至关重要的。为了节省成本,数据中心设计人员可能会寻求限制设施容量以满足企业当前的需求,然而,从长远来看,这可能是一个代价高昂的错误。随着需求的变化,为新设备预留一个空间至关重要。
2、通过测量PUE优化能源利用
没有衡量的东西是无法规范的,因此,监控能源使用情况可以解释数据中心的系统效率。电力使用效率是用于减少非计算能源使用的统计数据,如冷却和电力传输。为了优化使用,需要经常测量PUE。由于季节天气变化对PUE有很大影响,因此收集全年的能源信息就显得尤为重要。
3、投资于预测性维护
检查和预防性维护通常按时间间隔进行,以防止部件和系统故障。尽管如此,该技术忽略了实际操作条件。利用分析和智能监控技术可能会改变维护程序。具有机器学习功能的强大分析平台可以预测维护需求。
4、定期回顾和清理数据集
即使计算机内存的价格不断下降,全球归档每年也要花费数十亿美元。通过删除和保留数据,数据中心的IT基础设施摆脱了负担,从而减少了调节费用和能耗,更有效地分配了计算资源和存储。
5、通过建立冗余来提高正常运行时间
对于数据中心来说,在发生故障时为网络设备和通信通道创建备份路径是一个巨大的挑战。这些冗余提供了一个备份系统,允许人员在不影响服务的情况下进行维护和执行系统升级,或者在主系统出现故障时切换到备份系统。数据中心内的层系统,编号从1到4,定义了客户可能期望的正常运行时间(4是最高的)。
六、总结
数据中心是现代计算的支柱。它们不仅存储信息,还支持分析和建模等资源密集型数据操作。通过投资数据中心架构,我们可以更好地支持IT和业务流程。一个运行良好的数据中心是一个停机时间最少、容量可扩展、同时将成本保持在最佳水平的数据中心。
来源于:数据中心运维管理
标签:数据中心,基础设施,哪些,托管,网络,类型,服务器,冗余 From: https://www.cnblogs.com/northlander/p/18190257