热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

数据中心_数据中心硬件架构拆解分析

篇首语:本文由编程笔记#小编为大家整理,主要介绍了数据中心硬件架构拆解分析相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了数据中心硬件架构拆解分析相关的知识,希望对你有一定的参考价值。






图片

 

图片

内容来自:全栈云技术架构,《IDC系列报告全集》 下载链接:IDC系列报告全集

IDC系列报告一:数字产业基石,关注核心IDC企业

IDC系列报告二:还原IDC行业的真实盈利能力

IDC系列报告三:数据中心中各类IT硬件占比拆分

IDC系列报告四:公募REITs政策助力,IDC如虎添翼

IDC系列报告五:流量巨头共舞,尽享景气红利

IDC系列报告六:从DCF看IDC行业的价值

 

本文参考,叶脊架构更加适应超大型数据中心发展趋势,并拉动高速光模块及网络设备不断升级。

 

1)叶脊架构最早 Facebook 提出,由于其更加适应全球超大型数据中心发展趋势,现在广泛应用于全球各大数据中心。

 

2)叶脊架构可以划分为机柜层、Leaf 层和 Spine 层,所用 IT 设备分别为,机柜层(服务器、ToR 交换机、光模块);Leaf 层(Leaf 交换机、光模块);Spine 层:(Spine交换机、光模块)。

 

3)叶脊架构主要以 Server 到 Server 之间互联流量为主,为了实现内部互联,如机柜间互联以及 Leaf-Spine 互联的短距高速高模块需求大幅增加。而 Server 到 Spine 交换机流量压力得到很大缓解,数据中心设计往往向上也呈现一定的收敛比。与此同时,交换机也伴随升级:端口数量越来越多,芯片转发速率越来越高。

 

 

1、初识叶脊架构

 

Facebook 于 2014 年提出一种新兴的网络架构,即叶脊架构(Spine-Leaf)。叶脊架构较传统网络架构相比,数据交换和吞吐能力更强,网络也更加扁平化和密集。目前已经成为全球的云计算/互联网公司,包括国内的阿里腾讯等,数据中心的主流部署方式。

 

为了更加清晰的拆分云计算企业的CAPEX 结构,首先我们需要了解叶脊架构的构成。以 Facebook 数据中心为例,自下而上可以划分为:机柜层、Leaf 层、Spine 层。

 

机柜层:机柜层是整个网络拓扑架构中最底层的结构,用于放置服务器,通常来说单机柜可以放置 20-24 台标准服务器。机柜内部的服务器互联通过机柜顶层的交换机,该交换机也被称为 ToR(Top of Rack)交换机。实际上 TOR 交换机既可以部署在机柜顶部,也可以部署在机柜的中部 (Middle of Rack)或底部 (Bottom of Rack)。通常而言,将交换机部署在机柜顶部是最有利于走线的,因此这种架构应用最多。

 

Leaf层:Leaf 层是网络架构中承上启下的一层,主要由叶交换机组成。叶交换机向下与 ToR交换机相连,向上与脊交换机相连。每台叶交换机则向下连接 48 台 ToR 交换机,这样通过叶交换机便实现了机柜之间的互联。48 台 ToR 交换机与 4 台叶交换机对应划分出的结构也被称为 Server Pods。数据中心在部署时根据需求,划分为 N 个 Server Pods, N 的数量可以从几十到几百。边缘的 Pod 又被称为 Edge 平面,负责出口流量,实现数据中心之间的互联。

 

Spine层:Spine 层是整个数据中心拓扑网络的顶层。为了实现全网的连通性,Facebook 设计了四个独立的骨干交换机平面(Spine plane),每个平面可以根据需求扩展脊交换机,而每个 Pod 的每一台叶交换机都会与所在平面的每一台脊交换机互联。

 

按照 Facebook 最初提出的叶脊架构进行估算,整个数据中心共可以容纳的服务器总数量为24*48*N 台服务器网络的彼此互联。通过设计更多的 Server Pods,则单个数据中心可以实现高达几十万台的服务器的容量。

 

图片

 

2、叶脊架构带来 IT设备变化

 

叶脊架构拉动高端光模块需求。随着全球数据流量爆发式增长,建设大型的数据中心较传统的小数据中心具有显著的成本优势,为适应数据中心规模的扩大以及提升流量传输效率,原有的三层网络架构与数据中心的发展格格不入,性能出现瓶颈,在此背景下叶脊架构诞生了。

 

叶脊架构下,每层网络结构所用 IT 设备如下图所示:

 

图片

 

机柜层:服务器、ToR 交换机、光模块;

Leaf 层:Leaf 交换机、光模块;

Spine 层:Spine 交换机、光模块;

 

叶脊架构以东西向(East-West)流量为主,如机柜间互联以及 Leaf-Spine 互联的短距高速高模块需求大幅增加,当前北美应用最为广泛的为 100G 光模块,并且随着数据流量的增加 100G 光模块正在向 400G 升级。而南北向流量压力得到很大缓解,数据中心设计往往向上也呈现一定的收敛比,南北向光模块如 ToR-Leaf 互联光模块和 Leaf-Spine 互联光模块速率并不会显著升级。与此同时,交换机也伴随升级:端口数量越来越多,芯片转发速率越来越高。

 

3、IT设备用量的详细拆解

 

以下,我们将按照前一小节所阐述的叶脊架构,对数据中心内部服务器、交换机、光模块等几类 IT基础产品的用量进行详细拆解。核心假设:

 

1. 高功耗单机柜满载 24 台服务器; 

2. ToR 交换机上下行端口比例为 1:6; 

3. Leaf 交换机上下行端口比例为 1:6;

4. Spine 交换机不考虑上行,不考虑数据中心之间互联的 Edge 交换机

 

5. 目前海外主流光模块方案,服务器互联采用 25G 光模块,ToR 与 Leaf 交换机、Leaf 与 Spine交换机采用 100G 光模块。

 

机柜层:服务器和交换机用量较为清晰,单机柜设计的服务器数量为 24 台,机柜顶放置 1 台 ToR 交换机。交换机分为下行接口和上行接口。下行即连接下层的服务器,上行即连接上层的叶交换机,中间通过两端带有光模块的 MTP/MPO 光纤连接器进行连接。光模块用量按照如下测算:

 

下行的测算:24(24 台服务器,一台服务器连一个光模块)+ 24(ToR 交换机 24 个下行接口)= 48 个,一般采用为 25G 连接。上行的测算:一台 ToR 交换机一般 4 个上行接口(连接 4 个叶交换机),上行接口速率为100G。

 

小结:按照单机柜折算,即需要 24 台服务器,1 台 ToR 交换机,48 个 25G 光模块,4 个 100G高速光模块。

 

Leaf层:不含服务器,只计算交换机与光模块用量。交换机用量较为清晰,一个 Pod(48 个机柜)对应 4 台叶交换机。光模块用量按照如下测算:下行的测算:

 

对应于 ToR 交换机的上行,一台叶交换机有 48 个下行速率为 100G 的端口,即需要 48 个 100G 的光模块。上行的测算:考虑到在 Leaf 层南北向流量较少,可以按照 1:6 的收敛比进行设计,即 8 个上行接口,Spine 平面设计 8 台脊交换机。因此单台叶交换机最多对应 6 个 100G 光模块。

 

小结:按照单机柜折算,即需要 4/48=0.08 台叶交换机,(48+8)*(4/48)=4.7 个 100G 高速光模块。

 

Spine层:按照 4 个 Spine 平面,每个平面扩展 8 个脊交换机,脊交换机总用量为 32 台;按照 64 个 Pod 平面估算,每个 Pod 平面对应 0.5 台脊交换机。光模块用量的估算,每台脊交换机下行与每个 Pod 所在平面的叶交换机相连,则要求脊交换机要有 64 个下行端口,每台脊交换机对应高速光模块用量 64 个。

 

小结:按照单机柜折算,即需要 0.5/48=0.01 台脊交换机,64*(0.5/48)=0.67 个 100G 高速光模块。

 

将以上汇总后,合计单机柜对应服务器 24 台、1 台 ToR 交换机,1/12 台叶交换机,1/96 台脊交换机、48 个 25G,28/3 个 100G 更高速光模块,具体用量如下表所示:

 

图片

 

4、IT设备价值量的拆算

 

云计算基础设施各细分领域,IDC:服务器:网络设备:光模块大约为 15:72:3.3:2.6(对应16%:77%:4%:3%)的关系。对于超大型云计算数据中心,交换机所需要的型号更加高端,价值量更高。注意的是,该测算未包括光纤光缆、跨洋光缆等测算。因此平均来说,单机柜的资本开支可能更大。

 

但总体来说,几类常见 IT 设备间的配比关系,相对正确。按照如前一小节的拆解,单机柜的投资金额可以划分为如下几个部分: 

 

图片

 

IDC及机柜 CAPEX:根据项目以及建设地理位置不同,单机柜投资金额在 12-18 万之间,按照平均 15 万进行估算,其中投资包含了土地、建筑、机柜、温控系统、供电系统(柴发、蓄电池)等等。该项投资一般情况由 IDC 企业支出,特殊情况下如阿里定制化模式,土地支出及所有权不属于 IDC 企业。定制化模式下单机柜的投资成本可能更低。

 

服务器:目前标准的机柜通常按照满载 24 台服务器设计,实际根据客户需求不一定按照 24台满载运行。在此估算中暂且按照 24 台满载进行估算。

 

交换机:ToR 交换机通常为 24 口,价格约在 2 万元左右;Leaf 交换机和 Spine 交换机会根据支持端口速率或数量的不同,价格有较为明显的差异。以某一线品牌 Leaf 交换机(48 个 10G 下行接口,6 个 100G 上行接口)为例,软硬件报价约在 4 万元左右;某一线品牌 Spine交换机(18 个 100G 下行接口)为例,软硬报价约在 30 万左右。一般来说,数据中心规模越大,要求使用的 Leaf 和 Spine 交换机的端口速率和数量越多。超大规模的数据中心使用的 Spine 交换机价格甚至在成百上千万元/台。在此 64 端口的脊交换机我们按照 100 万元进行估算。

 

光模块:目前数据中心主流采用 25G 端口服务器,因此服务器上行以及 ToR 交换机下行之间的端口连接采用 25G 光模块;而 ToR 交换机上行、Leaf 交换机以及 Spine 交换机采用100G 光模块,甚至升级为更高速率光模块。从通信板块的投资弹性来说:

 

光模块:下游应用场景中数据中心光模块价值占比量高,且受益于产品升级迭代的量价齐升;

 

IDC:存量机柜贡献稳定利润,增量机柜体现利润增速(增量机柜只有量的弹性);

 

网络设备:下游应用场景中数据中心占比较小,企业级应用较高。因此云计算基础设施领域投资弹性排序为:服务器,光模块>IDC>网络设备。

 

来源:全栈云技术架构

 

下载链接:IDC系列报告全集

超融合数据中心网络白皮书

低碳数据中心发展白皮书(2021)

数据中心产业发展指数(2021)

腾讯隐私计算白皮书(2021)

京东云原生:技术实践与探索之路

边缘计算产业安全和生态建设

 

 

图片

 

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

 

推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。

 

 

温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)”电子书资料详情。

图片




推荐阅读
  • 单点登录原理及实现方案详解
    本文详细介绍了单点登录的原理及实现方案,其中包括共享Session的方式,以及基于Redis的Session共享方案。同时,还分享了作者在应用环境中所遇到的问题和经验,希望对读者有所帮助。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 开发笔记:计网局域网:NAT 是如何工作的?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了计网-局域网:NAT是如何工作的?相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 众筹商城与传统商城的区别及php众筹网站的程序源码
    本文介绍了众筹商城与传统商城的区别,包括所售产品和玩法不同以及运营方式不同。同时还提到了php众筹网站的程序源码和方维众筹的安装和环境问题。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 本文详细介绍了在Linux虚拟化部署中进行VLAN配置的方法。首先要确认Linux系统内核是否已经支持VLAN功能,然后配置物理网卡、子网卡和虚拟VLAN网卡的关系。接着介绍了在Linux配置VLAN Trunk的步骤,包括将物理网卡添加到VLAN、检查添加的VLAN虚拟网卡信息以及重启网络服务等。最后,通过验证连通性来确认配置是否成功。 ... [详细]
  • Harmony 与 Game Space 达成合作,在 Shard1 上扩展 Web3 游戏
    旧金山20 ... [详细]
  • React 小白初入门
    推荐学习:React官方文档:https:react.docschina.orgReact菜鸟教程:https:www.runoob.c ... [详细]
author-avatar
彭德利
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有