热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

网络监控_云原生(业务)网络监控的建设思路与实现

本文由编程笔记#小编为大家整理,主要介绍了云原生(业务)网络监控的建设思路与实现相关的知识,希望对你有一定的参考价值。 受新冠疫情的影响,国内企业上云步伐被加速,云网络的服务水平成为企业上云的基石。国
本文由编程笔记#小编为大家整理,主要介绍了云原生(业务)网络监控的建设思路与实现相关的知识,希望对你有一定的参考价值。


受新冠疫情的影响,国内企业上云步伐被加速,云网络的服务水平成为企业上云的基石。国内外多家第三方机构的调查报告显示,企业上云的重要原则之一是在尽可能不修改应用的前提下,保证业务体验的一致性。得益于良好的可移植性、轻量、敏捷等优点,以容器、微服务为代表的云原生技术在企业上云过程中扮演着越来越重要的角色。

如上图所示,企业IT基础设施云化过程中引入的容器显著地加剧了云数据中心网络的复杂性,并进一步放大了虚拟网络的“黑盒”效应,给企业的监控、运维与安全合规带来了更大的挑战。企业需要建立面向云的网络监控架构,使之具备物理网络、池内网络流量统一分发,资源、网络、应用一体化监控管理能力,以便全面掌握网络资源使用状态,提高云网整体保障能力。

- 0-



复杂系统的可观测性问题

解决云网监控的难题,首先在于破解网络流量的“黑盒”——亦即,网络流量数据的可视化。传统的物理服务器的状态通常可以通过几个监控指标进行描述,但是随着云(虚拟化)系统越来越复杂以及业务安全稳定运行的要求越来越高,需要监控的对象正渐渐从“基础设施”转到“应用”本身。下图描述了对一个复杂系统的感知程度和能够收集到的信息之间的关系,而在云原生的行业大趋势下,通过技术手段描述系统更全面的状态、解决复杂系统的可观测性正在成为业界共识。

云原生(业务)网络监控的建设思路与实现

云计算正在颠覆传统的IT服务模式,网络作为云计算基础设施背后的重要角色,也在不断进化。云原生技术尤其是微服务的引入成为了业务和网络深度融合的催化剂,对云网络的全面观测成为业务端强劲的驱动力或者说需求。在网络方面,传统的监控工具通常是为了监控设备而设计的,其基于静态配置文件的方法并不适用于微服务或容器。在容器环境中,容器以令人难以置信的速度被创建和销毁,要解决云原生(业务)网络的观测性问题必须从更深入的数据着手。从当前较为成熟的NPM和APM市场来看,日志、Metrics和Tracing是解决云网络可观测性的三类重要数据源。

云原生(业务)网络监控的建设思路与实现




- 0-



网络的时序特性及其指标

大多数现代监控系统为诸多不同的目的提供了大量的指标,用户很容易淹没其中,难以聚焦到与应用相关的核心数据上。鉴于网络具备独特的时序特性,我们应该更关注Metrics的数据,对于Tracing和日志数据,我们通常关注Service/Ingress前后L4流关联、L7服务请求关联以及相关日志信息。我们重点关注Metrics四个方面的指标量:



  • 第一个方面是时延,它刻画的是当前的业务系统的访问是否顺畅、耗费的时间是否在增加,是检测性能下降问题的一个重要标志。例如说我们从四层网络的角度看,有三次握手的时延、协议栈响应的时延;从应用的角度看,有HTTP响应的时延、DNS响应的时延。


  • 第二个方面是流量,更多的是刻画系统的吞吐。例如一个应用系统的BPS是多少、PPS是多少?新建连接数、新建连接速率是多少?HTTP的请求数是多少等?流量可以等同于吞吐量或者是速率这样的指标。


  • 第三个方面是错误,错误可能发生在网络层,比如TCP的建连失败、TCP的重置、TCP的重传、TCP的零窗口,还可能会发生在应用层,比如HTTP的400、500等错误或者是DNS解析失败。错误信息是一个非常好的指标,通常能说明更深层次的问题。我们不仅要检测显性错误,还要检测隐性错误,例如不当的网络配置信息。


  • 第四个方面是负载——通常来自于系统信息,一般来讲是对计算和存储资源的描绘,在虚拟网络情情况下也可以描述虚拟交换机的负载。网络层面的负载主要体现在并发连接数、当前正在活跃的用户数等指标。测量负载的关键是选择制约系统性能的指标,从Kubernetes节点获取系统指标与其他系统基本相同。


云原生(业务)网络监控的建设思路与实现

我们对网络的指标监控通常要考虑以上四个方面,这四个方面(外部可观测数据以及系统自身数据)能够覆盖一个分布式系统所有的角落,最终实现分布式系统的可观测。



- 0-


DeepFlow
®
云原生监控系统

如前文所述,企业上云的重要原则之一是在尽可能不修改应用的前提下,保证业务体验的一致性。同理,对于已经上云的业务进行监控,也要确保其符合“云原生”的特性。云杉网络自研的DeepFlow®正是这样一款云网络流量采集、分发、可视化与监控诊断产品,帮助企业在混合云环境中统一采集并分发任意工作负载之间的网络流量,实现对云原生业务关键路径的全面性能监控,并提供虚拟网络端到端的全路径诊断,解决企业分布式业务上云后遇到的监控、运维、安全等难题。

云原生(业务)网络监控的建设思路与实现

众所周知,云的特性是弹性、敏捷。不同于传统烟囱式的监控系统,DeepFlow®在部署方式、随云扩展、多云平台对接、分布式架构几个方面率先做到了弹性和敏捷。



支持多云平台统一的抽象采集层

为了提升DeepFlow®的适用性,云杉网络做了大量的工作适配主流的资源平台和云平台,并不是简单调用API,而是要与知识图谱等对接和关联起来的。目前,DeepFlow支持与20多个市场主流平台做资源信息的同步,通过抽象统一的采集层、构建了较为完备的网络知识图谱的体系。

部署方式无依赖、一键式云原生部署

DeepFlow®采集器软件针对不同的资源池提供不同形态的版本,以发挥最优的网络流量捕获能力。采集器以进程形态独立运行并支持一键部署,共有包括VMware ESXi采集器、KVM采集器、KVM-DPDK采集器、HyperV采集器、Workload-V/Workload-P采集器、容器OnVM采集器、容器OnHost采集器、专属服务器采集器等多个类型;对于裸金属设备资源池,获取其池内网络流量可通过Leaf交换机、接入交换机的端口镜像,汇总至TAP设备后交由专属服务器类型采集器实现对数据包处理操作,也可以选择将采集器安装在每一台需要采集的裸金属设备系统上。

云原生(业务)网络监控的建设思路与实现




开放架构、监控能力可随云扩展

DeepFlow®控制器按角色分为主控制器、备控制器、从控制器,用户可根据实际部署要求进行灵活选择。单一控制器可管理2000个采集器,足以覆盖一个可用区涉及的采集规模。主、备控制器与从控制器协同工作,控制器集群规模最大支持50台,整体可管理10万台采集器规模,可满足大型企业私有IT、公有云、容器等对云数据中心资源池建设持续演进的网络流量监控分析要求。此外,采集器不再是简单地获取网络流量管道,是具备对本地采集的网络流量进行处理的计算单元,众多采集器以及控制器构建成一个与云网规模一致的分布式流量处理系统。

云原生(业务)网络监控的建设思路与实现


DeepFlow®平台提供开放的数据供给服务。处理后的包头,网络元数据、遥测统计数据通过网络平面汇总至数据节点的高性能时序数据库中,用户可通过API、消息队列为其他数据消费平台调用,数据节点与控制器一样支持水平扩展。用户可在每个区域、可用区都可以配置高性能时序数据库。数据供给服务同时将采集与后端各类分析工具解耦,避免流量采集器局限在仅为单一工具服务的竖井中。



- 0-


总结

企业在上云过程中,云网融合会逐步加深、业务或者说应用对网络的依赖将会越来越大。企业在建设统一的监控体系时,需要秉持开放和解耦的原则,重点聚焦云端业务的核心数据,避免重复建设和系统绑定。







关于DeepFlow®




DeepFlow®是北京云杉世纪网络科技有限公司(以下简称云杉网络)推出的一款虚拟网络流量采集、可视化与分析产品。DeepFlow®软件基于x86集群和通用网络设备,支持集群部署,支持容器(Kubernetes)、OpenStack、vSphere虚拟化环境和AWS、阿里云、腾讯云等公有云环境,帮助企业在混合云环境中统一采集并分发任意工作负载之间的网络流量,实现对云端业务关键链路的全面性能监控,并提供业务网络端到端的全路径诊断。凭借领先一代的技术优势和完整的产品解决方案,DeepFlow®已在50多家世界500强企业落地部署,不断为客户提供云网络治理的最佳实践。



           















RECOMMEND







推荐阅读















 阅读原文   访问云杉网络官方网站!


推荐阅读
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • 本文总结了初学者在使用dubbo设计架构过程中遇到的问题,并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题,初学者能够更好地理解和应用dubbo设计架构。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 本文介绍了将mysql从5.6.15升级到5.7.15的详细步骤,包括关闭访问、备份旧库、备份权限、配置文件备份、关闭旧数据库、安装二进制、替换配置文件以及启动新数据库等操作。 ... [详细]
  • Imtryingtofigureoutawaytogeneratetorrentfilesfromabucket,usingtheAWSSDKforGo.我正 ... [详细]
  • RouterOS 5.16软路由安装图解教程
    本文介绍了如何安装RouterOS 5.16软路由系统,包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程,方便读者进行操作。 ... [详细]
  • 解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法
    本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说,系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤,包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息,以帮助读者更好地理解和解决该问题。 ... [详细]
  • 本文介绍了禅道作为一款国产开源免费的测试管理工具的特点和功能,并提供了禅道的搭建和调试方法。禅道是一款B/S结构的项目管理工具,可以实现组织管理、后台管理、产品管理、项目管理和测试管理等功能。同时,本文还介绍了其他软件测试相关工具,如功能自动化工具和性能自动化工具,以及白盒测试工具的使用。通过本文的阅读,读者可以了解禅道的基本使用方法和优势,从而更好地进行测试管理工作。 ... [详细]
  • 本文介绍了在RHEL 7中的系统日志管理和网络管理。系统日志管理包括rsyslog和systemd-journal两种日志服务,分别介绍了它们的特点、配置文件和日志查询方式。网络管理主要介绍了使用nmcli命令查看和配置网络接口的方法,包括查看网卡信息、添加、修改和删除配置文件等操作。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • loader资源模块加载器webpack资源模块加载webpack内部(内部loader)默认只会处理javascript文件,也就是说它会把打包过程中所有遇到的 ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
author-avatar
氣質正妹_384
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有