微服务应用性能分析实战15数据磐石：APM收集端的存储模型

作者：mobiledu2502927877 | 来源：互联网 | 2023-10-14 15:45

分布式监控的重要设计就是数据存储模型，而SkyWalking的分布式追踪数据模型就是一个经典代表，这也是它会在APM领域脱颖而出的原因。所以今天我就以

分布式监控的重要设计就是数据存储模型&＃xff0c;而 SkyWalking 的分布式追踪数据模型就是一个经典代表&＃xff0c;这也是它会在 APM 领域脱颖而出的原因。

所以今天我就以 SkyWalking 为例&＃xff0c;结合明细模型中的分布式追踪模型、指标明细中的稳定性模型、采样数据模型中的数据慢查采样模型&＃xff0c;通过对这三个典型模型的横向对比学习&＃xff0c;纵向了解收集端计算存储模型的详细过程。

四大存储模型

SkyWalking 的数据存储也是通过微内核和插件形式实现的&＃xff1a;数据存储模型是在收集端经过各个插件计算而出&＃xff0c;所有插件存放在 oap-server/server-receiver-plugin。

目前收集端的插件主要会构建以下四个存储模型。

为了优化传输效率和存储能力&＃xff0c;SkyWalking 会使用注册发现模式去构建注册模型&＃xff0c;但注册模型天生会在异步收集场景和客户端内存空间上存在劣势。所以 8.x 版本 SkyWalking 去掉了注册模型&＃xff0c;取而代之的是通过 Base64 编码计算注册的唯一值。

虽然这在网络传输上带来了性能损失&＃xff0c;但内存优化和异步场景带来的体验上却有了极大提升。显然在当今的内部集群都是万兆网卡的硬件资源下&＃xff0c;这样的利是大于弊的&＃xff0c;所以注册存储模型我就略讲了。

存储模型中数据量最大的就是明细模型&＃xff0c;在存储优化上&＃xff0c;收集端会在构建数据索引时&＃xff0c;忽略部分不需要索引的数据&＃xff0c;以优化存储性能。
对于指标数据&＃xff0c;多数的指标数据都是通过脚本语言构建出来了&＃xff0c;SkyWalking 通过 OAL 脚本进行指标明细构建。
采样模型通过自定义排序&＃xff0c;在一定的时间窗口内采样数据&＃xff0c;计算 TOP 指标来完成采样数据的记录&＃xff0c;典型的场景是对 DB 执行延迟进行采样&＃xff0c;监控出对数据库造成慢查的 SQL。

所以接下来&＃xff0c;我会以分布式链路追踪的明细数据、稳定性的指标数据、数据库采样的采样模型为重点逐一进行讲解。

分布式追踪的明细数据

SkyWalking 有多种明细数据&＃xff08;Record&＃xff09;模型&＃xff0c;如报警明细数据模型&＃xff0c;通过定义报警规则的配置来完成报警&＃xff1b;又如 JaegerSpan 或 ZipkinSpan 明细模型&＃xff0c;通过收集其他 APM 数据来完成全局的 Span 数据追踪。

但在明细模型数据中&＃xff0c;最通用的就是分布式链路追踪&＃xff08;SegmentRecord&＃xff09;的明细追踪模型&＃xff0c;它是计算其他各个存储模型的基础数据&＃xff0c;其重要属性有以下五点。

1.原始数据流&＃xff08;data_binary&＃xff09;

任务线程监控数据&＃xff0c;通过 Base 64 对数据对象进行编码&＃xff0c;并存储到 Elasticsearch 索引中。由于原始数据流字段中包含所有以任务线程为监控维度的数据&＃xff0c;所以该字段的容量明显高于其他字段好几个维度&＃xff08;而其他字段是从任务线程监控数据中&＃xff0c;根据指定属性取出&＃xff09;&＃xff0c;从而原始数据流的数据也就被设计为不需要查询的资源&＃xff08;对应存储中就是不需要索引&＃xff09;。

在 Elasticsearch 的索引中&＃xff0c;索引的名称为 {cluster}segment{time_bucket}&＃xff0c;可以看出索引的名称包括了三个部分。

cluster 为 SkyWalking 收集端的集群标识。我们真实的线上应用集群非常复杂&＃xff0c;在网络或跨机房等情况下&＃xff0c;能难尽搭建一套 SkyWalking 集群就面面俱到&＃xff0c;因此真实场景是往往需要多个集群才能适配应用服务集群的复杂架构。但如果需要跨网段定位问题时&＃xff0c;我们就可以通过 Elasticsearch 的跨集群查询配置&＃xff0c;通过 SkyWalking 收集端的集群标识&＃xff0c;打破隔离带来的束缚。
segment 标识了此索引为分布式追踪数据的存储模型。
time_bucket 为以时间切分存储模型的标识。因为 APM 数据是海量级别的&＃xff0c;通过一定的时间窗口规则&＃xff0c;比如以“天”来划分表&＃xff0c;这样存储模型就有了时序。通过时序查询&＃xff0c;可以实现海量数据的快速插入和检索&＃xff1b;通过时序删除指定的索引&＃xff0c;可以避免索引碎片带来的性能问题。

2.时间

分布式追踪数据中&＃xff0c;一共有 3 个时间相关的属性&＃xff1a;开始时间&＃xff08;start_time&＃xff09;、结束时间&＃xff08;end_time&＃xff09;、延迟。时间使用 LongTime 类型记录&＃xff0c;避免了时区和空间占用的问题。

在同步模式&＃xff0c;开始时间是任务线程被监控的起始&＃xff0c;结束时间是退出任务线程监控时间的时刻&＃xff0c;延迟为两个时间的差值。
但在异步模式下&＃xff0c;分布式监控数据会由多个任务线程的监控数据组成。在发生异步时&＃xff0c;当前任务线程的开始&＃xff0c;监控时间会传递到接下来的任务线程&＃xff1b;而当前任务线程的监控数据&＃xff0c;为了防止内存泄漏会被回收掉&＃xff0c;并且不会发送到收集端。
所以开始时间和结束时间会在异步模式相互关联的任务线程中被持续覆盖&＃xff0c;直到真正的发送监控数据任务线程完成数据汇总后&＃xff0c;才发送给收集端。

3.端点&＃xff08;endpoint&＃xff09;

在存储模型中&＃xff0c;端点信息包括以下两个属性。

入口服务的端点名称

规则的实现逻辑是&＃xff1a;第一个 Span 的操作名称就是入口服务的端点名称。那为什么会用这一规则呢&＃xff1f;

在我看来&＃xff0c;APM 的分布式链路追踪的记录粒度&＃xff0c;是记录对端调用的 Span 粒度&＃xff0c;也就是支持记录调用过程中内部 Span 粒度。所以记录入口服务的端点名称是最合理的。

端点 ID

在 8.x 版本前&＃xff0c;SkyWalking 通过注册模式记录&＃xff0c;并生成入口服务的端点名称对应的端点 ID。但我们发现 APM 注册的端点名称是海量级的&＃xff0c;并在未归类的 RESTful API 场景下更为突出。

这不仅会给收集端存储注册模型带来性能压力&＃xff0c;更会由于需要缓存端点注册信息&＃xff0c;给客户端也带来较大的空间压力。这个问题是 APM 注册发现模式的通病&＃xff0c;它不仅在端点模型中存在&＃xff0c;更在网络地址模型、服务实例模型中存在。

所以在 8.x 后的版本中 SkyWalking 摒弃了注册发现模型&＃xff0c;全部通过 Base 64 编码对端点名称进行压缩&＃xff1a;在服务端&＃xff0c;为各个组件提供归类端点名称支持&＃xff1b;在客户端&＃xff0c;取消缓存端点的空间。

关于具体的实现设计&＃xff0c;你可以查看“在探针侧配置支持操作名称分组的规则”&＃xff0c;去了解 SkyWalking 是如何实现端点名称归类的。

4.监控数据标识

存储模型有两个关于监控标识的属性。

SegmentID&＃xff1a;监控数据模型的唯一 ID&＃xff0c;在任务线程的第一个监控点&＃xff0c;使用雪花算法实现。
TraceID&＃xff1a;全局分布式追踪 ID&＃xff0c;消息队列、分布式事务等批处理框架存在多个 TraceID。

这两个重要属性在前文中已有很多介绍&＃xff0c;这里就不过多赘述。

5.标记数据

为描述当前追踪数据的特征&＃xff0c;SkyWalking 的追踪存储模型提供了很多标记属性&＃xff0c;按照粗、细进行分类。

细分类&＃xff1a;我们想更精细地描述一个 Span 时&＃xff0c;可以通过数组类型 Tags 的字段&＃xff0c;来存储个性化的标记数据&＃xff0c;从而实现精细描述。如在数据组件中&＃xff0c;tags 会存储 db.type 和 db.instance&＃xff0c;来分别标识数据库类型和数据库实例标识。这只是数据库组件的 Tags 细分类。
粗分类&＃xff1a;每个分布式链路存储数据都有 statement 和 is_error 字段&＃xff0c;前者 statement 用于标记当前组件的执行语句&＃xff0c;后者标记当前组件执行正常与否。

稳定性指标数据

指标存储&＃xff08;Metric&＃xff09;模型的计算是通过 OAL 脚本聚合分析得出&＃xff0c;如稳定性指标语句&＃xff1a;

service_instance_sla &＃61; from(ServiceInstance.*).percent(status &＃61;&＃61; true)。

这个语句的释义&＃xff1a;服务的稳定性&＃xff0c;通过服务实例状态的健康百分比程度进行计算&＃xff0c;从而得到衡量和表达。

from 代表数据的挖掘来源&＃xff0c;ServiceInstance.* 代表挖掘数据为服务实例的全部数据&＃xff1b;
使用百分比运算&＃xff08;percent&＃xff09;规则&＃xff0c;根据服务实例健康度&＃xff08;也就是 status 属性&＃xff09;&＃xff0c;为 true 计算全部服务实例的稳定程度。

百分比指标数据模型&＃xff08;PercentMetrics&＃xff09;的重要属性有如下四点。

总量&＃xff08;total&＃xff09;&＃xff1a;计算时间窗口中流式数据的总量。
匹配量&＃xff08;match&＃xff09;&＃xff1a;计算时间窗口中流式数据匹配到的数据总量。
百分比&＃xff08;percentage&＃xff09;&＃xff1a;根据匹配量和总量&＃xff0c;计算出当前时间窗口的百分比。
时间窗口&＃xff08;timeBucket&＃xff09;&＃xff1a;当前计算的时间窗口。

数据库延迟采样数据

采样模型&＃xff08;TopN&＃xff09;通过一定的时间窗口&＃xff0c;对具有一定规则的数据进行采样收集&＃xff1b;并根据分布式追踪明细数据中的延迟字段窗口数据进行排序&＃xff1a;耗时长的进行保存&＃xff0c;耗时短的进行淘汰&＃xff1b;最后经过一定的时间积累&＃xff0c;计算出采样数据。

值得考虑的是&＃xff0c;由于数据收集的客户端是分布式集群&＃xff0c;所以明细数据会打到不同的收集节点上&＃xff0c;所以收集节点的采样窗口会存在分布式带来的数据误差。也就是&＃xff0c;悲观数据都打到一个节点上的这种情况&＃xff0c;造成其他收集节点的采样数据不具备采样的数据意义。采样模型针对 DB 组件进行监控&＃xff0c;用于发现慢查并进行优化。

主要的属性有以下四点。

延迟&＃xff08;latency&＃xff09;&＃xff1a;用于存储采样数据的延迟属性&＃xff0c;根据实现的排序算法&＃xff0c;在一定的时间窗口内得到延迟较高的采样数据。
访问 DB 的执行语句&＃xff08;statement&＃xff09;&＃xff1a;用户描述采样数据的访问数据库的语句信息&＃xff0c;比如关系型数据库的 SQL 语句、访问内存数据库的操作命令。
链路 ID 属性&＃xff1a;用于描述采样数据的分布式链路 ID&＃xff0c;通过链路 ID 可以快速关联出分布式追踪的明细属性&＃xff0c;从而进行分布式链路的慢查询诊断。
应用服务 ID&＃xff08;serviceId&＃xff09;&＃xff1a;用于存储采样数据的应用服务 ID&＃xff0c;来进行对指标的采样&＃xff0c;一旦采样到异常数据时&＃xff0c;便可观测出采样对服务的影响。

小结与思考

今天&＃xff0c;我带你回顾了 APM 的存储模型设计。以 SkyWalking 为例&＃xff0c;收集端有三个重要的存储模型&＃xff1a;明细数据、指标数据、采样数据。通过各个存储模型的典型示例&＃xff0c;我们展开讲解了各个存储模型的每个字段的细节实现。

那么你在生产环境中&＃xff0c;分析过那些数据存储模型的案例呢&＃xff1f;欢迎在评论区写下你的思考&＃xff0c;期待与你讨论。

精选评论

推荐阅读

int
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
int
OkHttp3的基本使用及其特性

本文介绍了OkHttp3的基本使用和特性，包括支持HTTP/2、连接池、GZIP压缩、缓存等功能。同时还提到了OkHttp3的适用平台和源码阅读计划。文章还介绍了OkHttp3的请求/响应API的设计和使用方式，包括阻塞式的同步请求和带回调的异步请求。 ... [详细]

蜡笔小新 2023-12-10 22:46:04
instance
InnoDB存储引擎——内存

上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的，并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中，由于CPU速度 ... [详细]

蜡笔小新 2023-12-10 19:47:18
instance
云原生应用最佳开发实践之十二原则（12factor）

目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]

蜡笔小新 2023-12-09 09:35:02
spring
TiDB | TiDB在5A级物流企业核心系统的应用与实践

TiDB在5A级物流企业核心系统的应用与实践前言一、业务背景科捷物流概况神州金库简介二、现状与挑战神州金库现有技术体系业务挑战应对方案三、TiDB解决方案测试迁移收益问题四、说在最 ... [详细]

蜡笔小新 2023-10-17 14:03:52
instance
最全的JAVA知识汇总（附讲解和思维导图）

微信公众号：内核小王子关注可了解更多关于数据库，JVM内核相关的知识;如果你有任何疑问也可以加我pigpdong[^1]jvm一行代码是怎么运行的首先，java代码会被编译成字 ... [详细]

蜡笔小新 2023-10-16 19:56:17
instance
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
instance
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
char
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
char
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
char
Redis的RDB文件与AOF文件的保存与还原机制

本文介绍了Redis中RDB文件和AOF文件的保存和还原机制。RDB文件用于保存和还原Redis服务器所有数据库中的键值对数据，SAVE命令和BGSAVE命令分别用于阻塞服务器和由子进程执行保存操作。同时执行SAVE命令和BGSAVE命令，以及同时执行两个BGSAVE命令都会产生竞争条件。服务器会保存所有用save选项设置的保存条件，当满足任意一个保存条件时，服务器会自动执行BGSAVE命令。此外，还介绍了RDB文件和AOF文件在操作方面的冲突以及同时执行大量磁盘写入操作的不良影响。 ... [详细]

蜡笔小新 2023-12-12 08:51:10
input
Android中的assets目录和raw目录的区别和用法

本文介绍了Android中的assets目录和raw目录的共同点和区别，包括获取资源的方法、目录结构的限制以及列出资源的能力。同时，还解释了raw目录中资源文件生成的ID，并说明了这些目录的使用方法。 ... [详细]

蜡笔小新 2023-12-11 12:26:25
schema
Activiti7流程定义开发笔记

本文介绍了Activiti7流程定义的开发笔记，包括流程定义的概念、使用activiti-explorer和activiti-eclipse-designer进行建模的方式，以及生成流程图的方法。还介绍了流程定义部署的概念和步骤，包括将bpmn和png文件添加部署到activiti数据库中的方法，以及使用ZIP包进行部署的方式。同时还提到了activiti.cfg.xml文件的作用。 ... [详细]

蜡笔小新 2023-12-10 19:22:56
text
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50
spring
服务网关与流量网关

一、为什么需要服务网关1、什么是服务网关传统的单体架构中只需要开放一个服务给客户端调用，但是微服务架构中是将一个系统拆分成多个微服务，如果没有网关& ... [详细]

蜡笔小新 2023-10-17 17:57:54

mobiledu2502927877

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章