ela数据库_时间序列数据库(TSDB)初识与选择(InfluxDB、OpenTSDB、Druid、Elasticsearch对比)...

作者：手机用户2502857517_939 | 来源：互联网 | 2023-05-31 11:49

背景这两年互联网行业掀着一股新风，总是听着各种高大上的新名词。大数据、人工智能、物联网、机器学习、商业智能、智能预警啊等等。以前的系统，做数据可视化&#

背景

这两年互联网行业掀着一股新风&＃xff0c;总是听着各种高大上的新名词。大数据、人工智能、物联网、机器学习、商业智能、智能预警啊等等。

以前的系统&＃xff0c;做数据可视化&＃xff0c;信息管理&＃xff0c;流程控制。现在业务已经不仅仅满足于这种简单的管理和控制了。数据可视化分析&＃xff0c;大数据信息挖掘&＃xff0c;统计预测&＃xff0c;建模仿真&＃xff0c;智能控制成了各种业务的追求。

“所有一切如泪水般消失在时间之中&＃xff0c;时间正在死去“&＃xff0c;以前我们利用互联网解决现实的问题。现在我们已经不满足于现实&＃xff0c;数据将连接成时间序列&＃xff0c;可以往前可以观其历史&＃xff0c;揭示其规律性&＃xff0c;往后可以把握其趋势性&＃xff0c;预测其走势。

于是&＃xff0c;我们开始存储大量时间相关的数据(如日志&＃xff0c;用户行为等)&＃xff0c;并总结出这些数据的结构特点和常见使用场景&＃xff0c;不断改进和优化&＃xff0c;创造了一种新型的数据库分类——时间序列数据库(Time Series Database).

时间序列模型

时间序列数据库主要用于指处理带时间标签(按照时间的顺序变化&＃xff0c;即时间序列化)的数据&＃xff0c;带时间标签的数据也称为时间序列数据。

每个时序点结构如下&＃xff1a;

timestamp:数据点的时间&＃xff0c;表示数据发生的时间。

metric:指标名&＃xff0c;当前数据的标识&＃xff0c;有些系统中也称为name。

value:值&＃xff0c;数据的数值&＃xff0c;一般为double类型&＃xff0c;如cpu使用率&＃xff0c;访问量等数值&＃xff0c;有些系统一个数据点只能有一个value&＃xff0c;多个value就是多条时间序列。有些系统可以有多个value值&＃xff0c;用不同的key表示

tag:附属属性。

实现

比如我想记录一系列传感器的时间序列数据。数据结构如下&＃xff1a;

* 标识符&＃xff1a;device_id&＃xff0c;时间戳

* 元数据&＃xff1a;location_id&＃xff0c;dev_type&＃xff0c;firmware_version&＃xff0c;customer_id

* 设备指标&＃xff1a;cpu_1m_avg&＃xff0c;free_mem&＃xff0c;used_mem&＃xff0c;net_rssi&＃xff0c;net_loss&＃xff0c;电池

* 传感器指标&＃xff1a;温度&＃xff0c;湿度&＃xff0c;压力&＃xff0c;CO&＃xff0c;NO2&＃xff0c;PM10

如果使用传统RDBMS存储&＃xff0c;建一张如下结构的表即可&＃xff1a;

如此便是一个最简单的时间序列库了。但这只是满足了数据模型的需要。我们还需要在性能&＃xff0c;高效存储&＃xff0c;高可用&＃xff0c;分布式和易用性上做更多的事情。

大家可以思考思考&＃xff0c;如果让你自己来实现一个时间序列数据库&＃xff0c;你会怎么设计&＃xff0c;你会考虑哪些性能上的优化&＃xff0c;又如何做到高可用&＃xff0c;怎样做到简单易用。

Timescale

这个数据库其实就是一个基于传统关系型数据库postgresql改造的时间序列数据库。了解postgresql的同学都知道&＃xff0c;postgresql是一个强大的&＃xff0c;开源的&＃xff0c;可扩展性特别强的一个数据库系统。

于是timescale.inc开发了Timescale&＃xff0c;一款兼容sql的时序数据库&＃xff0c; 底层存储架构在postgresql上。作为一个postgresql的扩展提供服务。其特点如下&＃xff1a;

基础&＃xff1a;

PostgreSQL原生支持的所有SQL,包含完整SQL接口(包括辅助索引&＃xff0c;非时间聚合&＃xff0c;子查询&＃xff0c;JOIN&＃xff0c;窗口函数)

用PostgreSQL的客户端或工具&＃xff0c;可以直接应用到该数据库&＃xff0c;不需要更改。

时间为导向的特性&＃xff0c;API功能和相应的优化。

可靠的数据存储。

扩展&＃xff1a;

透明时间/空间分区&＃xff0c;用于放大(单个节点)和扩展

高数据写入速率(包括批量提交&＃xff0c;内存中索引&＃xff0c;事务支持&＃xff0c;数据备份支持)

单个节点上的大小合适的块(二维数据分区)&＃xff0c;以确保即使在大数据量时即可快速读取。

块之间和服务器之间的并行操作

劣势&＃xff1a;

因为TimescaleDB没有使用列存技术&＃xff0c;它对时序数据的压缩效果不太好&＃xff0c;压缩比最高在4X左右

目前暂时不完全支持分布式的扩展(正在开发相关功能)&＃xff0c;所以会对服务器单机性能要求较高

其实大家都可以去深入了解一下这个数据库。对RDBMS我们都很熟悉&＃xff0c;了解这个可以让我们对RDBMS有更深入的了解&＃xff0c;了解其实现机制&＃xff0c;存储机制。在对时间序列的特殊化处理之中&＃xff0c;我们又可以学到时间序列数据的特点&＃xff0c;并学习到如何针对时间序列模型去优化RDBMS。

之后我们也可以写一篇文章来深入的了解一下这个数据库的特点和实现。

Influxdb

Influxdb是业界比较流行的一个时间序列数据库&＃xff0c;特别是在IOT和监控领域十分常见。其使用go语言开发&＃xff0c;突出特点是性能。

特性&＃xff1a;

高效的时间序列数据写入性能。自定义TSM引擎&＃xff0c;快速数据写入和高效数据压缩。

无额外存储依赖。

简单&＃xff0c;高性能的HTTP查询和写入API。

以插件方式支持许多不同协议的数据摄入&＃xff0c;如&＃xff1a;graphite&＃xff0c;collectd&＃xff0c;和openTSDB

SQL-like查询语言&＃xff0c;简化查询和聚合操作。

索引Tags&＃xff0c;支持快速有效的查询时间序列。

保留策略有效去除过期数据。

连续查询自动计算聚合数据&＃xff0c;使频繁查询更有效。

Influxdb已经将分布式版本转为闭源。所以在分布式集群这块是一个弱点&＃xff0c;需要自己实现。

OpenTSDB

The Scalable Time Series Database. 打开OpenTSDB官网&＃xff0c;第一眼看到的就是这句话。其将Scalable作为其重要的特点。OpenTSDB运行在Hadoop和HBase上&＃xff0c;其充分利用HBase的特性。通过独立的Time Series Demon(TSD)提供服务&＃xff0c;所以它可以通过增减服务节点来轻松扩缩容。

Opentsdb是一个基于Hbase的时间序列数据库(新版也支持Cassandra)。

其基于Hbase的分布式列存储特性实现了数据高可用&＃xff0c;高性能写的特性。受限于Hbase&＃xff0c;存储空间较大&＃xff0c;压缩不足。依赖整套HBase, ZooKeeper

采用无模式的tagset数据结构(sys.cpu.user 1436333416 23 host&＃61;web01 user&＃61;10001)

结构简单&＃xff0c;多value查询不友好

HTTP-DSL查询

OpenTSDB在HBase上针对TSDB的表设计和RowKey设计是值得我们深入学习的一个特点。有兴趣的同学可以找一些详细的资料学习学习。

Druid

Druid是一个实时在线分析系统(LOAP)。其架构融合了实时在线数据分析&＃xff0c;全文检索系统和时间序列系统的特点&＃xff0c;使其可以满足不同使用场景的数据存储需求。

采用列式存储&＃xff1a;支持高效扫描和聚合&＃xff0c;易于压缩数据。

可伸缩的分布式系统&＃xff1a;Druid自身实现可伸缩&＃xff0c;可容错的分布式集群架构。部署简单。

强大的并行能力&＃xff1a;Druid各集群节点可以并行地提供查询服务。

实时和批量数据摄入&＃xff1a;Druid可以实时摄入数据&＃xff0c;如通过Kafka。也可以批量摄入数据&＃xff0c;如通过Hadoop导入数据。

自恢复&＃xff0c;自平衡&＃xff0c;易于运维&＃xff1a;Druid自身架构即实现了容错和高可用。不同的服务节点可以根据响应需求添加或减少节点。

容错架构&＃xff0c;保证数据不丢失&＃xff1a;Druid数据可以保留多副本。另外可以采用HDFS作为深度存储&＃xff0c;来保证数据不丢失。

索引&＃xff1a;Druid对String列实现反向编码和Bitmap索引&＃xff0c;所以支持高效的filter和groupby。

基于时间分区&＃xff1a;Druid对原始数据基于时间做分区存储&＃xff0c;所以Druid对基于时间的范围查询将更高效。

自动预聚合&＃xff1a;Druid支持在数据摄入期就对数据进行预聚合处理。

Druid架构蛮复杂的。其按功能将整个系统细分为多种服务&＃xff0c;query、data、master不同职责的系统独立部署&＃xff0c;对外提供统一的存储和查询服务。其以分布式集群服务的方式提供了一个底层数据存储的服务。

Druid在架构上的设计很值得我们学习。如果你不仅仅对时间序列存储感兴趣&＃xff0c;对分布式集群架构也有兴趣&＃xff0c;不妨看看Druid的架构。另外Druid在segment(Druid的数据存储结构)的设计也是一大亮点&＃xff0c;既实现了列式存储&＃xff0c;又实现了反向索引。

Elasticsearch

Elasticsearch 是一个分布式的开源搜索和分析引擎&＃xff0c;适用于所有类型的数据&＃xff0c;包括文本、数字、地理空间、结构化和非结构化数据。Elasticsearch 在 Apache Lucene 的基础上开发而成&＃xff0c;由 Elasticsearch N.V.(即现在的 Elastic)于 2010 年首次发布。Elasticsearch 以其简单的 REST 风格 API、分布式特性、速度和可扩展性而闻名。

Elasticsearch以ELK stack被人所熟知。许多公司基于ELK搭建日志分析系统和实时搜索系统。之前我们在ELK的基础上开始开发metric监控系统。即想到了使用Elasticsearch来存储时间序列数据库。对Elasticserach的mapping做相应的优化&＃xff0c;使其更适合存储时间序列数据模型&＃xff0c;收获了不错的效果&＃xff0c;完全满足了业务的需求。后期发现Elasticsearch新版本竟然也开始发布Metrics组件和APM组件&＃xff0c;并大量的推广其全文检索外&＃xff0c;对时间序列的存储能力。真是和我们当时的想法不谋而合。

也可以去了解一下Elasticsearch的Metric组件&＃xff1a;

Beringei

Beringei是Facebook在2017年最新开源的一个高性能内存时序数据存储引擎。其具有快速读写和高压缩比等特性。

Beringei使用Delta-of-Delta算法存储数据&＃xff0c;使用XOR编码压缩数值。使其可以用很少的内存即可存储下大量的数据。

如何选择一个适合自己的时间序列数据库

Data model

时间序列数据模型一般有两种&＃xff0c;一种无schema&＃xff0c;具有多tag的模型&＃xff0c;还有一种name、timestamp、value型。前者适合多值模式&＃xff0c;对复杂业务模型更适合。后者更适合单维数据模型。

Query language

目前大部分TSDB都支持基于HTTP的SQL-like查询。

Reliability

可用性主要体现在系统的稳定高可用上&＃xff0c;以及数据的高可用存储上。一个优秀的系统&＃xff0c;应该有一个优雅而高可用的架构设计。简约而稳定。

Performance

性能是我们必须考虑的因素。当我们开始考虑更细分领域的数据存储时&＃xff0c;除了数据模型的需求之外&＃xff0c;很大的原因都是通用的数据库系统在性能上无法满足我们的需求。大部分时间序列库倾向写多读少场景&＃xff0c;用户需要平衡自身的需求。下面会有一份各库的性能对比&＃xff0c;大家可以做一个参考。

Ecosystem

我一直认为生态是我们选择一个开源组件必须认真考虑的问题。一个生态优秀的系统&＃xff0c;使用的人多了&＃xff0c;未被发现的坑也将少了。另外在使用中遇到问题&＃xff0c;求助于社区&＃xff0c;往往可以得到一些比较好的解决方案。另外好的生态&＃xff0c;其周边边界系统将十分成熟&＃xff0c;这让我们在对接其他系统时会有更多成熟的方案。

Operational management

易于运维&＃xff0c;易于操作。

Company and support

一个系统其背后的支持公司也是比较重要的。背后有一个强大的公司或组织&＃xff0c;这在项目可用性保证和后期维护更新上都会有较大的体验。

性能对比

Timescale

InfluxDB

OpenTSDB

Druid

Elasticsearch

Beringei

write(single node)

15K/sec

470k/sec

32k/sec

25k/sec

30k/sec

10m/sec

write(5 node)

128k/sec

100k/sec

120k/sec

总结

可以按照以下需求自行选择合适的存储&＃xff1a;

小而精&＃xff0c;性能高&＃xff0c;数据量较小(亿级): InfluxDB

简单&＃xff0c;数据量不大(千万级)&＃xff0c;有联合查询、关系型数据库基础&＃xff1a;timescales

数据量较大&＃xff0c;大数据服务基础&＃xff0c;分布式集群需求&＃xff1a; opentsdb、KairosDB

分布式集群需求&＃xff0c;olap实时在线分析&＃xff0c;资源较充足&＃xff1a;druid

性能极致追求&＃xff0c;数据冷热差异大&＃xff1a;Beringei

兼顾检索加载&＃xff0c;分布式聚合计算&＃xff1a; elsaticsearch

如果你兼具索引和时间序列的需求。那么Druid和Elasticsearch是最好的选择。其性能都不差&＃xff0c;同时满足检索和时间序列的特性&＃xff0c;并且都是高可用容错架构。

最后

之后我们可以来深入了解一两个TSDB&＃xff0c;比如Influxdb&＃xff0c;OpenTSDB&＃xff0c;Druid&＃xff0c;Elasticsearch等。并可以基于此学习一下行存储与列存储的不同&＃xff0c;LSM的实现原理&＃xff0c;数值数据的压缩&＃xff0c;MMap提升读写性能的知识等。

链接&＃xff1a;

关注公众号后台回复加群&＃xff0c;欢迎加群与我们讨论分享&＃xff0c;我们第一时间反馈。

推荐阅读

string
阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient：4. 设备上报属性

阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]

蜡笔小新 2023-12-14 12:40:20
config
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
ip
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
ip
Oracle优化新常态的五大禁止及其性能隐患

本文介绍了Oracle优化新常态中的五大禁止措施，包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB，并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况，并提出了解决方案。 ... [详细]

蜡笔小新 2023-12-12 12:55:55
function
mac php错误日志配置方法及错误级别修改

本文介绍了在mac环境下配置php错误日志的方法，包括修改php.ini文件和httpd.conf文件的操作步骤。同时还介绍了如何修改错误级别，以及相应的错误级别参考链接。 ... [详细]

蜡笔小新 2023-12-12 11:59:08
string
无法使用fetch在服务器端读取/获取发布的数据

本文介绍了一个React Native新手在尝试将数据发布到服务器时遇到的问题，以及他的React Native代码和服务器端代码。他使用fetch方法将数据发送到服务器，但无法在服务器端读取/获取发布的数据。 ... [详细]

蜡笔小新 2023-12-11 11:26:28
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
string
解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法

本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说，系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤，包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息，以帮助读者更好地理解和解决该问题。 ... [详细]

蜡笔小新 2023-12-10 13:37:58
string
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50
string
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
string
Hyperledger Fabric外部链码构建与运行的开发笔记

本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识，包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性，外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍，读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行，并且不再受限于特定的语言和部署环境。 ... [详细]

蜡笔小新 2023-12-13 21:47:39
future
to_a和to_ary有什么区别？ - What's the difference between to_a and to_ary?

Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别？ ... [详细]

蜡笔小新 2023-12-11 19:30:04
config
如何进行Web.Config自定义配置节的配置转换

本文讨论了如何使用Web.Config进行自定义配置节的配置转换。作者提到，他将msbuild设置为详细模式，但转换却忽略了带有替换转换的自定义部分的存在。 ... [详细]

蜡笔小新 2023-12-11 17:54:55
dll
在虚拟服务器上安装oracle 10g客户端的问题及解决方法

本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题，并提供了解决方法。错误日志显示了异常访问违例，通过分析日志中的问题帧，找到了解决问题的线索。文章详细介绍了解决方法，帮助读者顺利安装oracle 10g客户端。 ... [详细]

蜡笔小新 2023-12-11 13:08:10
string
2021最新总结网易/腾讯/CVTE/字节面经分享（附答案解析）

本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题，包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记，并附带答案解析。 ... [详细]

蜡笔小新 2023-12-09 19:11:31

手机用户2502857517_939

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章