热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

【译】ZooKeeper:一个用于分布式应用的分布式协调服务

原文地址:ZooKeeper:ADistributedCoordinationServiceforDistributedApplicationsZooKeeper是一个用于分布式应用程序的分布式开源协调服务。它使用一组简单的操作原语,使得分布式应用可以实现更高层次的服务——如同步、配置维护、群组和命名管理

原文地址:ZooKeeper: A Distributed Coordination Service for Distributed Applications ZooKeeper是一个用于分布式应用程序的分布式开源协调服务。它使用一组简单的操作原语,使得分布式应用可以实现更高层次的服务——如同步、配置维护、群组和命名管理

原文地址:ZooKeeper: A Distributed Coordination Service for Distributed Applications

ZooKeeper是一个用于分布式应用程序的分布式开源协调服务。它使用一组简单的操作原语,使得分布式应用可以实现更高层次的服务——如同步、配置维护、群组和命名管理等。它以易于编程为基本设计理念,并使用了一个类似于文件系统目录结构风格的数据模型。ZooKeeper服务运行于Java环境中并可以在Java和C中使用。
众所周知,协调服务很难达到正确,尤其会出现竞争条件或死锁等问题。ZooKeeper设计初衷是为了缓解分布式应用从设计到实现中协调服务的问题。

设计目标

ZooKeeper的实现简单。它使得分布式进程与其他进程通过一个共享的层级的命名空间(类似于标准文件系统目录的)来进行协调。命名空间由被称为znode的数据注册表(类似文件系统中的文件和目录)组成。而与面向数据存储的文件系统不同的是, ZooKeeper将数据保持在内存中,这意味着ZooKeeper有更大的吞吐量和更小的延时。
ZooKeeper是冗余的。就像它所协调的分布式进程一样,ZooKeeper自身实现了一些主机间复制并成为一个集群整体。
zkservice
组成ZooKeeper服务的这些服务器必须相互连通。它们通过事务日志和持久化存储上的快照来维护一个状态的内存镜像。只要大多数服务可用,ZooKeeper服务就可用。
客户端连接到一个ZooKeeper服务器,它维持一个发送请求、接受应答、获取监听时间并发送心跳信息的TCP连接。如果这个连接中断,客户端会连到其他的服务器。
ZooKeeper是有序的。Zookeeper会以反映ZooKeeper全局事务序列的数值标记每次更新操作,后续的操作可以使用这个序列来实现高层的抽象,例如同步原语。
ZooLeeper是高效的。尤其是在读写比很大的情况下。ZooKeeper的应用运行在数千台服务器上,它的应用表现会在这种读多写少的场景下表现良好(读写比大约会在10:1)。

数据模型和层级命名空间

ZooKeeper提供的命名空间和标准文件系统很像。一个名字是以(/)分割路径元素组成的序列。每个Zookeeper明明空间中的节点都通过路径被识别。
zknamespace

节点和临时节点

和标准文件系统不同的是,每一个ZooKeeper命名空间中的节点和它们的子节点一样拥有数据,这就像一个文件也可以作为目录的文件系统。(ZooKeeper被设计用于存储协调数据:状态信息、配置、位置信息等。所以每个节点存储的数据通常很小,大约在字节到千字节级别)。我们称ZooKeeper的数据节点为znode。
Znode维护一个统计结构(包含了数据改变的版本号,访问控制列表改变和时间戳)来允许缓存验证和协调更新。每次znode数据改变,版本号会递增。例如,当客户但获取数据时它也会接受数据的版本信息。
命名空间中每个znode存储的数据的读写都是原子操作。读操作会得到一个znode相关的所有数据字节,写操作替换znode相关的所有数据。每一个节点都有一个访问控制列表来限制谁有权限能做什么。
ZooKeeper中也有临时节点的概念,这些节点会在创建这些节点的会话有效时存在,当会话结束后被删除。临时节点在你想要实现一些特定操作时([tdb]原文未补全)时非常有用。

竞争更新和监听

Zookeeper支持监听(watches)的概念。客户端可以在znode上设置一个监听,一个监听可以在znode被改变后触发和删除。当一个监听触发后,客户端接受一个通知znode改变的数据包。并且如果客户端和ZooKeeper中一个服务器之前的连接出现故障,客户端会收到一个本地通知,这些可以用于一些可高可用性的服务实现([tdb]此处原文未补全)。

保证

ZooKeeper非常简单高效。虽然它的设计目标是建立的更复杂的服务(例如同步)的基础,它提供了一些保证机制:
顺序一致:通过客户端的更新会以他们发出操作的顺序来应用。
原子性:无论更新是否成功,不存在部分更新。
单一系统镜像:无论一个客户端连到哪一个服务器,会看到服务的相同视图。
可靠性:一旦一个更新被应用,这次更新会从这个时刻开始持久化直到下次客户端覆盖这次更新的内容。
及时性:系统的客户端视图保证在一个确定时候限度内是最新的。
更多信息可以参考官方文档、白皮书。([tdb])

简单API

ZooKeeper的设计目标之一是提供一个非常简单的编程接口,所以它只提供了下面的操作:
create – creates a node at a location in the tree
delete – deletes a node
exists – tests if a node exists at a location
get data – reads the data from a node
set data – writes data to a node
get children – retrieves a list of children of a node
sync – waits for data to be propagated
关于这些内容的更多讨论,以及使用它们如何实现高层的操作,请参考官方文档。([tdb])

实现

Zookeeper组件展示了ZooKeeper服务的高层组件。除了请求处理器之外, 组成zookeeper服务的每个server都会在本地备份每一个组件的拷贝。
zkcomponents
这个被复制的数据库是一个包含内存全部数据的树型内存数据库。更新操作会写入磁盘并用于恢复,写入操作会在应用到内存数据库之前序列化到磁盘中。
每一个ZooKeeper数据库都可以用于客户端的连接,客户端连接到一个服务器上去提交请求。读请求可以在每一个服务器数据库的复制片中获取,而改变服务状态的请求和写请求则通过一个一致性协议进行。
作为一致性协议的一部分,所有来自客户端的写请求会流入一个单一的服务器——称为领导者(leader),剩余的ZooKeeper服务器称为追随者(followers),它们从领导者上接收消息提议并对消息传递达成一致性意见。消息传递层会(the messaging layer)处理当领导者故障时选举新的领导者,以及追随者和领导者之前的同步。
ZooKeeper使用一个定制的原子消息传递协议,由于消息传递层是原子操作,ZooKeeper能保证本地复制篇不会产生偏离。当领导者接收一个读请求时,它会计算系统的状态到应用写入被应用的时刻,并将系统状态转换到新的事务状态。

使用

Zookeeper的编程接口非常简单。然而使用这些API,你可以实现高层的操作(例如同步原语、组成员、所有权等)。更多分布式应用的操作可以参考白皮书和视频资料([tdb])。

性能

ZooKeeper被设计初衷是高性能。但真的如此么?Yahoo研究中心的ZooKeeper开发团队证实了ZooKeeper的高性能,特别是在读多写少的应用中(见下图),因为写操作需要在所有ZooKeeper服务器间同步状态。(读多写少是协调服务的典型应用情况)
zkperfRW-3.2
图为两个2GHz至强处理器和两个SATA 15K RPM驱动器的服务器上ZooKeeper 3.2运行时的吞吐量。一个磁盘驱动器作为ZooKeeper日志的专用设备。快照写入到操作系统所在的磁盘驱动器。读写操作都操作1KB的数据。图 中“Servers”指的是ZooKeeper服务的大小,即组成服务的服务器个数。客户端通过大约30个其他服务器来模拟。ZooKeeper集群配置不允许客户端连接到领导者。
提示:3.2版的r/w性能是3.1版的2倍。
上面基准测试也表明ZooKeeper是可靠的。下图显示了ZooKeeper在各种失败情况下的反应。图中标记的各个事件是:
1.追随者失败和恢复
2.另一个追随者失败和恢复
3.领导者失败
4.两个追随者失败和恢复
5.另一个领导者失败

可靠性

为展示当节点失败发生时系统的行为,我们在一个由7台机器组成的ZooKeeper服务上运行和上节一样的基准测试,但这次我们将写操作的百分比固定为30%,这是预期负载比例的保守估计。
zkperfreliability
此图有几处值得仔细观察。首先,如果追随者失败后快速恢复,则ZooKeeper可以维持高吞吐率。但更重要的是,领导者的选举算法让系统可以很快地恢复,以避免吞吐率有实质性下降。据我们观察,ZooKeeper集群在选举一个新的领导者的时间小于200ms。第三,一旦追随者恢复并且开始处理请求,ZooKeeper可以恢复高吞吐率。
?

ZooKeeper 项目

ZooKeeper已经在很多工业应用中被成功使用。Yahoo!在Yahoo! Message Broker中使用ZooKeeper作为协调和故障恢复服务。Yahoo! Message Broker是一个高度扩展的发布-订阅系统(目前主流的kfaka也使用ZooKeeper),管理着成千上万个需要拷贝和数据传递的话题。Yahoo!的很多广告系统也使用ZooKeeper来实现可靠服务。
我们鼓励用户和开发者加入社区。更多信息请看Apache的ZooKeeper项目。

推荐阅读
  • 本文总结了初学者在使用dubbo设计架构过程中遇到的问题,并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题,初学者能够更好地理解和应用dubbo设计架构。 ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 目录浏览漏洞与目录遍历漏洞的危害及修复方法
    本文讨论了目录浏览漏洞与目录遍历漏洞的危害,包括网站结构暴露、隐秘文件访问等。同时介绍了检测方法,如使用漏洞扫描器和搜索关键词。最后提供了针对常见中间件的修复方式,包括关闭目录浏览功能。对于保护网站安全具有一定的参考价值。 ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • 开发笔记:读《分布式一致性原理》JAVA客户端API操作2
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了读《分布式一致性原理》JAVA客户端API操作2相关的知识,希望对你有一定的参考价值。创 ... [详细]
  • 我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]
  • 我正在使用sql-serverkafka-connect和debezium监视sqlserver数据库,但是当我发布并运行我的wo ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大,单机上运行高斯朴素贝叶斯模型会变得很慢,因此考虑使用Spark来加速运行。然而,Spark的MLlib并没有实现高斯朴素贝叶斯模型,因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式,并对具有多个特征和类别的模型进行了讨论。最后,作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]
  • Android日历提醒软件开源项目分享及使用教程
    本文介绍了一款名为Android日历提醒软件的开源项目,作者分享了该项目的代码和使用教程,并提供了GitHub项目地址。文章详细介绍了该软件的主界面风格、日程信息的分类查看功能,以及添加日程提醒和查看详情的界面。同时,作者还提醒了读者在使用过程中可能遇到的Android6.0权限问题,并提供了解决方法。 ... [详细]
  • [翻译]微服务设计模式5. 服务发现服务端服务发现
    服务之间需要互相调用,在单体架构中,服务之间的互相调用直接通过编程语言层面的方法调用就搞定了。在传统的分布式应用的部署中,服务地 ... [详细]
author-avatar
Never_F_Y
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有