作者:lashley谢 | 来源:互联网 | 2023-10-12 18:17
今天从宽泛的角度谈谈AWS的分布式概念。首先,AWS是一个基于分布式架构构建的云服务,我想这一点是最清楚最明白,人人皆知不过的了。但是,当我们开始使用AWS以后就会发现分布式远不像我们想象中那么
今天从宽泛的角度谈谈AWS的分布式概念。首先,AWS是一个基于分布式架构构建的云服务,我想这一点是最清楚最明白,人人皆知不过的了。但是,当我们开始使用AWS以后就会发现分布式远不像我们想象中那么清晰,而是经常会忘记,并且需要时时提醒自己我正在使用的是一个分布式系统。当我们后面讨论一些AWS当中最流行的服务,比如DynamoDB,比如S3,我们会涉及到一个很有趣的概念,叫做consistency。我们会需要深入理解eventually consistency的概念,和使用这样的服务时需要克服的一些陷阱。而这些问题的出现,都是因为AWS是一个分布式的系统。
什么叫分布式系统?按照维基百科的定义:
分布式系统是一种系统,其组件位于不同的联网计算机上,这些计算机通过相互传递消息来通信和协调其动作。[1]这些组件相互交互以实现一个共同的目标。分布式系统的三个重要特征是:组件并发,缺少全局时钟和组件独立故障。
AWS可以带给我们很多好的使用特性,可以说都是借助于分布式系统完成的。比如,AWS可以动态调整我们要使用的资源。只有在我们使用的资源不够时才会分配给我们更多的资源,以达到节省费用的目的。那么正是因为AWS的基础架构是基于多个小的组件完成的,使得AWS提供动态分配资源的功能。还有很多很多特性都是基于分布式系统带来的好处,在这里先不细说。
我们先来从最高层理解一下AWS是怎么体现出分布式的。首先,我们应该注意到AWS里的region的概念。如果我们打开AWS console界面右上角在“support”左边的region下拉菜单,我们可以看到所有的AWS已经部署了的region。每一个region的信息包括“大地区 (小地区)region名称”,比如“US East (N. Virginia) us-east-1”,大地区是美国东部,小地区是弗吉尼亚北部,region名称是us-east-1。当我们使用AWS服务时,第一要选择的就是region,也就是说我们要使用哪个region里的该服务。这里要考虑的问题包括与该服务交互的其他服务会部署在什么region里,我们会倾向于将互相通信的服务部署在相同的region,这样减少他们之间通信的时延。第二要考虑我们要使用哪些服务,因为有些服务只部署在了某些region里。第三要考虑AWS服务使用者所在的区域。比如我们使用AWS部署一个web portal,假如我们的目标客户基本以中国大陆为主,我们当然应该选择一个离我们近的region,比如日本,韩国,新加坡等。
再下来的一个概念是Availability Zones,也就是可用区,或者也叫AZ。AWS几乎所有的服务不会只部署在region的一个区域里,而是至少部署在region的两个及以上的区域里,并且可用区之间要求一定的距离。这样做的好处明显是提高了服务面对物理破坏带来的服务瘫痪的危险,比如地震,网线被破坏,等等。对于某些服务在建立的时候我们会被要求指定要使用那些AZ,us-east-1a,us-east-1b,us-east-1c就是在ue-east-里的3个AZ。还有相当多的服务是不需要用户指定AZ的,而是AWS会自动分配AZ,但是肯定是2个或以上。
Region和AZ的关系如下图所示:
当我们访问某个服务时,该服务的功能将由所有在该region上的部署了该服务的AZ共同完成。以后在我们谈到更具体的AWS服务时,我们再详细谈一些由分布式带来的好处和陷阱。今天就先写到这里,大家有什么观点和问题欢迎留言讨论。
关于AWS region和available zone的介绍请参考AWS文档:https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/Concepts.RegionsAndAvailabilityZones.html