热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大型网站及架构演进过程

目录大型网站及架构演进过程大型网站的定义架构演进关于负载均衡session的解决方案读取性能的优化大型网站及架构演进过程标签(空格分隔):

目录

  • 大型网站及架构演进过程
    • 大型网站的定义
    • 架构演进
    • 关于负载均衡session的解决方案
    • 读取性能的优化

大型网站及架构演进过程

标签(空格分隔): 读书笔记


*通过前面的介绍,我们已经了解了分布式系统的相关知识,下面看一下大型网站架构演化及怎么用这个集群的。

大型网站的定义

看这个的我想都是有些经验的人了,就不啰嗦了,大型网站就是访问量&数据量都很大,必须同时具备这两个条件才可以,你整一堆静态页面 每天1000000000000000000000个人访问也不能称之为大型网站。只有当以上两个条件都具备的情况下,你才会有高并发的问题,才需要一个集群来支撑你的业务。

架构演进

这方面的文章确实不少,给大家介绍几个比较不错的演进过程
宜人贷:http://www.jianshu.com/p/410250e006cb
精品博客(包含很多案例):http://www.hollischuang.com/archives/1036


关于负载均衡session的解决方案

关于负载均衡session问题的解决方案:
1.使用无状态(COOKIE)的会话请求
缺点是
安全性:毕竟COOKIE是可见的。如果要实现安全的COOKIE就要在技术上改进,比如加密或每次生成一个token等方式来规避不安全问题。
COOKIE长度限制:这个无解
带宽消耗及性能影响:每次请求都带有session数据,还要解密及设置新token,相对来说肯定对性能有一定影响。
如果对安全性要求不是很高,还是可以选用这种方式。
2.ngxin使用ip轮询的方式(不稳定)
缺点是当使用ip轮询方式式,假如某一ip访问的机器挂了。把这个ip定位到其他机器上,就没有session了。以及nginx会变成一个有状态的节点,内存消耗会更大(不过可以加内存嘛),但是容灾会更麻烦。
3.session同步
现在主流的容器都有session同步功能,比如tomcat。
同步session造成网络带宽消耗,机器越多,消耗越大,相对来说性能也越差。
每台机器都需要保存全部机器的session.这样session数据占用的内容会很严重。
4.使用会话集中管理,如membercache来集中管理回话。
这种是比较常见的实现方式。比以上3种方式都要好,但是也有一定的缺点,比如session存储需要远程读取,会有延时及不稳定性,不过一般我们集群都是部署在内网的,这点可以忽略。另一个问题就是要相应的做好session集中会话管理服务器的容灾工作。假如没有容灾,session会话管理服务器挂了。整个应用就会受到影响。

读取性能的优化

数据库优化

分库/分表/分区:这里建议采用分区操作,对sql比较友好,对orm层也没有变化。分表分库应为最后的优化手段,毕竟对数据层代码有影响。而且会存在分布式事务这个大麻烦。
读写分离:读库与写库分开,现在各种数据库都有这种技术,只不过相应的来说,会有一定的延时性。但是性能提升是比较大的。

搜索

对于站内搜索,如果数据量比较大,可以使用做一个搜索组件来代替like,毕竟like效率不是很高。

缓存

对于经常需要读很少改的数据,可以通过缓存来提高读取的性能。这部分就不用多说了,主要就是ehcache/redis等各种cache组件。
另一个缓存的应用就是缓存页面,把经常访问的动态页面缓存起来,直接读取缓存,减小服务器的开销。比如ehcahce就可以缓存页面。
缓存使用的好不好的一个指标就是:缓存命中率,如果命中率很低,需要调整代码结构。

总结
总的来说,所有的架构都是经历了从以下这个阶段
1.webapp&database:应用与数据库在一台机器上(all in one)。
2.webapp+database:分离数据库与应用,提高数据读写性能。
3.nginx+nwebapp+database:负载均衡+多个应用服务器+数据库。
4.nginx+n
webapp+cache+database:基于第3次改变,增加缓存设置,提高读取性能。
5.nginx+nwebapp+cache+ndatabase:添加多个数据库,实现读写分离,提高读取性能。
6.基于5的基础上,对数据库进行改造,包括分表分库分区或使用第三方的软件(mycat等)来增强数据库性能。同时对webapp进行拆分,拆分出多个服务中心,每个服务中心负责专门的业务。期间涉及到的技术有(包括但不限于):redis/avtivemq(消息中间件)/mycat/zookeeper/nosql等

其实对于大型网站来说,主要问题就是
1.服务的管理:这个比较麻烦,如果服务多了以后各种接口的调用及服务状态的监控
2.io:对于现在情况来看,我们服务的主要瓶颈还是集中在io层。主要是数据库的读写比较耗费时间,所以解决了这个问题,我想应用的速度是可以更上一层楼的。包括利用适合ssd的数据库,记得国外有个这样的数据库。还有好的中间件,现在的中间件都有较大的性能损耗(30%)。

转:https://www.cnblogs.com/-10086/p/5179307.html



推荐阅读
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Python SQLAlchemy库的使用方法详解
    本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介,包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式,即SQL表达式语言和ORM。针对不同的需求,给出了选择哪种模式的建议。最后,介绍了连接数据库的方法,包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • LVS实现负载均衡的原理LVS负载均衡负载均衡集群是LoadBalance集群。是一种将网络上的访问流量分布于各个节点,以降低服务器压力,更好的向客户端 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 单点登录原理及实现方案详解
    本文详细介绍了单点登录的原理及实现方案,其中包括共享Session的方式,以及基于Redis的Session共享方案。同时,还分享了作者在应用环境中所遇到的问题和经验,希望对读者有所帮助。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • GreenDAO快速入门
    前言之前在自己做项目的时候,用到了GreenDAO数据库,其实对于数据库辅助工具库从OrmLite,到litePal再到GreenDAO,总是在不停的切换,但是没有真正去了解他们的 ... [详细]
  • MySQL数据库锁机制及其应用(数据库锁的概念)
    本文介绍了MySQL数据库锁机制及其应用。数据库锁是计算机协调多个进程或线程并发访问某一资源的机制,在数据库中,数据是一种供许多用户共享的资源,如何保证数据并发访问的一致性和有效性是数据库必须解决的问题。MySQL的锁机制相对简单,不同的存储引擎支持不同的锁机制,主要包括表级锁、行级锁和页面锁。本文详细介绍了MySQL表级锁的锁模式和特点,以及行级锁和页面锁的特点和应用场景。同时还讨论了锁冲突对数据库并发访问性能的影响。 ... [详细]
  • 1.Listener是Servlet的监听器,它可以监听客户端的请求、服务端的操作等。通过监听器,可以自动激发一些操作,比如监听在线的用户的数量。当增加一个HttpSession时 ... [详细]
  • nginx+多个tomcat
    学习nginx的时候遇到的问题:nginx怎么部署两台tomcat?upstream在网上找的资源,我在nginx配置文件(nginx.conf)中添加了两个server。结果只显 ... [详细]
  • ZABBIX 3.0 配置监控NGINX性能【OK】
    1.在agent端查看配置:nginx-V查看编辑时是否加入状态监控模块:--with-http_stub_status_module--with-http_gzip_stat ... [详细]
  • PHP输出缓冲控制Output Control系列函数详解【PHP】
    后端开发|php教程PHP,输出缓冲,Output,Control后端开发-php教程概述全景网页源码,vscode如何打开c,ubuntu强制解锁,sts启动tomcat慢,sq ... [详细]
  • 域名解析系统DNS
    文章目录前言一、域名系统概述二、因特网的域名结构三、域名服务器1.根域名服务器2.顶级域名服务器(TLD,top-leveldomain)3.权威(Authoritative)域名 ... [详细]
author-avatar
用户um940d5n0q
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有