当前位置: 开发笔记 > 后端 > 正文

构建一个类timeline系统的架构设计_MySQL

作者：freezing-wing | 来源：互联网 | 2018-04-18 19:26

构建一个类timeline系统的架构设计

最近一直对微博、twitter、微信朋友圈这类软件所提供的类timeline系统架构很有兴趣，也可以叫做时间轴、news feed，或者status update，查阅了不少资料，也结合自己对于架构设计的一些积累认识，尝试着设计了一把。下图是一个简单tweets界面：

首先明确目标，要设计的系统是一个用户数、数据量、并发量足够大的平台，按照一般经验：

1M+ Active User，10T后台数据，3k/per sec QPS，peek 6k/per sec QPS

（ 这里声明一点，业务需求决定技术演化路线，任何项目开始做要start from the bottom up，千万不要过度设计啊，下文都是尝试的思考 ）

这里先介绍一个简化的模型，当系统单机+MySQL时候，我们的表结构设计可以如下

用户表：

| uid | username |

关系表：

| uid | following_uid |

feed表：

| fid | uid | content | create_time |

假设A用户关注了B、C。B和C各发表一个feed直接insert feed表即可。

A查看自己的timeline的SQL可以表示为：

SELECT uid, content FROM feed WHERE uid IN (SELECT following_uid FROM 关系表 WHERE uid = A) ORDER BY create_time DESC

这里如果QPS较低，总体数据量在1T以下时候，单机+MySQL单纯的靠scale up还可以满足，但是一旦用户数、数据量、并发量成倍的上去的时候，这个模型显然不够用了。

一个更加成熟的设计方案如下图所示，

这里大致分为4个部分，Portal、Pusher、Puller以及存储，下面详细的说明下。

存储&缓存

先说存储的原因是，随着数据量的增大，我们首选要解决的是一个扩容问题，这个实际在项目kick-off时候容量规划就应该做好，单库单表无法满足我们需求的时候，我们就分库分表。

尤其是基于MySQL这种久经考验但是缺少NoSQL特性的数据库，在水平扩展方面没有很好的支持，这里涉及很多问题不多讨论原因，所以最初的分库分表规则要定制好，形成一套规则，以及数据库路由访问层（DAL），防止数据迁移带来的高运维成本。

分库可以按照业务重要程度分成不同库服务于不同的业务，例如核心的feed库应该单独一个物理库来存储，而非核心的例如用户资料库可以单独一个物理库+逻辑库解决。

核心库在这样一个大型系统，可以分为64库，feed表可以分为256表。采用uid求模的方式来计算该feed应该路由存储到哪个库分片（slice）的哪张表（table）上。还有一种思路是按照时间来分表，这里不做延伸。

表的存储方面也有一些技巧，一般MySQL允许的单表容量在2000w，所以一般将热表数据锁定在一个2000w行的量级上，而将历史的冷数据干脆archive到一个history表，这些表一般不轻易查询。对于存储引擎来说，热表可以用InnoDB，冷表用MyISAM，定期由DBA维护保持热表的行数稳定不膨胀，提高热表的查询效率。

关于事务方面，其实很多场景下，我们要追求性能，就必须舍弃掉一些东西，例如一致性、可用性等等，在这里对于feed这种场景，我们完全可以牺牲一些一致性的苛刻要求，只追求最终一致性来达到我们对于减低系统复杂度，提高性能的目的，所以我们在这种系统内尽量不启用事务，不管是数据库事务，还是分布式事务都不用。

第二个，按照上面那个复杂的连表查询SQL，当数据量很大的时候，首先uid落不到一个库上更很少可能会是一张表，这种查询必然在大数据情况下产品性能瓶颈，一个常见的解决模式便是利用缓存，用空间换时间的思想，尽量让请求通通落到缓存上，也就是说提高缓存命中率，例如timeline如果能做到90%，那么用户体验就会上升很多。

缓存这里指分布式缓存，相对与数据库访问，他们性能是非常高的，单机上万QPS不成问题，而且响应时间基本在<10ms，甚至1、2ms返回。例如memcahe、redis等KV类型的缓存，memcache有成熟的spymemcache client做一致性哈希策略来支持高可用HA场景，而redis提供了丰富的数据结构、持久化策略、主从同步、以及比memcache在某些场景下更加优秀的性能，因此在近几年非常流行，大有取代memcache的趋势。

在timeline存储的场景中，可以将用户的所有关注人的feed组成一个list，存储在分布式缓存中，例如redis的存储数据结构选择list，可以用RPUSHX命令更新一组由feed组成的timeline。

当然用redis这种开源的NoSQL当缓存，也要有很好的HA策略，例如主从，双写随机读，一致性哈希等，他们在运维成本，性能、客户端轻重角度各有优劣，因此选择最适合自己的方案即可。还有当不可用时候的雪崩效应，会不会击穿数据库等，都需要考虑。

另外这里延伸下，pusher的下游是数据源，而cache的更新可以不走pusher，而是在MySQL下面接入一个伪装的从库，接收row based binlog来判断insert、update、delete从而可以实现更新timeline cache的逻辑。

Portal

这里的Portal提供面向客户的对外服务。

最上层分别是WEB和API的模块，一个类timeline系统一般是web和app端都覆盖的，因此，WEB提供平台端访问直接给前端提供服务；而API可以遵循REST架构风格，通过OAuth2.0协议做权限验证，对外给第三方提供服务。

第二层我叫做Presentation tier，主要负责基础的权限验证，封装不同的view给前端使用。

第三层到达了核心的业务逻辑层。

其实按照一个合理的分层思想，还应该有数据资源层、物理访问层，这幅图其实想更多的表达一个流程图的意义，故没有表现出这两个底层来。

Pusher

当系统比较简单的时候，Portal可以直接来操作底层数据源MySQL存储，但是别忘了我们要构建的是一个复杂的大规模分布式系统，因此我们要借鉴一些互联网设计的常用模式，这里最适合的模式便是“异步解耦”。

一般单机App server（如Tomcat）其QPS可以达到5000左右，这只是理论值，而且不考虑峰值，利用集群模式，将server scale out横向扩展，做到彼此无状态，可以一定程度解决性能瓶颈，但是当客户端要求响应极其苛刻的时候（例如timeline首页要求必须150ms内返回），不能以阻塞客户端、或者牺牲性能为代价，这时候我们可以把异步来解耦，客户端直接返回，由后端服务慢慢消化，在Java中Executors框架遍提供这种单机的模型，一个BlockingQueue，后面是一个线程池（thread pool）按照系统可以接受的吞吐量来处理任务。

Pusher是一种重发轻查的方式，如下图所示，它有两个职责，1）存储MySQL，2）fan-out去更新所有活跃用户的timeline cache

不管#1还是#2，前面都接了一个queue来，这个queue可以是redis也可以是 Kestrel ，这里说下 Kestrel ，它是twitter开源的一个消息队列，它的一个去中心化思路对于小型团队秉承简单易用的原则很重要：

“Dropping the requirement on cross communication makes it horizontally scale to infinity and beyond: no multicast, no clustering, no "elections", no coordination at all. No talking! Shhh!”

Delivery可以看做是投递服务，主要是fan-out，所谓fan-out如下图所示，汲取的是“推”的思想，将新的feed更新到粉丝的timeline cache中，就是上一节提到的分布式缓存。

当然fan-out也不是所有的粉丝都分发出去，那对于“姚晨”这种有千万粉丝的用户来说，瞬间的负荷就太大了。所以要采用分级的策略，也就是说将粉丝按照活跃程度分为不同的等级，对于近一两天有登陆的用户push到优先queue来处理，而将不活跃甚至数周都没有登陆的用户干脆不进行推送。

Puller

再来看Puller，它可以看做是一个“拉”的过程。

对于活跃用户，他的timeline cache还没有过期（expired），那么可以按照uid直接去redis缓存中拉数据。

对于非活跃用户，他的timeline cache未命中，所以要建立这个timeline cache，按照最开始介绍的简单模型，需要取出所有的关注uid，然后分库分表查询，这里也不是一个串行的过程，同样在单机上利用Java提供的Excecutors框架，用invokeAll（Callable）方法获取所有Future，设置一个timeout时间查询失败的干脆忽略，还有考虑用CyclicBarrier，需要所有的子任务都完成时，才执行主任务取进行多数据源merge，rank、sort、filter、page工作。

对于Puller拉的缓存其实还以分为3级，

1）JVM缓存：单机JVM缓存，当前端portal不是随机call puller的时候，而是固定user落到固定的server上时候，这个缓存就非常重要，可以尝试用guava的cache来实现。

2）page or fragment cache：通常明星用户的timeline会被很多人访问，可以尝试将这些高频访问用户的渲染出来的timeline进行一个缓存，这个渲染的结果甚至可以是包含js、模板运算完毕的。

3）上述的timeline cache，不赘述。

对于缓存还可以将内容和id分开，众所周知，固定长度并且都是数字保存的数据结构更加有利于查询和节省存储空间，那么缓存可以分为两类，一级缓存是

| uid | fid | following_uid |

二级缓存是

| fid | content |

而二级缓存就可以用protobuf、thrift等高性能二进制压缩协议来存储交换，而一级缓存可以用更少的资源来存储，当二级缓存down的时候，还可以用来迅速查询MySQL取数据。

Comet

一般客户端都会看到“几条未读新鲜事”之类的提醒，一般都是通过comet来实现的long polling，用nginx的push stream module可以完成这个操作，不断对比timeline的last fid和timeline cache中的last fid，如果有diff则提示count（diff）未读。

服务型架构

Portal、Pusher、Puller等在模块化的基础之上，可以采用服务化的思想来改造，twitter用的即是 Finagle 框架，该种框架可以提供高性能的二进制RPC通信交互协议，同时提供服务注册、发现，服务治理的能力。这里打个广告自己在项目组开源的 navi-rpc 和这种服务化框架思想类似。

上述纯个人研究思考用，实际情况要具体问题具体分析，没有放诸四海而皆准的办法，但是有些设计的原则和模式可以沉淀下来借鉴。

原创文章，转载请注明来源于neoremind.net。

推荐阅读

缓存
14亿人的大项目，腾讯云数据库拿下！

全国人 ... [详细]

蜡笔小新 2023-10-17 17:56:19
缓存
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
缓存
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
缓存
FileNotFoundException: File does not exist

ubuntu用sqoop将数据从hive导入mysql时，命令： ... [详细]

蜡笔小新 2023-12-12 18:56:13
缓存
分享css中提升优先级属性!important的用法总结

web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]

蜡笔小新 2023-12-11 11:25:16
缓存
开发笔记:软件测试知识点之数据库压力测试方法小结

篇首语：本文由编程笔记#小编为大家整理，主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-10 20:29:19
server
关系型数据库和NoSQL数据库的介绍及应用场景

本文介绍了关系型数据库和NoSQL数据库的概念和特点，列举了主流的关系型数据库和NoSQL数据库，同时描述了它们在新闻、电商抢购信息和微博热点信息等场景中的应用。此外，还提供了MySQL配置文件的相关内容。 ... [详细]

蜡笔小新 2023-12-10 15:47:11
缓存
2021最新总结网易/腾讯/CVTE/字节面经分享（附答案解析）

本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题，包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记，并附带答案解析。 ... [详细]

蜡笔小新 2023-12-09 19:11:31
python
面试经验分享：华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试

最近有朋友去华为面试，面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败，因为缺乏基础知识。面试问题涉及 ... [详细]

蜡笔小新 2023-12-09 10:22:03
server
负载均衡_Nginx反向代理动静分离负载均衡及rewrite隐藏路径详解（Nginx Apache MySQL Redis）–第二部分

nginx反向代理、动静分离、负载均衡及rewrite隐藏路径详解 ... [详细]

蜡笔小新 2023-10-17 21:34:48
cache
像跟踪分布式服务调用那样跟踪Go函数调用链 | Gopher Daily (2020.12.07) ʕ◔ϖ◔ʔ

每日一谚：“Acacheisjustamemoryleakyouhaven’tmetyet.”—Mr.RogersGo技术专栏“改善Go语⾔编程质量的50个有效实践” ... [详细]

蜡笔小新 2023-10-17 19:23:45
cache
ASP.NET Tips: 获取插入记录的ID的方法详解

本文详细介绍了在ASP.NET中获取插入记录的ID的几种方法，包括使用SCOPE_IDENTITY()和IDENT_CURRENT()函数，以及通过ExecuteReader方法执行SQL语句获取ID的步骤。同时，还提供了使用这些方法的示例代码和注意事项。对于需要获取表中最后一个插入操作所产生的ID或马上使用刚插入的新记录ID的开发者来说，本文提供了一些有用的技巧和建议。 ... [详细]

蜡笔小新 2023-12-13 17:03:18
cache
一次上线事故，30岁+的程序员踩坑经验之谈

本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间，作为一个在线医疗项目，他们进行了优惠折扣活动的升级改造。然而，在上线前的最后一天，由于大量数据请求，导致部分接口出现问题。作者通过部署两台opentsdb来解决问题，但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]

蜡笔小新 2023-12-10 17:25:31
缓存
旁路|发生_Day749.旁路缓存：Redis是如何工作的Redis 核心技术与实战

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Day749.旁路缓存：Redis是如何工作的-Redis核心技术与实战相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-09 04:28:29
缓存
（九）Docker常用安装

一、总体步骤1、搜索镜像2、拉取镜像3、查看镜像4、启动镜像5、停止镜像6、移除镜像二、安装tomcat1、dockerhub上面查找tomcat镜像 dockersearchto ... [详细]

蜡笔小新 2023-10-17 18:10:49

freezing-wing

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章