热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何用Redis平衡海量信息推送的实效与体量

前阵子开发了公司领劵中心的项目,这个项目是以Redis作为关键技术落地的。先说一下领劵中心的项目吧,这个项目就类似京东App的领劵中心,当

前阵子开发了公司领劵中心的项目,这个项目是以Redis作为关键技术落地的。


先说一下领劵中心的项目吧,这个项目就类似京东App的领劵中心,当然图是截取京东的,公司的就不截了。




其中有一个功能叫做领劵的订阅推送。什么是领劵的订阅推送?就是用户订阅了该劵的推送,在可领取前的一分钟就要把提醒信息推送到用户的App中。本来这个订阅功能应该是消息中心那边做的,但他们说这个短时间内做不了,所以让我这个负责优惠劵的做了。具体方案就是到具体的推送时间点了,Coupon系统调用消息中心的推送接口,把信息推送出去。


下面我们分析一下这个功能的业务情景:


公司目前注册用户6000W+,是哪家就不要打听了,比如有一张无门槛的优惠劵下单立减20元,那么抢这张劵的人就会比较多,我们保守估计10W+,百万级别不好说。我们初定为20W万人,那么这20W条推送信息要在一分钟推送完成,并且一个用户是可以订阅多张劵的。所以我们知道了这个订阅功能有两个突出的难点:



  • 推送的实效性:推送慢了,用户会抱怨没有及时通知他们错过了开抢时机;

  • 推送的体量大:爆款的神劵,人人都想抢。


然而推送体量又会影响到推送的实效性。这真是一个让人头疼的问题……那就让我们把问题一个个解决掉吧!


推送的实效性的问题


当用户在领劵中心订阅了某个劵的领取提醒后,在后台就会生成一条用户的订阅提醒记录,里面记录了在哪个时间点给用户发送推送信息。所以问题就变成了系统如何快速实时选出哪些要推送的记录。


方案1:MQ的延迟投递


MQ虽然支持消息的延迟投递但尺度太大1s 5s 10s 30s 1m,用来做精确时间点投递不行。并且用户执行订阅之后又取消订阅的话,要把发出去的MQ消息Delete掉这个操作有点头大,短时间内难以落地,而且用户可以取消之后再订阅,这又涉及到去重的问题,所以MQ的方案否掉。


方案2:传统定时任务


这个相对来说就简单一点,用定时任务是去DB里面Load用户的订阅提醒记录,从中选出当前可以推送的记录。但有句话说得好任何脱离实际业务的设计都是耍流氓,下面我们就分析一下传统的定时任务到底适不适合我们的这个业务:




综上所述,我们就知道了一般传统的定时任务存在以下缺点:



  • 性能瓶颈。只有一台机在处理,在大体量数据面前力不从心;

  • 实效性差。定时任务的频率不能太高,太高会给业务数据库造成很大的压力;

  • 单点故障。万一跑的那台机挂了,那整个业务不可用了,这是一个很可怕的事情。


所以传统定时任务也不太适合这个业务。


那我们是不是就束手无策了呢?其实不是的。我们只要对传统的定时任务做一个简单的改造,就可以把它变成可以同时多机跑,而且实效性可以精确到秒级,同时拒绝单点故障的定时任务集群。这其中就要借助我们的强大的Redis了。

     

方案3:定时任务集群


首先我们要定义定时任务集群要解决的三个问题:



  • 实效性要高

  • 吞吐量要大

  • 服务要稳定,不能有单点故障 


下面是整个定时任务集群的架构图: 




架构很简单:我们把用户的订阅推送记录存储到Redis集群的SortedSet队列里面,并且以提醒用户提醒时间戳作为Score值,然后在我们个每业务Server里面起一个定时器频率是秒级,我的设定就是1s,然后经过负载均衡之后从某个队列里面获取要推送的用户记录进行推送。


下面我们分析以下这个架构:



  • 性能:除去带宽等其它因素,基本与机器数成线性相关,机器数量越多吞吐量越大,机器数量少时相对的吞吐量就减少;

  • 实效性:提高到了秒级,效果还可以接受;

  • 单点故障?不存在的!除非Redis集群或者所有Server全挂了……


为什么用Redis


这里解析一下为什么用Redis:



  • Redis可以作为一个高性能的存储DB,性能要比MySQL好很多,并且支持持久化,稳定性好。

  • Redis SortedSet队列天然支持以时间作为条件排序,完美满足我们选出要推送的记录。

    

ok~既然方案已经有了,那如何在一天时间内把这个方案落地呢?是的,我设计出这个方案到基本编码完成,时间就是一天,因为时间太赶鸟……


首先我们以user_Id作为Key,然后Mod队列数Hash到Redis SortedSet队列里面。为什么要这样?因为如果用户同时订阅了两张劵并且推送时间很近,这样的两条推送就可以合并成一条,并且hash也相对均匀。下面是部分代码的截图:




然后要决定队列的数量,一般正常来说我们有多少台处理的服务器就定义多少条队列,因为队列太少,会造成队列竞争,太多可能会导致记录得不到及时处理。


然而最佳实践是队列数量应该是可动态配置化的,因为线上的集群机器数是会经常变的。大促的时候一般我们会加机器,并且业务量增长了,机器数也是会增加。所以我是借用了淘宝的Diamond进行队列数的动态配置:




我们每次从队列里面取多少条记录也是可以动态配置的 :




这样就可以随时根据实际的生产情况调整整个集群的吞吐量,所以我们的定时任务集群还具有一个特性就是支持动态调整。


最后一个关键组件就是负载均衡了。这个是非常重要的,因为这个做得不好就会可能导致多台机竞争同时处理一个队列,影响整个集群的效率。在时间很紧的情况下,我就用了一个简单实用的利用Redis一个自增Key然后Mod队列数量算法。这样就很大程度上就保证不会有两台机器同时去竞争一条队列。




最后我们算一下整个集群的吞吐量:


10(机器数)*2000(一次拉取数)=20000。然后以MQ的形式把消息推送到消息中心,发MQ是异步的,算上其它处理0.5s。


其实发送20W的推送也就是十几s的事情。


ok~ 到这里我们整个定时任务集群就差不多基本落地好了。如果你问我后面还有什么可以完善的话那就是:



  • 加监控, 集群怎么可以木有监控呢,万一出问题有任务堆积怎么办?

  • 加上可视化界面;

  • 最好有智能调度,增加任务优先级。优先级高的任务先运行嘛~

  • 资源调度,万一机器数量不够,力不从心,优先保证重要任务执行。


目前项目已上前线,运行平稳~





推荐阅读
  • 玩转直播系列之消息模块演进(3)
    一、背景即时消息(IM)系统是直播系统重要的组成部分,一个稳定的,有容错的,灵活的,支持高并发的消息模块是影响直播系统用户体验的重要因素。IM长连接服务在直播系统有发挥着举足轻重的 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 负载均衡_Nginx反向代理动静分离负载均衡及rewrite隐藏路径详解(Nginx Apache MySQL Redis)–第二部分
    nginx反向代理、动静分离、负载均衡及rewrite隐藏路径详解 ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • 有意向可以发简历到邮箱内推.简历直达组内Leader.能做同事的话,内推奖励全给你. ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 深入理解Kafka服务端请求队列中请求的处理
    本文深入分析了Kafka服务端请求队列中请求的处理过程,详细介绍了请求的封装和放入请求队列的过程,以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析,帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]
  • 基于分布式锁的防止重复请求解决方案
    一、前言关于重复请求,指的是我们服务端接收到很短的时间内的多个相同内容的重复请求。而这样的重复请求如果是幂等的(每次请求的结果都相同,如查 ... [详细]
  • 14亿人的大项目,腾讯云数据库拿下!
    全国人 ... [详细]
  • 目录Atlas介绍Atlas部署Atlas基本管理Atlas结合MHA故障恢复读写分离建议Atlas介绍Atlas是由Qihoo360Web平台部基础架构团队开发维护的一个基于My ... [详细]
  • php网站设计实验报告,php网站开发实训报告
    本文目录一览:1、php动态网站设计的关键技术有哪些软件,及搭建步骤需要哪些页面,分别完成 ... [详细]
author-avatar
将登太行的2602939913
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有