博客
关于我
老大让我复盘上次Redis缓存雪崩事故
阅读量:360 次
发布时间:2019-03-04

本文共 863 字,大约阅读时间需要 2 分钟。

抢购活动线上事故复盘:缓存雪崩的教训

事故背景

近期公司推出了一个商品抢购活动,由于后台操作失误,导致活动效果不佳,引发了用户和代理商的投诉。老大让我与同事一起复盘这次线上事故。

什么原因造成的?

抢购活动原本计划在0点准时开始,22点运营人员通过后台将商品上线。23点后台小哥已经将商品导入缓存中,提前预热。

抢购开始时流量非常大,预计Redis将承担大部分用户查询请求,避免所有请求都落在数据库上。

预期与现实

根据预期,大部分请求应该命中缓存。然而,后台小哥在预热缓存时,将所有商品的缓存时间设置为2小时过期。结果,在同一时间点,所有商品的缓存同时失效,所有请求都落到了数据库上,导致数据库无法承受压力,崩溃,用户请求全部超时报错。

当前发现

凌晨1:02,SRE收到系统告警,登录运维管理系统发现数据库节点CPU和内存飙升超过阈值,迅速联系后台开发人员定位排查。

为什么没有早点发现?

缓存设置过期时间是2小时,凌晨1点前缓存可以命中大部分请求,数据库服务处于正常状态。

发现时采取的措施

后台小哥通过日志定位排查问题后,采取了以下措施:

  • 通过API Gateway限制大部分流量
  • 宕机的数据库服务重启
  • 重新预热缓存
  • 确认缓存和数据库服务正常后,将网关流量正常放开
  • 抢购活动恢复正常,大约01:30
  • 如何避免下次出现?

    这次事故的根本原因是缓存雪崩,查询数据量巨大,请求直接落到数据库上,导致数据库压力过大宕机。

    业界解决缓存雪崩的方法有以下几种:

    方法一:均匀过期

    设置不同的过期时间,失效时间点尽量均匀。通常为有效期增加随机值或统一规划有效期。

    方法二:加互斥锁

    跟缓存击穿解决思路一致,同一时间只让一个线程构建缓存,其他线程阻塞排队。

    方法三:缓存永不过期

    跟缓存击穿解决思路一致,缓存在物理上永远不过期,用一个异步的线程更新缓存。

    复盘总结

    通过与同事复盘这次线上事故,大家对缓存雪崩有了更深刻的理解。为了避免类似问题,我们讨论了多个解决方案:

    • 均匀过期
    • 加互斥锁
    • 缓存永不过期

    希望技术人能够敬畏每一行代码!

    转载地址:http://dlbr.baihongyu.com/

    你可能感兴趣的文章
    OAuth2.0_JWT令牌-生成令牌和校验令牌_Spring Security OAuth2.0认证授权---springcloud工作笔记148
    查看>>
    OAuth2.0_JWT令牌介绍_Spring Security OAuth2.0认证授权---springcloud工作笔记147
    查看>>
    OAuth2.0_介绍_Spring Security OAuth2.0认证授权---springcloud工作笔记137
    查看>>
    OAuth2.0_完善环境配置_把资源微服务客户端信息_授权码存入到数据库_Spring Security OAuth2.0认证授权---springcloud工作笔记149
    查看>>
    OAuth2.0_授权服务配置_Spring Security OAuth2.0认证授权---springcloud工作笔记140
    查看>>
    OAuth2.0_授权服务配置_令牌服务和令牌端点配置_Spring Security OAuth2.0认证授权---springcloud工作笔记143
    查看>>
    OAuth2.0_授权服务配置_客户端详情配置_Spring Security OAuth2.0认证授权---springcloud工作笔记142
    查看>>
    OAuth2.0_授权服务配置_密码模式及其他模式_Spring Security OAuth2.0认证授权---springcloud工作笔记145
    查看>>
    OAuth2.0_授权服务配置_资源服务测试_Spring Security OAuth2.0认证授权---springcloud工作笔记146
    查看>>
    OAuth2.0_环境介绍_授权服务和资源服务_Spring Security OAuth2.0认证授权---springcloud工作笔记138
    查看>>
    OAuth2.0_环境搭建_Spring Security OAuth2.0认证授权---springcloud工作笔记139
    查看>>
    oauth2.0协议介绍,核心概念和角色,工作流程,概念和用途
    查看>>
    OAuth2授权码模式详细流程(一)——站在OAuth2设计者的角度来理解code
    查看>>
    oauth2登录认证之SpringSecurity源码分析
    查看>>
    OAuth2:项目演示-模拟微信授权登录京东
    查看>>
    OA系统多少钱?OA办公系统中的价格选型
    查看>>
    OA系统选型:选择好的工作流引擎
    查看>>
    OA让企业业务流程管理科学有“据”
    查看>>
    OA项目之我的会议(会议排座&送审)
    查看>>
    OA项目之我的会议(查询)
    查看>>