Redis知识点

Get Started. It's Free
or sign up with your email address
Redis知识点 by Mind Map: Redis知识点

1. 优缺点

1.1. 优点

1.1.1. 读写性能优异, Redis能读的速度是110000次/s,写的速度是81000次/s。

1.1.2. 支持数据持久化,支持AOF和RDB两种持久化方式。

1.1.3. 支持事务,Redis的所有操作都是原子性的,同时Redis还支持对几个操作合并后的原子性执行。

1.1.4. 数据结构丰富,除了支持string类型的value外还支持hash、set、zset、list等数据结构。

1.1.5. 支持主从复制,主机会自动将数据同步到从机,可以进行读写分离。

1.2. 缺点

1.2.1. 数据库容量受到物理内存的限制,不能用作海量数据的高性能读写,因此Redis适合的场景主要局限在较小数据量的高性能操作和运算上。

1.2.2. Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复。

1.2.3. 主机宕机,宕机前有部分数据未能及时同步到从机,切换IP后还会引入数据不一致的问题,降低了系统的可用性。

1.2.4. Redis 较难支持在线扩容,在集群容量达到上限时在线扩容会变得很复杂。为避免这一问题,运维人员在系统上线时必须确保有足够的空间,这对资源造成了很大的浪费。

2. redis分布式锁

2.1. SETNX

2.1.1. SETNX 是『SET if Not eXists』(如果不存在,则 SET)的简写。

2.1.2. 当且仅当 key 不存在,将 key 的值设为 value。 若给定的 key 已经存在,则 setNx不做任何动作

2.1.3. Redis为单进程单线程模式,采用队列模式将并发访问变成串行访问,且多客户端对Redis的连接并不存在竞争关系Redis中可以使用setNx命令实现分布式锁。

2.1.4. 返回值:设置成功,返回 1 。设置失败,返回 0 。

2.1.5. 为了防止获取锁后程序出现异常,导致其他线程/进程调用setNx命令总是返回0而进入死锁状态,需要为该key设置一个“合理”的过期时间释放锁,使用DEL命令将锁数据删除

2.2. RedLock

2.2.1. 解决 Redis 的并发竞争 Key 问题

2.2.1.1. 多个系统同时对一个 key 进行操作,但是最后执行的顺序和我们期望的顺序不同,这样也就导致了结果的不同

2.2.2. 特性

2.2.2.1. 安全特性:互斥访问,即永远只有一个 client 能拿到锁

2.2.2.2. 避免死锁:最终 client 都可能拿到锁,不会出现死锁的情况,即使原本锁住某资源的 client crash 了或者出现了网络分区

2.2.2.3. 容错性:只要大部分 Redis 节点存活就可以正常提供服务

3. 功能

3.1. 缓存

3.1.1. 将热点数据放到内存中,设置内存的最大使用量以及淘汰策略来保证缓存的命中率。

3.2. 会话缓存

3.2.1. 可以使用 Redis 来统一存储多台应用服务器的会话信息。当应用服务器不再存储用户的会话信息,也就不再具有状态,一个用户可以请求任意一个应用服务器,从而更容易实现高可用性以及可伸缩性。

3.3. 计数器

3.3.1. 可以对 String 进行自增自减运算,从而实现计数器功能。Redis 这种内存型数据库的读写性能非常高,很适合存储频繁读写的计数量。

3.4. 查找表

3.4.1. 例如 DNS 记录就很适合使用 Redis 进行存储。查找表和缓存类似,也是利用了 Redis 快速的查找特性。但是查找表的内容不能失效,而缓存的内容可以失效,因为缓存不作为可靠的数据来源。

3.5. 消息队列

3.5.1. List 是一个双向链表,可以通过 lpush 和 rpop 写入和读取消息。不过最好使用 Kafka、RabbitMQ 等消息中间件。

3.6. 分布式session

3.7. 分布式锁

3.7.1. 在分布式场景下,无法使用单机环境下的锁来对多个节点上的进程进行同步。可以使用 Redis 自带的 SETNX 命令实现分布式锁,除此之外,还可以使用官方提供的 RedLock 分布式锁实现。

3.8. 全页缓存(FPC)

3.8.1. 除基本的会话token之外,Redis还提供很简便的FPC平台。以Magento为例,Magento提供一个插件来使用Redis作为全页缓存后端。此外,对WordPress的用户来说,Pantheon有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。

4. 启动

4.1. docker

4.1.1. docker pull redis:6.0

4.1.2. docker run

4.1.3. docker exec -it redis bash

4.1.4. redis-cli -a test

5. 命令

5.1. CONFIG

5.2. SET

5.3. GET

5.4. DEL

5.5. HMSET

5.6. HGET

5.7. lpush

5.8. lrange

5.9. sadd

5.10. smembers

5.11. zadd

5.12. zrangebyscore

5.13. redis-cli连接命令

5.13.1. redis-cli -h host -p port -a password

5.14. ping

5.14.1. 返回PONG

5.15. 语法

5.15.1. COMMAND KEY_NAME

5.15.2. 成功返回(integer) 1

5.15.3. 失败返回(integer) 0

6. Redis 与 Memcached 对比

6.1. 未命名

7. 持久化

7.1. RDB快照

7.1.1. 未命名

7.1.2. RDB是Redis默认的持久化方式。按照一定的时间将内存的数据以快照的形式保存到硬盘中,对应产生的数据文件为dump.rdb。通过配置文件中的save参数来定义快照的周期。

7.1.3. 优点

7.1.3.1. 只有一个文件 dump.rdb,方便持久化。

7.1.3.2. 容灾性好,一个文件可以保存到安全的磁盘。

7.1.3.3. 性能最大化,fork 子进程来完成写操作,让主进程继续处理命令,所以是 IO 最大化。使用单独子进程来进行持久化,主进程不会进行任何 IO 操作,保证了 redis 的高性能

7.1.3.4. 相对于数据集大时,比 AOF 的启动效率更高。

7.1.4. 缺点

7.1.4.1. 数据安全性低。RDB 是间隔一段时间进行持久化,如果持久化之间 redis 发生故障,会发生数据丢失。所以这种方式更适合数据要求不严谨的时候)

7.2. AOF日志

7.2.1. 未命名

7.2.2. AOF持久化(即Append Only File持久化),则是将Redis执行的每次写命令记录到单独的日志文件中,当重启Redis会重新将持久化的日志中文件恢复数据。

7.2.3. 当两种方式同时开启时,数据恢复Redis会优先选择AOF恢复

7.2.4. 优点

7.2.4.1. 数据安全,aof 持久化可以配置 appendfsync 属性,有 always,每进行一次 命令操作就记录到 aof 文件中一次。

7.2.4.2. 通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-check-aof 工具解决数据一致性问题。

7.2.4.3. AOF 机制的 rewrite 模式。AOF 文件没被 rewrite 之前(文件过大时会对命令 进行合并重写),可以删除其中的某些命令(比如误操作的 flushall))

7.2.5. 缺点

7.2.5.1. AOF 文件比 RDB 文件大,且恢复速度慢。

7.2.5.2. 数据集大的时候,比 rdb 启动效率低。

7.2.6. 俩种持久化的优缺点是什么?

7.2.6.1. AOF文件比RDB更新频率高,优先使用AOF还原数据。

7.2.6.2. AOF比RDB更安全也更大

7.2.6.3. RDB性能比AOF好

7.2.6.4. 如果两个都配了优先加载AOF

7.3. 如何选择合适的持久化方式

7.3.1. 一般来说, 如果想达到足以媲美PostgreSQL的数据安全性,你应该同时使用两种持久化功能。在这种情况下,当 Redis 重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。

7.3.2. 如果你非常关心你的数据, 但仍然可以承受数分钟以内的数据丢失,那么你可以只使用RDB持久化。

7.3.3. 有很多用户都只使用AOF持久化,但并不推荐这种方式,因为定时生成RDB快照(snapshot)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比AOF恢复的速度要快,除此之外,使用RDB还可以避免AOF程序的bug。

7.3.4. 如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式。

8. 规模

8.1. 分布式Redis是前期做还是后期规模上来了再做好?为什么?

8.1.1. 既然Redis是如此的轻量(单实例只使用1M内存),为防止以后的扩容,最好的办法就是一开始就启动较多实例。即便你只有一台服务器,你也可以一开始就让Redis以分布式的方式运行,使用分区,在同一台服务器上启动多个实例。

8.1.2. 一开始就多设置几个Redis实例,例如32或者64个实例,对大多数用户来说这操作起来可能比较麻烦,但是从长久来看做这点牺牲是值得的。

8.1.3. 这样的话,当你的数据不断增长,需要更多的Redis服务器时,你需要做的就是仅仅将Redis实例从一台服务迁移到另外一台服务器而已(而不用考虑重新分区的问题)。一旦你添加了另一台服务器,你需要将你一半的Redis实例从第一台机器迁移到第二台机器。

9. 如何保证缓存与数据库双写时的数据一致性

10. Redis持久化数据和缓存怎么做扩容?

10.1. 如果Redis被当做缓存使用,使用一致性哈希实现动态扩容缩容。

10.2. 如果Redis被当做一个持久化存储使用,必须使用固定的keys-to-nodes映射关系,节点的数量一旦确定不能变化。否则的话(即Redis节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统,而当前只有Redis集群可以做到这样。

11. Redis的过期键的删除策略

11.1. 定时过期

11.1.1. 每个设置过期时间的key都需要创建一个定时器,到过期时间就会立即清除。该策略可以立即清除过期的数据,对内存很友好;但是会占用大量的CPU资源去处理过期的数据,从而影响缓存的响应时间和吞吐量

11.2. 惰性过期

11.2.1. 只有当访问一个key时,才会判断该key是否已过期,过期则清除。该策略可以最大化地节省CPU资源,却对内存非常不友好。极端情况可能出现大量的过期key没有再次被访问,从而不会被清除,占用大量内存。

11.3. 定期过期

11.3.1. 每隔一定的时间,会扫描一定数量的数据库的expires字典中一定数量的key,并清除其中已过期的key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得CPU和内存资源达到最优的平衡效果。

11.3.2. (expires字典会保存所有设置了过期时间的key的过期时间数据,其中,key是指向键空间中的某个键的指针,value是该键的毫秒精度的UNIX时间戳表示的过期时间。键空间是指该Redis集群中保存的所有键。)

12. Redis的内存淘汰策略有哪些

12.1. 全局的键空间选择性移除

12.1.1. noeviction

12.1.1.1. 当内存不足以容纳新写入数据时,新写入操作会报错。

12.1.2. allkeys-lru

12.1.2.1. 当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的key。(这个是最常用的)

12.1.3. allkeys-random

12.1.3.1. 当内存不足以容纳新写入数据时,在键空间中,随机移除某个key。

12.2. 设置过期时间的键空间选择性移除

12.2.1. volatile-lru

12.2.1.1. 当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,移除最近最少使用的key。

12.2.2. volatile-random

12.2.2.1. 当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,随机移除某个key。

12.2.3. volatile-ttl

12.2.3.1. 当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,有更早过期时间的key优先移除。

13. 为什么要用 Redis / 为什么要用缓存

13.1. 高性能

13.1.1. 假如用户第一次访问数据库中的某些数据。这个过程会比较慢,因为是从硬盘上读取的。将该用户访问的数据存在数缓存中,这样下一次再访问这些数据的时候就可以直接从缓存中获取了。操作缓存就是直接操作内存,所以速度相当快。如果数据库中的对应数据改变的之后,同步改变缓存中相应的数据即可!

13.2. 高并发

13.2.1. 直接操作缓存能够承受的请求是远远大于直接访问数据库的,所以我们可以考虑把数据库中的部分数据转移到缓存中去,这样用户的一部分请求会直接到缓存这里而不用经过数据库。

14. 为什么要用 Redis 而不用 map/guava 做缓存?

14.1. 缓存分为本地缓存和分布式缓存。以 Java 为例,使用自带的 map 或者 guava 实现的是本地缓存,最主要的特点是轻量以及快速,生命周期随着 jvm 的销毁而结束,并且在多实例的情况下,每个实例都需要各自保存一份缓存,缓存不具有一致性。

14.2. 使用 redis 或 memcached 之类的称为分布式缓存,在多实例的情况下,各实例共用一份缓存数据,缓存具有一致性。缺点是需要保持 redis 或 memcached服务的高可用,整个程序架构上较为复杂。

15. Redis为什么这么快

15.1. 完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度都是O(1);

15.2. 数据结构简单,对数据操作也简单,Redis 中的数据结构是专门进行设计的;

15.3. 采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗;

15.4. 使用多路 I/O 复用模型,非阻塞 IO;

15.5. 使用底层模型不同,它们之间底层实现方式以及与客户端之间通信的应用协议不一样,Redis 直接自己构建了 VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;

16. 事务

16.1. Redis事务的概念

16.1.1. Redis 事务的本质是通过MULTI、EXEC、WATCH等一组命令的集合。事务支持一次执行多个命令,一个事务中所有命令都会被序列化。在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。

16.1.2. 总结说:redis事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。

16.2. Redis事务的三个阶段

16.2.1. 事务开始 MULTI

16.2.2. 命令入队

16.2.3. 事务执行 EXEC

16.3. Redis事务相关命令

16.3.1. Redis事务功能是通过MULTI、EXEC、DISCARD和WATCH 四个原语实现的

16.3.2. Redis会将一个事务中的所有命令序列化,然后按顺序执行。

16.3.3. 错误发生

16.3.3.1. redis 不支持回滚,“Redis 在事务失败时不进行回滚,而是继续执行余下的命令”, 所以 Redis 的内部可以保持简单且快速。

16.3.3.2. 如果在一个事务中的命令出现错误,那么所有的命令都不会执行;

16.3.3.3. 如果在一个事务中出现运行错误,那么正确的命令会被执行。

16.4. Redis事务支持隔离性吗

16.4.1. Redis 是单进程程序,并且它保证在执行事务时,不会对事务进行中断,事务可以运行直到执行完所有事务队列中的命令为止。因此,Redis 的事务是总是带有隔离性的。

16.5. Redis事务保证原子性吗,支持回滚吗

16.5.1. Redis中,单条命令是原子性执行的,但事务不保证原子性,且没有回滚。事务中任意命令执行失败,其余的命令仍会被执行。

16.6. Redis事务其他实现

16.6.1. 基于Lua脚本,Redis可以保证脚本内的命令一次性、按顺序地执行,其同时也不提供事务运行错误的回滚,执行过程中如果部分命令运行错误,剩下的命令还是会继续运行完

16.6.2. 基于中间标记变量,通过另外的标记变量来标识事务是否执行完成,读取数据时先读取该标记变量判断是否事务执行完成。但这样会需要额外写代码实现,比较繁琐

17. 线程模型

17.1. Redis基于Reactor模式开发了网络事件处理器,这个处理器被称为文件事件处理器(file event handler)

17.2. 因为文件事件分派器队列的消费是单线程的,所以Redis才叫单线程模型。

17.3. 组成结构为4部分

17.3.1. 多个套接字

17.3.2. IO多路复用

17.3.2.1. 未命名

17.3.2.2. I/O 多路复用模块

17.3.2.2.1. 未命名

17.3.3. 文件事件分派器

17.3.4. 事件处理器

17.4. 处理方式

17.4.1. 文件事件处理器使用 I/O 多路复用(multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。

17.4.2. 当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。

17.5. 虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与 redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。

18. 类型

18.1. String(字符串)

18.1.1. 概念

18.1.1.1. redis基本类型

18.1.1.2. 一个key对应一个value

18.1.1.3. 二进制安全的

18.1.1.4. 可以包含任何数据

18.1.1.5. 最大能存储512MB

18.2. hash(哈希)

18.2.1. 概念

18.2.1.1. 键值对集合

18.2.1.2. 一个string类型的filed和value的映射表

18.2.1.3. hash适合存储对象

18.3. list(列表)

18.3.1. 概念

18.3.1.1. 字符串列表

18.3.1.2. 插入顺序排序

18.3.1.3. 可以插入一个数据到头部(左),或者插入到尾部(右)

18.3.1.4. 最多可存储 2^32 - 1 元素 (4294967295, 每个列表可存储40多亿)

18.4. set(集合)

18.4.1. 概念

18.4.1.1. string的无序集合

18.4.1.2. 通过哈希实现的,所以插入,删除,查找都是O(1)

18.4.1.3. 最大的成员数为 2^32 - 1(4294967295, 每个集合可存储40多亿个成员)

18.5. zset(sorted set, 有序集合)

18.5.1. 概念

18.5.1.1. 和set一样的,string的集合

18.5.1.2. 每个元素都会关联一个double类型的分数,redis正是通过分数来为集合中的成员进行从小到大的排序

18.5.1.3. zset的成员是唯一的,但分数(score)却可以重复。

19. 发布与订阅

20. 事务

21. 集群

21.1. Redis 主从架构

21.1.1. 未命名

21.1.2. 单机的 redis,能够承载的 QPS 大概就在上万到几万不等。对于缓存来说,一般都是用来支撑读高并发的。因此架构做成主从(master-slave)架构,一主多从,主负责写,并且将数据复制到其它的 slave 节点,从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容,支撑读高并发。

21.1.3. redis replication 的核心机制

21.1.3.1. redis 采用异步方式复制数据到 slave 节点,不过 redis2.8 开始,slave node 会周期性地确认自己每次复制的数据量;

21.1.3.2. 一个 master node 是可以配置多个 slave node 的;

21.1.3.3. slave node 也可以连接其他的 slave node;

21.1.3.4. slave node 做复制的时候,不会 block master node 的正常工作;

21.1.3.5. slave node 在做复制的时候,也不会 block 对自己的查询操作,它会用旧的数据集来提供服务;但是复制完成的时候,需要删除旧数据集,加载新数据集,这个时候就会暂停对外服务了;

21.1.3.6. slave node 主要用来进行横向扩容,做读写分离,扩容的 slave node 可以提高读的吞吐量。

21.1.4. 注意

21.1.4.1. 如果采用了主从架构,那么建议必须开启 master node 的持久化,不建议用 slave node 作为 master node 的数据热备,因为那样的话,如果你关掉 master 的持久化,可能在 master 宕机重启的时候数据是空的,然后可能一经过复制, slave node 的数据也丢了。

21.1.4.2. 另外,master 的各种备份方案,也需要做。万一本地的所有文件丢失了,从备份中挑选一份 rdb 去恢复 master,这样才能确保启动的时候,是有数据的,即使采用了后续讲解的高可用机制,slave node 可以自动接管 master node,但也可能 sentinel 还没检测到 master failure,master node 就自动重启了,还是可能导致上面所有的 slave node 数据被清空。

21.1.5. redis 主从复制的核心原理

21.1.5.1. 未命名

21.1.5.2. 当启动一个 slave node 的时候,它会发送一个 PSYNC 命令给 master node。

21.1.5.3. 如果这是 slave node 初次连接到 master node,那么会触发一次 full resynchronization 全量复制。此时 master 会启动一个后台线程,开始生成一份 RDB 快照文件,

21.1.5.4. 同时还会将从客户端 client 新收到的所有写命令缓存在内存中。RDB 文件生成完毕后, master 会将这个 RDB 发送给 slave,slave 会先写入本地磁盘,然后再从本地磁盘加载到内存中,

21.1.5.5. 接着 master 会将内存中缓存的写命令发送到 slave,slave 也会同步这些数据。

21.1.5.6. slave node 如果跟 master node 有网络故障,断开了连接,会自动重连,连接之后 master node 仅会复制给 slave 部分缺少的数据。

21.2. 基于客户端分配

21.2.1. 未命名

21.2.2. Redis Sharding是Redis Cluster出来之前,业界普遍使用的多Redis实例集群方法。其主要思想是采用哈希算法将Redis数据的key进行散列,通过hash函数,特定的key会映射到特定的Redis节点上。Java redis客户端驱动jedis,支持Redis Sharding功能,即ShardedJedis以及结合缓存池的ShardedJedisPool

21.2.3. 优点

21.2.3.1. 优势在于非常简单,服务端的Redis实例彼此独立,相互无关联,每个Redis实例像单服务器一样运行,非常容易线性扩展,系统的灵活性很强

21.2.4. 缺点

21.2.4.1. 由于sharding处理放到客户端,规模进一步扩大时给运维带来挑战。

21.2.4.2. 客户端sharding不支持动态增删节点。服务端Redis实例群拓扑结构有变化时,每个客户端都需要更新调整。连接不能共享,当应用规模增大时,资源浪费制约优化

21.3. 基于代理服务器分片

21.3.1. 未命名

21.3.2. 客户端发送请求到一个代理组件,代理解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端

21.3.3. 优缺点

21.3.3.1. 透明接入,业务程序不用关心后端Redis实例,切换成本低

21.3.3.2. Proxy 的逻辑和存储的逻辑是隔离的

21.3.3.3. 代理层多了一次转发,性能有所损耗

21.3.4. 开源方案

21.3.4.1. Twtter开源的Twemproxy

21.3.4.2. 豌豆荚开源的Codis

21.4. Redis Cluster(服务端路由查询)

21.4.1. 未命名

21.4.2. Redis Cluster是一种服务端Sharding技术,3.0版本开始正式提供。Redis Cluster并没有使用一致性hash,而是采用slot(槽)的概念,一共分成16384个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行

21.4.3. 方案说明

21.4.3.1. 通过哈希的方式,将数据分片,每个节点均分存储一定哈希槽(哈希值)区间的数据,默认分配了16384 个槽位

21.4.3.2. 每份数据分片会存储在多个互为主从的多节点上

21.4.3.3. 数据写入先写主节点,再同步到从节点(支持配置为阻塞同步)

21.4.3.4. 同一分片多个节点间的数据不保持一致性

21.4.3.5. 读取数据时,当客户端操作的key没有分配在该节点上时,redis会返回转向指令,指向正确的节点

21.4.3.6. 扩容时时需要需要把旧节点的数据迁移一部分到新节点

21.4.4. 节点间的内部通信机制

21.4.4.1. 基本通信原理

21.4.4.2. 集群元数据的维护有两种方式:集中式、Gossip 协议。redis cluster 节点间采用 gossip 协议进行通信。

21.4.5. 分布式寻址算法

21.4.5.1. hash 算法(大量缓存重建)

21.4.5.2. 一致性 hash 算法(自动缓存迁移)+ 虚拟节点(自动负载均衡)

21.4.5.3. redis cluster 的 hash slot 算法

21.4.6. 优点

21.4.6.1. 无中心架构,支持动态扩容,对业务透明

21.4.6.2. 具备Sentinel的监控和自动Failover(故障转移)能力

21.4.6.3. 客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可

21.4.6.4. 高性能,客户端直连redis服务,免去了proxy代理的损耗

21.4.7. 缺点

21.4.7.1. 运维也很复杂,数据迁移需要人工干预

21.4.7.2. 只能使用0号数据库

21.4.7.3. 不支持批量操作(pipeline管道操作)

21.4.7.4. 分布式逻辑和存储模块耦合等

21.5. 哨兵sentinel

21.5.1. 未命名

21.5.2. 功能

21.5.2.1. 集群监控

21.5.2.1.1. 负责监控 redis master 和 slave 进程是否正常工作。

21.5.2.2. 消息通知

21.5.2.2.1. 如果某个 redis 实例有故障,那么哨兵负责发送消息作为报警通知给管理员。

21.5.2.3. 故障转移

21.5.2.3.1. 如果 master node 挂掉了,会自动转移到 slave node 上。

21.5.2.4. 配置中心

21.5.2.4.1. 如果故障转移发生了,通知 client 客户端新的 master 地址。

21.5.3. 哨兵用于实现 redis 集群的高可用,本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。

21.5.3.1. 故障转移时,判断一个 master node 是否宕机了,需要大部分的哨兵都同意才行,涉及到了分布式选举的问题。

21.5.3.2. 即使部分哨兵节点挂掉了,哨兵集群还是能正常工作的,因为如果一个作为高可用机制重要组成部分的故障转移系统本身是单点的,那就很坑爹了。

21.5.4. 核心知识

21.5.4.1. 哨兵至少需要 3 个实例,来保证自己的健壮性。

21.5.4.2. 哨兵 + redis 主从的部署架构,是不保证数据零丢失的,只能保证 redis 集群的高可用性。

21.5.4.3. 对于哨兵 + redis 主从这种复杂的部署架构,尽量在测试环境和生产环境,都进行充足的测试和演练。

22. 缓存异常

22.1. redis穿透

22.1.1. 缓存穿透是指数据库中没有符合条件的数据,缓存服务器中也就没有缓存数据,导致业务系统每次都绕过缓存服务器查询下游的数据库,缓存服务器完全失去了其应用的作用。如果黑客试图发起针对该key的大量访问攻击,数据库将不堪重负,最终可能导致崩溃宕机

22.1.2. 解决方法

22.1.2.1. 从缓存取不到的数据,在数据库中也没有取到,这时也可以将key-value对写为key-null,缓存有效时间可以设置短点,如30秒(设置太长会导致正常情况也没法使用)。这样可以防止攻击用户反复用同一个id暴力攻击

22.1.2.2. 采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的 bitmap 中,一个一定不存在的数据会被这个 bitmap 拦截掉,从而避免了对底层存储系统的查询压力

22.1.2.3. 分级缓存(缓存两份数据,第二份数据生存时间长一点作为备份,第一份数据用于被请求命中,如果第二份数据被命中说明第一份数据已经过期,要去mysql请求数据重新缓存两份数据)

22.1.2.4. 计划任务(假如数据生存时间为30分钟,计划任务就20分钟执行一次更新缓存数据)

22.1.2.5. 接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截;

22.2. redis雪崩

22.2.1. 缓存雪崩是指当大量缓存同时过期或缓存服务宕机,所有请求的都直接访问数据库,造成数据库高负载,影响性能,甚至数据库宕机,它和缓存击穿的区别在于失效key的数量。

22.2.2. 解决方法

22.2.2.1. redis集群,将原来一个人干的工作,分发给多个人干

22.2.2.2. 缓存预热(关闭外网访问,先开启mysql,通过预热脚本将热点数据写入缓存中,启动缓存。开启外网服务)

22.2.2.2.1. 缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!

22.2.2.2.2. 解决方案

22.2.2.3. 数据不要设置相同的生存时间,不然过期时,redis压力会大

22.2.2.4. 并发量不是很高的时候,使用最多的解决方案是加锁排队。

22.3. 缓存击穿

22.3.1. 缓存击穿是指当某一key的缓存过期时大并发量的请求同时访问此key,瞬间击穿缓存服务器直接访问数据库,让数据库处于负载的情况。

22.3.2. 解决办法

22.3.2.1. 分布式锁

23. 缓存降级

23.1. 当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然需要保证服务还是可用的,即使是有损服务。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级。

23.2. 在进行降级之前要对系统进行梳理,看看系统是不是可以丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级;比如可以参考日志级别设置预案:

23.2.1. 一般:比如有些服务偶尔因为网络抖动或者服务正在上线而超时,可以自动降级;

23.2.2. 警告:有些服务在一段时间内成功率有波动(如在95~100%之间),可以自动降级或人工降级,并发送告警;

23.2.3. 错误:比如可用率低于90%,或者数据库连接池被打爆了,或者访问量突然猛增到系统能承受的最大阀值,此时可以根据情况自动降级或者人工降级;

23.2.4. 严重错误:比如因为特殊原因数据错误了,此时需要紧急人工降级。

23.3. 服务降级的目的,是为了防止Redis服务故障,导致数据库跟着一起发生雪崩问题。因此,对于不重要的缓存数据,可以采取服务降级策略,例如一个比较常见的做法就是,Redis出现问题,不去数据库查询,而是直接返回默认值给用户。

24. 介绍

24.1. Redis 是一个使用 C 语言写成的,开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set 有序集合)和hash(哈希类型)。Redis的数据都基于缓存的,所以很快,每秒可以处理超过 10万次读写操作,是已知性能最快的Key-Value DB。Redis也可以实现数据写入磁盘中,保证了数据的安全不丢失,而且Redis的操作是原子性的。