Redis Sorted Set 底层实现原理深度解读与排行榜实战-阿里云开发者社区

我是码哥，可以叫我靓仔。

今天给大家简单聊聊 Redis Sorted Set 数据类型底层的实现原理和游戏排行榜实战。特别简单，一点也不深入，也就 7 张图，粉丝可放心食用，哈哈哈哈哈~~~~。

1. 是什么

Sorted Sets 与 Sets 类似，是一种集合类型，集合中不会出现重复的数据（member）。区别在于 Sorted Sets 元素由两部分组成，分别是 member 和 score。

member 会关联一个 double 类型的分数（score），sorted sets 默认会根据这个 score 对 member 进行从小到大的排序，如果 member 关联的分数 score 相同，则按照字符串的字典顺序排序。

这是规则，得记下来。

2-24

常见的使用场景：

排行榜，比如维护大型在线游戏中根据分数排名的 Top 10 有序列表。
速率限流器，根据排序集合构建滑动窗口速率限制器。
延迟队列，score 存储过期时间，从小到大排序，最靠前的就是最先到期的数据。

2. 修炼心法

Sorted Sets 底层有两种方式来存储数据。

在 7.0 版本之前是 ziplist，之后被 listpack 代替，使用 listpack 存储的条件是集合元素个数小于等于 zset-max-listpack-entries 配置值（默认 128），且 member 占用字节大小小于 zset-max-listpack-value 配置值（默认 64）时使用 listpack 存储，member 和 score 紧凑排列作为 listpack 的一个元素进行存储。
不满足上述条件，使用 skiplist + dict（散列表）组合方式存储，数据会插入 skiplist 的同时也会向 dict（散列表）中插入数据，是一种用空间换时间的思路。散列表的 key 存放的是元素的 member，value 存储的是 member 关联的 score。

❝
MySQL：“也就是说 listpack 适用于元素个数不多且元素内容不大的场景。”

对，使用 listpack 存储的目的就是节省内存。

Sorted Sets 能支持高效的范围查询，正是因为采用了 skiplist 跳表，比如 ZRANGE 命令时时间复杂度为 O(log(n)) + m， n 是 member 个数，m 是返回结果数。需要注意的是，你应该避免命令会返回大量结果。

而使用 dict 的原因是实现 O(1) 时间复杂度查询单个元素。比如 ZSCORE key member 指令。

总结来说，Sorted Sets 在插入或者更新的时候，会同时往 skiplist 和散列表中插入或者更新对应的数据。保证 skiplist 和散列表的数据一致。

❝
MySQL：“这个方式很巧妙呀，skiplist 用来根据 score 进行范范围查询或者单个查询，dict 散列表则用于实现 O(1) 时间复杂度查根据数据查询对应 score，满足高效范围查询和单元素查询。“

sorted sets 实现源码主要在以下两个文件中。

结构定义在 server.h。
功能实现在 t_zset.c。

先看 skiplist（跳表） + dict（散列表）数据结构如何存储数据。

skiplist + dict

❝
MySQL：“说说什么是跳表吧”

实质就是一种可以进行二分查找的有序链表。跳表在原有的有序链表上面增加了多级索引，通过索引来实现快速查找。

不仅能提高搜索性能，还可以提高插入和删除操作的性能。它在性能上和红黑树、AVL 树不相上下，但是跳表的原理和实现比红黑树简单。

回顾链表，它的痛点就是查询很慢，O(n) 时间复杂度，作为唯快不破的 Redis 是不能忍的。

图2-25

如果在有序链表的每相邻两个节点增加一个“跳跃”指向下下个节点的指针，那么查找的时间复杂度就可以降低为原来的一半，如下图所示。

图 2-26

这样 level 0 和 level 1 分别形成两个链表，level 1 层的链表节点个数只有 2 个（6、26）。

跳表节点查找

查找数据总是从最高层开始比较，如果节点保存的值比待查数据小，跳表就继续访问该层的下一个节点；

如果碰到比待查数据值大的节点时，那就跳到当前节点的下一层的链表继续查找。

比如现在想查找 17，查找的路径如下图红色指向的方向进行。

从 level 1 开始，17 与 6 比较，值大于节点，继续与下一个节点比较。
与 26 比较，17 < 26，回到原节点，跳到当前节点的 level 0 层链表，与下一个节点比较，找到目标 17。

skiplist 正是受这种多层链表的想法启发设计出来的。按照上面的生成链表方式，每次往上增加一层链表的节点个数是下面一层的一半，这样的查找过程就类似于一个二分查找，时间复杂度为 O(log n)。

但是，这种方式在插入数据的时候有很大的问题，每次新增一个节点，就会打乱相邻的两层链表节点个数 2:1 的关系，如果要维持这个关系，就需要对链表调整，事件复杂度是 O(n)。

为了避免这个问题，它不要求上下相邻的两层链表节点个数有严格的比例关系，而是为每个节点随机出一个层数，这样插入节点只需要修改前后指针。

如下图是一个有 4 层链表的 skiplist，假设我们要查找 26，下图给出了查找经历过的路径。

对经典跳表有个直观的映像后，来看看 Redis 中 skiplist 的实现细节，Sorted Sets 数据结构定义如下。

typedef struct zset {
    dict *dict;
    zskiplist *zsl;
} zset;

zset 结构体中有两个变量，分别是散列表 dict 和跳表 zskiplist。dict 在前文已经讲过，重点看 zskiplist 。

typedef struct zskiplist {
    // 头、尾指针便于双向遍历
    struct zskiplistNode *header, *tail;
    // 当前跳表包含元素个数
    unsigned long length;
    // 表内节点的最大层级数
    int level;
} zskiplist;

zskiplistNode *header, *tail，两个头、尾指针，用于实现双向遍历。
length，链表包含的节点总数。需要注意的是，新创建的 zskiplist 会生成一个空的头指针，它不包含在 length 计数中。
level，表示 skiplist 中，所有节点层数的最大值。

接着继续看 skiplist 中每个节点的定义 zskiplistNode 结构体。

typedef struct zskiplistNode {
    sds ele;
    double score;
    struct zskiplistNode *backward;
    struct zskiplistLevel {
        struct zskiplistNode *forward;
        unsigned long span;
    } level[];
} zskiplistNode;

Sorted Set 既要保存元素，又要保存元素的权重。所以对应了 sds 类型的 ele 存储实际内容， double 类型 score 用于保存权重。
*backward，后退指针，指向该节点的上一个节点，便于从尾节点实现倒序查找。注意，每个节点只有一个后向指针，只有 level 0 层链表是一个双向链表。
level[]，是一个zskiplistLevel结构体类型的柔性数组。跳表是一个多层的有序链表，每一层的节点也是由指针链接起来的，所以数组中每个元素代表着 skiplist 的一层。

*forward，该层的前进指针。
span，跨度，用来记录节点在该层的 *forward 指针到指针指向的下一个节点之间跨越了 level0 层的节点数。span 用于计算元素排名(rank)，例如查找 ele = 肖菜鸡、score = 17 的排名，只需要把查找路径经过的节点的 span 相加即可，如下图的红色路径的 span 累加，rank = (2 + 2) - 1 = 3（减 1 是因为 rank 从 0 开始）。如果要计算从大到小的排名，只需要用 skiplist 长度减去查找路径上的 span 累加值，即 4 - (2 + 2) = 0。

下图展示了 Redis 中一个 skiplsit 的可能结构。

listpack

❝
MySQL：“根据 zset 结构体定义可知，分别使用了 dict、zskiplist 两种数据结构，listpack 影子都见不着呀。“

这个问题问得好，使用 listpack 存储的细节在源码文件t_zset.c 中的zaddGenericCommand函数中体现，部分代码如下，内部会判断是否使用 listpack 来存储。·

void zaddGenericCommand(client *c, int flags) {
    // 省略部分代码
    // key 不存在则创建 sorted set
    zobj = lookupKeyWrite(c->db,key);
    if (checkType(c,zobj,OBJ_ZSET)) goto cleanup;
    if (zobj == NULL) {
        if (xx) goto reply_to_client;
      // 当 zset_max_listpack_entries == 0 或者
        // 元素字节大小大于 zset_max_listpack_value 配置
        // 则使用 skiplist + dict 存储，否则使用 listpack。
        if (server.zset_max_listpack_entries == 0 ||
            server.zset_max_listpack_value < sdslen(c->argv[scoreidx+1]->ptr))
        {
            zobj = createZsetObject();
        } else {
            zobj = createZsetListpackObject();
        }
        dbAdd(c->db,key,zobj);
    }
   // 省略部分代码
}

我们知道，listpack 是一块由多个数据项组成的连续内存。而 sorted set 每一项元素是由 member 和 score 两部分组成。

采用 listpack 存储插入一个（member、score）数据对的时候，每个 member/score 数据对紧凑排列存储。

listpack 最大的优势就是节省内存，查找元素的话只能按顺序查找，时间复杂度是 O(n)。正是如此，在少量数据的情况下，才能做到既能节省内存，又不会影响性能。每一步查找前进两个数据项，也就是跨越一个 member/score 数据对。

3. 出招实战：排行榜

很多地方都会用到排行榜功能，比如微博热榜、知乎热榜、电影排行榜、游戏战力排行等。

以游戏排行榜为例，我教你使用 Sorted Set 实现一个实时游戏高分排行榜。

玩家的得分越高，排行越靠前，如果分数相同则先达到该分数的玩家排在前面，游戏排行榜的提供的功能如下。

按照分数从大到小排名，查询前 N 位玩家信息。
新注册玩家，需要把新玩家信息添加到排行榜中。
能查看某个玩家的排名和分数。

Sorted Set 每个元素有两部分组成（member + score），可利用 score 进行排序，正好满足我们的场景。用 score 保存玩家的游戏得分，member 保存玩家 ID。

❝
王架构：“分数相同，先达到该分数的排在前面，也就是说，游戏分数相同的情况下，时间戳越小，排名越靠前，咋实现？”

这个问题问得好，既然时间也会影响排名，那就把时间戳考虑到 score 中。

❝
王架构：“有问题，分数越大，排名越靠前；而时间戳越小，排名越靠前。两个规则相反的，怎么结合在一起。”

好问题，这时候你可以指定一个非常大的时间作为基准时间，比如这个时间就是你当年信誓旦旦的对那个女孩说：“如果非要在我们的爱上加一个期限，我是希望……一万年”，也就是 2023 + 10000 年。

执行时间排序值 =（基准时间 - 玩家达到分数时间）/ 基准时间公式计算，得到的结果值一定小于 1，正好可作为 score 小数部分。越早达到，这个值就越大，满足排序。

最后score = 玩家游戏分 + ((基准时间 - 玩家获得某分数时间) / 基准时间)，就实现了分数相同，先达到该分数的排在前面的功能。

代码逻辑如下所示。

private double calcScore(int playerScore, long playerScoreTime) {
  return playerScore + (BASE_TIME - playerScoreTime) * 1.0 / BASE_TIME;
}

playerScore，玩家游戏分。
playerScoreTime，玩家获得分数的时间秒数。
BASE_TIME，基准时间的时间秒数。

想要获取真正玩家游戏分数的时候，取整数位即可。接下来我来演示一下如何使用 zset 的指令实现排行榜。

假设 BASE_TIME 为 12023 年 1 月 1 日 0 时 0 分 0 秒时间戳秒数 = 317242022400。

更新排行榜

使用指令 ZADD key score member [score member...] 用于新增或者更新玩家排行榜。如下指令表示新增了 4 个玩家信息到排行榜。leaderboard:339 作为 key，表示区服 339 战力排行榜，玩家 2 和玩家 3 的战力都是 500 分，玩家 3 比玩家 2 先到达 500 战力。

redis> ZADD leaderboard:339 2500.994707057989 player:1
(integer) 1
redis> ZADD leaderboard:339 500.99470705798905 player:2
(integer) 1
redis> ZADD leaderboard:339 500.9947097814618 player:3
(integer) 1
redis> ZADD leaderboard:339 987770.994707058 player:4
(integer) 1

假设某天玩家 4 的女朋友不在家，他就天天玩游戏，战力提升到 1987770。执行如下指令，player:4 的 score 机会更新为 1987770.994707055。

ZADD leaderboard:339 1987770.994707055 player:4

获取 Top 3 玩家排行信息

ZRANGE 命令可以按照排名、score、字典排序进行范围查询。语法使用规则

ZRANGE key start stop [BYSCORE | BYLEX] [REV] [LIMIT offset count] [WITHSCORES]

默认排序是按照 score 由低到高，分数相同则根据 member 字典排序。

REV，可选参数，按照 score 由高到低逆序排序。
LIMIT offset count 可选参数，类似于 MySQL 的使用，需要注意的是， count 为负数则返回所有符合数据。
WITHSCORES 可选参数，返回 score 和 member，返回的格式是 member 1,score 1,…memberN,scoreN。

你可以使用 REV 来实现逆序，WITHSCORES返回 member 和 score。如下指令的一是是从 key 为 leaderboard:339 的 Sorted Set 中按照 score 逆序排序获取 3 个元素。

> ZRANGE leaderboard:339 0 2 REV WITHSCORES
player:4
1987770.9947070549
player:1
2500.9947070579892
player:3
500.99470978146178

获取指定玩家排名

我提供了 ZREVRANK指令，用于返回指定 member 的排名，需要注意的是，排名从 0 开始。如下指令查找 player:4 的排名，0 表示第一。

> ZREVRANK leaderboard:339 player:4
0

Redis Sorted Set 底层实现原理深度解读与排行榜实战

我是码哥，可以叫我靓仔。

今天给大家简单聊聊 Redis Sorted Set 数据类型底层的实现原理和游戏排行榜实战。特别简单，一点也不深入，也就 7 张图，粉丝可放心食用，哈哈哈哈哈~~~~。

1. 是什么

2. 修炼心法

skiplist + dict

listpack

3. 出招实战：排行榜

更新排行榜

获取 Top 3 玩家排行信息

获取指定玩家排名

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Redis Sorted Set 底层实现原理深度解读与排行榜实战

我是码哥，可以叫我靓仔。

今天给大家简单聊聊 Redis Sorted Set 数据类型底层的实现原理和游戏排行榜实战。特别简单，一点也不深入，也就 7 张图，粉丝可放心食用，哈哈哈哈哈~~~~。

1. 是什么

2. 修炼心法

skiplist + dict

listpack

3. 出招实战：排行榜

更新排行榜

获取 Top 3 玩家排行信息

获取指定玩家排名

热门文章

最新文章

相关课程

相关电子书