Redis:主从同步
创始人
2024-05-29 15:29:13
0

Redis:主从同步

  • 一. 概述
  • 二. 原理
    • (1) 全量同步
    • (2) 增量同步
    • (3) 优化Redis主从集群
  • 三. 总结

一. 概述

引入
Redis主从集群采用一个Master负责写,多个Slave负责读的方式(读多写少),那么如何让读取数据时多个从节点的数据都一样? ----将Master数据同步到每个Slave,即主从同步;

定义
主从同步,是指将一台Redis服务器的数据,复制到其他的Redis服务器。
数据的复制是单向的,只能由主节点到从节点。
默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。(redis有主从同步,从从同步)。

二. 原理

(1) 全量同步

触发时间:①第一次建立连接 ②增量同步失败

流程

  1. 当slave和master建立连接后,slave发起psync同步请求,带上replid和offset;
    master会根据slave的replid来判断slave是不是第一次同步,ID和自己不一样则是第一次,则将master的replid发给slave,slave记录replid作为自己的id;
  2. ①master执行bgsave,将内存数据写入RDB文件,并将RDB发送给slave;slave会清空本地数据,加载RDB文件到【内存】中;
    ②当master异步写RDB文件期间,会记录主进程的操作到repl_baklog缓冲区中;
    (此时RDB文件+缓冲区的命令即=master上的完整数据)
  3. master将缓冲区的新命令发送给slave,slave拿到命令后会执行命令,保证slave和master的数据一致;
    后序新的命令都写到缓冲区,再发送到slave,以次实现主从同步;
    在这里插入图片描述

Replication ID
简称replid,是数据集的标记,id一致则说明是同一数据集。每个master都有唯一一个replid,slave则会继承master节点的replid;

offset偏移量
随着master记录在【repl_baklog缓冲区】中的数据增多而逐渐增大。 slave完成同步时也会记录当前的offset;
如果slave的offset小于master的offset,说明slave落后于master,需要更新;(slave的offset<=master的offset)

所以slave做同步时,必须向master声明自己的Replication ID和offset,master就可以通过ID来判断slave是不是从当前master同步的;以及从offset判断数据同步的进度;

如何判断slave是不是第一次做数据同步?
Replication ID不一样则是slave第一次请求同步!
而后slave的Replication ID就变成了当前master的Replication ID;master根据slave的 offset ?大小来做增量同步;

(2) 增量同步

触发时间:在slave重启过程中,master会持续接收数据,则slave数据会落后,此时就是做增量同步;

流程

  1. slave重启,重启完后发送给psync请求同步并带上replid和offset,
    由于不是第一次发起请求,此时slave的replid和master一致,master不用再给slave发送id,而是回复continue;
  2. master不再RDB,因为slave已经拷贝过了,slave宕机期间丢失的部分记录在repl_baklog缓冲区,而slave的offest就是之前读取到的位置,所以将缓存中slave的offset往后的命令发往slave;
  3. slave执行master传过来的命令,就可以补上错过的命令,此时数据保持了一致;
    在这里插入图片描述

repl_baklog缓冲区
本质是一个成环的数组,当数组满了(slave落后master的数据超过了缓冲区容量),则会用master新命令覆盖旧的命令;
只要slave和master的数据差距在一个环内,就可以将slave落后于master的部分找到并发给slave;
当slave和master差距超过了一个环,则无法做增量同步了;
在这里插入图片描述

什么时候增量同步失败?
缓冲区是一个数组,大小有限,当slave断开时间太长,和master的差距超过了缓冲区,导致尚未备份的数据被新命令覆盖,则此时无法基于缓冲区做增量同步,只能做全量同步了;

(3) 优化Redis主从集群

提高全量同步的性能:

  1. 在master中配置无磁盘复制,避免全量同步时的磁盘IO;不使用RDB文件,即内存数据的IO流直接写到网络中,而不是先写到RDB磁盘文件,减少了一次拷贝到磁盘的过程,提高性能;(网络比较快时)
  2. 控制Redis单节点内存上限,这样就能控制RDB文件的大小,从而减少磁盘IO;

减少全量同步:

  1. 提高repl_baklog缓冲区的大小,这样slave落后于master的数据就多一点,一定程度避免由于由于增量同步失效导致的全量同步;

其他:

  1. 主从链式结构,限制一个master上的slave节点数量,减轻master的压力;
    在这里插入图片描述

三. 总结

1.全量同步与增量同步的区别?
全量同步master需要将内存数据写入 RDB 文件,再将RDB文件传给slave,后序命令记录在缓冲区;
增量同步时master不需要写RDB文件,只需要将缓冲区中slave的offset之后的命令传给slave;

2.什么时候执行全量同步?
①slave第一次连接master时;
②slave宕机时间太长,导致salve的offset在缓冲区被新的命令覆盖;

3.什么时候执行增量同步?
slave重启时;

相关内容

热门资讯

美国得州洪水死亡人数升至80人... 【#美国得州洪水死亡人数升至80人# 至少41人失踪】新华社休斯敦7月6日电(记者徐剑梅)美国得克萨...
破解博物馆预约难|上海博物馆的... 暑期来临,“博物馆热”持续升温,一些热门博物馆一票难求、无法预约的问题进一步凸显。澎湃新闻近日走访了...
南卫股份质押触发鹰眼“风险”评... 截止2025年7月5日,南卫股份(维权)整体质押股份为1.05亿股,整体质押占总股本之比为36.24...
盛业(06069)与斯坦德机器... 盛业(06069)公布,集团与全球领先的工业智能机器人斯坦德机器人(无锡)有限公司(斯坦德)近日达成...
山西发布地质灾害和暴雨预警 转自:山西发布7月6日,山西相继发布地质灾害气象风险预警和暴雨蓝色预警。7月6日17时,山西省自然资...
中国气象局批复曲靖开展人工影响... 7月2日,中国气象局批复云南省曲靖市开展人工影响天气赋能特色产业社会服务现代化试点。通过试点工作,将...
有3次犯罪前科的他,是如何当上... 新京报记者 韩福涛 张建斌 制作 罗伟伟山西省洪洞县财政局原局长付雪海的“离奇履历”,引发关注。刑事...
让防非知识走进群众心中 转自:中国银行保险报网□本报记者 胡杨最近一个月,邮储银行四川兴文县支行营业网点热闹非常——防范非法...
【办实事 解民忧】新平县拓宽就...   近年来,新平彝族傣族自治县以产业发展为引擎、以优化服务为抓手、以提技强能为支撑,多元路径拓宽就业...
“稻田郎中”用科技“把脉”黑土...   于洪洋(左)查看稻叶状态。  ■钱玺勇 魏正阳 本报记者 张大星文/摄  盛夏的清晨,延寿县中和...