网站网站建设哪家便宜,浙江网站建设售后保障,开什么网站暴利,设计师门户网站源码1. 面试题
1.1 1~2亿条数据需要缓存#xff0c;请问如何设计这个存储案例 单机单台不可能实现#xff0c;肯定是用分布式存储#xff0c;用redis如何落地#xff1f; 1.2 上述问题工程案例场景设计类题目#xff0c;解决方案
1.2.1 哈希取余分区 2亿条记录就是2亿个k,v请问如何设计这个存储案例 单机单台不可能实现肯定是用分布式存储用redis如何落地 1.2 上述问题工程案例场景设计类题目解决方案
1.2.1 哈希取余分区 2亿条记录就是2亿个k,v我们单机不行必须要分布式多机假设有3台机器构成一个集群用户每次读写操作都是根据公式 hash(key) % N个机器台数计算出哈希值用来决定数据映射到哪一个节点上。 优点 简单粗暴直接有效只需要预估好数据规划好节点例如3台、8台、10台就能保证一段时间的数据支撑。使用Hash算法让固定的一部分请求落到同一台服务器上这样每台服务器固定处理一部分请求并维护这些请求的信息起到负载均衡分而治之的作用。 缺点 原来规划好的节点进行扩容或者缩容就比较麻烦了额不管扩缩每次数据变动导致节点有变动映射关系需要重新进行计算在服务器个数固定不变时没有问题如果需要弹性扩容或故障停机的情况下原来的取模公式就会发生变化Hash(key)/3会变成Hash(key) /?。此时地址经过取余运算的结果将发生很大变化根据公式获取的服务器也会变得不可控。 某个redis机器宕机了由于台数数量变化会导致hash取余全部数据重新洗牌。 1.2.2 一致性哈希算法分区 1. 是什么 一致性Hash算法背景 一致性哈希算法在1997年由麻省理工学院中提出的设计目标是为了解决 分布式缓存数据变动和映射问题某个机器宕机了分母数量改变了自然取余数不OK了 2. 能干啥 提出一致性hash解决方案目的是当服务器个数发生变动时尽量减少影响客户端到服务器的映射关系 3. 3大步骤 3.1 算法构建一致哈希环 一致性哈希环 一致性哈希算法必然有个hash函数并按照算法产生hash值这个算法的所有可能哈希值会构成一个全量集这个集合可以成为一个hash空间[0,2^32-1]这个是一个线性空间但是在算法中我们通过适当的逻辑控制将它首尾相连(0 2^32),这样让它逻辑上形成了一个环形空间。 它也是按照使用取模的方法前面笔记介绍的节点取模法是对节点服务器的数量进行取模。而一致性Hash算法是对2^32取模简单来说一致性Hash算法将整个哈希值空间组织成一个虚拟的圆环如假设某哈希函数H的值空间为0-2^32-1即哈希值是一个32位无符号整形整个哈希环如下图整个空间按顺时针方向组织圆环的正上方的点代表00点右侧的第一个点代表1以此类推2、3、4、……直到2^32-1也就是说0点左侧的第一个点代表2^32-1 0和2^32-1在零点中方向重合我们把这个由2^32个点组成的圆环称为Hash环。 3.2 服务器IP节点映射 节点映射 将集群中各个IP节点映射到环上的某一个位置。 将各个服务器使用Hash进行一个哈希具体可以选择服务器的IP或主机名作为关键字进行哈希这样每台机器就能确定其在哈希环上的位置。假如4个节点NodeA、B、C、D经过IP地址的哈希函数计算(hash(ip))使用IP地址哈希后在环空间的位置如下 3.3 key落到服务器的落键规则 当我们需要存储一个kv键值对时首先计算key的hash值hash(key)将这个key使用相同的函数Hash计算出哈希值并确定此数据在环上的位置从此位置沿环顺时针“行走”第一台遇到的服务器就是其应该定位到的服务器并将该键值对存储在该节点上。 如我们有Object A、Object B、Object C、Object D四个数据对象经过哈希计算后在环空间上的位置如下根据一致性Hash算法数据A会被定为到Node A上B被定为到Node B上C被定为到Node C上D被定为到Node D上。 4. 优点 4.1 一致性哈希算法的容错性 容错性 假设Node C宕机可以看到此时对象A、B、D不会受到影响只有C对象被重定位到Node D。一般的在一致性Hash算法中如果一台服务器不可用则受影响的数据仅仅是此服务器到其环空间中前一台服务器即沿着逆时针方向行走遇到的第一台服务器之间数据其它不会受到影响。简单说就是C挂了受到影响的只是B、C之间的数据并且这些数据会转移到D进行存储。 4.2 一致性哈希算法的扩展性 扩展性 数据量增加了需要增加一台节点NodeXX的位置在A和B之间那收到影响的也就是A到X之间的数据重新把A到X的数据录入到X上即可 不会导致hash取余全部数据重新洗牌。 5. 缺点 Hash环的数据倾斜问题 一致性Hash算法在服务节点太少时容易因为节点分布不均匀而造成数据倾斜被缓存的对象大部分集中缓存在某一台服务器上问题 例如系统中只有两台服务器 6. 总结 为了在节点数目发生改变时尽可能少的迁移数据 将所有的存储节点排列在收尾相接的Hash环上每个key在计算Hash后会顺时针找到临近的存储节点存放。 而当有节点加入或退出时仅影响该节点在Hash环上顺时针相邻的后续节点。 优点 加入和删除节点只影响哈希环中顺时针方向的相邻的节点对其他节点无影响。 缺点 数据的分布和节点的位置有关因为这些节点不是均匀的分布在哈希环上的所以数据在进行存储时达不到均匀分布的效果。 1.2.3 哈希槽分区 1. 是什么 1 为什么出现 哈希槽实质就是一个数组数组[0,2^14 -1]形成hash slot空间。 2 能干什么 解决均匀分配的问题在数据和节点之间又加入了一层把这层称为哈希槽slot用于管理数据和节点之间的关系现在就相当于节点上放的是槽槽里放的是数据。 槽解决的是粒度问题相当于把粒度变大了这样便于数据移动。 哈希解决的是映射问题使用key的哈希值来计算所在的槽便于数据分配。 3 多少个hash槽 一个集群只能有16384个槽编号0-163830-2^14-1。这些槽会分配给集群中的所有主节点分配策略没有要求。可以指定哪些编号的槽分配给哪个主节点。集群会记录节点和槽的对应关系。解决了节点和槽的关系后接下来就需要对key求哈希值然后对16384取余余数是几key就落入对应的槽里。slot CRC16(key) % 16384。以槽为单位移动数据因为槽的数目是固定的处理起来比较容易这样数据移动问题就解决了。 2. 哈希槽计算Redis 集群中内置了 16384 个哈希槽redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时redis 先对 key 使用 crc16 算法算出一个结果然后把结果对 16384 求余数这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽也就是映射到某个节点上。如下代码key之A 、B在Node2 key之C落在Node3上 2. 开始部署
2.1 3主3从redis集群配置
2.1.1 构建6个redis容器 docker run -d --name redis-node-1 --net host --privilegedtrue -v /data/redis/share/redis-node-1:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6381 docker run -d --name redis-node-2 --net host --privilegedtrue -v /data/redis/share/redis-node-2:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6382 docker run -d --name redis-node-3 --net host --privilegedtrue -v /data/redis/share/redis-node-3:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6383 docker run -d --name redis-node-4 --net host --privilegedtrue -v /data/redis/share/redis-node-4:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6384 docker run -d --name redis-node-5 --net host --privilegedtrue -v /data/redis/share/redis-node-5:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6385 docker run -d --name redis-node-6 --net host --privilegedtrue -v /data/redis/share/redis-node-6:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6386 参数解析 docker run 启动容器 --name redis-node-1 容器命名 --net host 使用宿主机ip和端口默认 --privilegedtrue 获取宿主机root用户权限 -v 容器卷目录映射 redis:6.0.8 镜像 --cluster-enabled 开启redis集群 --appendonly yes 开启持久化 --port 6386 redis端口号 2.1.2 进入容器redis-node-1并为6台机器构建集群关系 1. 进入容器 docker exec -it redis-node-1 /bin/bash 2. 构建主从关系 //注意进入docker容器后才能执行一下命令且注意自己的真实IP地址 redis-cli --cluster create 192.168.111.147:6381 192.168.111.147:6382 192.168.111.147:6383 192.168.111.147:6384 192.168.111.147:6385 192.168.111.147:6386 --cluster-replicas 1 --cluster-replicas 1 表示为每个master创建一个slave节点 2.1.3 进入6381容器查看集群状态 2.2 主从容错切换迁移案例
2.2.1 数据读写存储 1. 启动6机构成的集群并通过exec进入 2. 对6381新增两个key 3. 防止路由失效参数-c并新增两个key -c 进入集群 4. 查看集群信息 redis-cli --cluster check 192.168.111.147:6381 2.2.2 容错切换迁移 1. 主6381和从机切换先停止主机6381 6381 主机停了对应的真实从机上位 6381 作为1号主机分配的从机以实际情况为准具体是几号机器就是几号 2. 再查看集群信息 6381宕机了6385上位成为了新的master。 备注本次脑图笔记6381为主下面挂从6385。 每次案例下面挂的从机以实际情况为准具体是几号机器就是几号 3. 先还原之前的三主三从 中间需要等待一会儿docker集群重新响应。 4. 查看集群状态 2.3 主从扩容案例
2.3.1 新建63876388两个节点新建后启动查看是否8个节点 docker run -d --name redis-node-7 --net host --privilegedtrue -v /data/redis/share/redis-node-7:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6387 docker run -d --name redis-node-8 --net host --privilegedtrue -v /data/redis/share/redis-node-8:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6388 2.3.2 进入6387容器实例内部 docker exec it redis-node-7 /bin/bash 2.3.3 将新增的6387节点作为master节点加入原集群 将新增的6387作为master节点加入集群 redis-cli --cluster add-node 自己实际IP地址: 6387 自己实际IP地址: 6381 6387 就是将要作为master新增节点 6381 就是原来集群节点里面的领路人相当于6387拜拜6381的码头从而找到组织加入集群 2.3.4 检查集群情况第一次 redis-cli --cluster check 真实ip地址:6381 2.3.5 从新分派槽号 重新分派槽号 命令:redis-cli --cluster reshard IP地址:端口号 redis-cli --cluster reshard 192.168.111.147:6381 2.3.6 检查集群情况第二次 redis-cli --cluster check 真实ip地址:6381 为什么6387是3个新的区间以前的还是连续 重新分配成本太高所以前3家各自匀出来一部分从6381/6382/6383三个旧节点分别匀出1364个坑位给新节点6387 2.3.7 为主节点6387分配从节点6388 命令redis-cli --cluster add-node ip:新slave端口 ip:新master端口 --cluster-slave --cluster-master-id 新主机节点ID redis-cli --cluster add-node 192.168.111.147:6388 192.168.111.147:6387 --cluster-slave --cluster-master-id e4781f644d4a4e4d4b4d107157b9ba8144631451-------这个是6387的编号按照自己实际情况 2.3.8 检查集群情况第三次 redis-cli --cluster check 192.168.111.147:6382 2.4 主从缩容案例
2.4.1 检查集群情况获得6388的节点ID redis-cli --cluster check 192.168.111.147:6382 2.4.2 从集群将4号从节点6388删除 命令redis-cli --cluster del-node ip:从机端口 从机6388节点ID redis-cli --cluster del-node 192.168.111.147:6388 5d149074b7e57b802287d1797a874ed7a1a284a8 检查节点数 redis-cli --cluster check 192.168.111.147:6382 2.4.3 将6387的槽号清空重新分配本例将清出来的槽号都给6381 redis-cli --cluster reshard 192.168.111.147:6381 2.4.4 检查集群情况第二次 redis-cli --cluster check 192.168.111.147:6381 4096个槽位都指给6381它变成了8192个槽位相当于全部都给6381了不然要输入3次一锅端 2.4.5 将6387删除 命令redis-cli --cluster del-node ip:端口 6387节点ID redis-cli --cluster del-node 192.168.111.147:6387 e4781f644d4a4e4d4b4d107157b9ba8144631451 2.4.6 检查集群情况第三次 redis-cli --cluster check 192.168.111.147:6381