代码编织梦想

**面试题:**1-2 亿条数据需要缓存,请问如何设计这个存储案例:

**回答:**单机单台 100%不可能,肯定是分布式存储,用 redis 如何落地?(一般业界有 3种 解决方案)

方案一、哈希取余分区

9f1a41e49a0a971aa1afa575e4e7f5fe.png

2亿条记录就是 2 亿个 k,v,我们单机不行必须要分 布式多机,假设有 3 台机器构成一个集群,用户每次读写操作都是根据公式:hash(key) % N 个机器台数,计算出哈希值,用来决定数据映射到哪一个节点上。

【优点】:

简单粗暴,直接有效,只需要预估好数据规划好 节点,例如 3 台、8 台、10 台,就能保证一段时间 的数据支撑。使用 Hash 算法让固定的一部分请求落到同一台服务器上,这样每台服务器固定处理一部分请求(并维护这些请求的信息),起到负载均衡+分而治之的作用。

【缺点】:

原来规划好的节点,进行扩容或者缩容就比较麻 烦了额,不管扩缩,每次数据变动导致节点有变 动,映射关系需要重新进行计算,在服务器个数固 定不变时没有问题,如果需要弹性扩容或故障停机 的情况下,原来的取模公式就会发生变化:

Hash(key)/3 会变成 Hash(key) /?。此时地址经过取余运算的结果将发生很大变化,根据公式获取的服 务器也会变得不可控。 某个 redis 机器宕机了,由于台数数量变化,会导致 hash 取余全部数据重新洗牌。

方案二、一致性哈希算法分区

是什么】:一致性哈希算法在 1997 年由麻省理工学院中提出的,设计目标是为了解决 分布式缓存数据变动和映射问题,某个机器宕机 了,分母数量改变了,自然取余数不 OK 了。

【能干嘛】:提出一致性 Hash 解决方案。 目的是当服务器个数发生变动时, 尽量减少影响客户端到服务器的映射关系

【步骤】:

  • 算法构建一致性哈希环

  • 服务器 IP 节点映射

  • key 落到服务器的落键规则

【优点】:

  • 容错性

假设 Node C 宕机,可以看到此时对象 A、B、D 不 会受到影响,只有 C 对象被重定位到 Node D。一般 的,在一致性 Hash 算法中,如果一台服务器不可 用,则受影响的数据仅仅是此服务器到其环空间中 前一台服务器(即沿着逆时针方向行走遇到的第一 台服务器)之间数据,其它不会受到影响。简单 说,就是 C 挂了,受到影响的只是 B、C 之间的数 据,并且这些数据会转移到 D 进行存储。

  • 扩展性

数据量增加了,需要增加一台节点 NodeX,X 的位 置在 A 和 B 之间,那收到影响的也就是 A 到 X 之间 的数据,重新把 A 到 X 的数据录入到 X 上即可, 不会导致 hash 取余全部数据重新洗牌。

**【缺点】:**数据倾斜

一致性 Hash 算法在服务节点太少时,容易因为节点 分布不均匀而造成数据倾斜(被缓存的对象大部分 集中缓存在某一台服务器上)问题, 例如系统中只有两台服务器:

ea41247f091083d4edf7133e15745c83.png

【小总结】

为了在节点数目发生改变时尽可能少的 迁移数据,将所有的存储节点排列在收尾相接的Hash 环上,每个 key 在计算 Hash 后会 顺时针找到临近的存储节点存放。 而当有节点加入或退出时仅影响该节点在Hash环上顺时针相邻的后续节点。

优点: 加入和删除节点只影响哈希环中顺时针 方向的相邻的节点,对其他节点无影响。

缺点: 数据的分布和节点的位置有关,因为这些节点不是均匀的分布在哈希环上的, 所以数据在进行存储时达不到均匀分布的效果。

方案三、哈希槽分区

1 为什么出现哈希槽实质就是一个数组,数组[0,2^14 -1]形成hash slot空间。解决一**致性哈希算法分区的倾斜问题****。**2 能干什么解决均匀分配的问题,在数据和节点之间又加入了一层,把这层称为哈希槽(slot),用于管理数据和节点之间的关系,现在就相当于节点上放的是槽,槽里放的是数据。

7bd559ba67b95cce3c8e79ff27827ad2.png

槽解决的是粒度问题,相当于把粒度变大了,这样便于数据移动。哈希解决的是映射问题,使用key的哈希值来计算所在的槽,便于数据分配。3 多少个hash槽一个集群只能有16384个槽,编号0-16383(0-2^14-1)。这些槽会分配给集群中的所有主节点,分配策略没有要求。可以指定哪些编号的槽分配给哪个主节点。集群会记录节点和槽的对应关系。解决了节点和槽的关系后,接下来就需要对key求哈希值,然后对16384取余,余数是几key就落入对应的槽里。slot = CRC16(key) % 16384。以槽为单位移动数据,因为槽的数目是固定的,处理起来比较容易,这样数据移动问题就解决了。

Redis 集群中内置了 16384 个哈希槽,redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时,redis 先对 key 使用 crc16 算法算出一个结果,然后把结果对 16384 求余数,这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽,也就是映射到某个节点上。如下代码,key之A 、B在Node2, key之C落在Node3上。

d3c6bc758d7ec0599fcb632df55d47a7.png

3b61391616073c9621d09247dec70d63.png

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_54514751/article/details/129671424

docker入门到精通-张敏-专题视频课程_艾尔aier的博客-爱代码爱编程

Docker入门到精通—395人已学习 课程介绍         Docker作为一种新的虚拟化技术,在2013年出现之后受到了广泛的关注。目前已经在各大中小公司得到广泛的应用和部署。Docker作为大数据时代的一门核心技术,各大企业越来越离不开精通Docker的开发人员。希望借助本课程帮助越来越多的人进入大数据云计算领域! 课程收益     D

视频教程-Docker入门到精通视频课程-Java-爱代码爱编程

Docker入门到精通视频课程 Java讲师,多年培训经验,曾参与开发过的项目:某省电信ODS系统、电信自助取数系统、CRM客户关系管理系统、环境应急信息系统、自来水客服系统等。熟练掌握J2EE平台开发技能,包括Core Java、Servlet、S

Docker从入门到精通(三)-爱代码爱编程

Docker Compose(单机使用) 介绍 以前使用Docker时 (一)写完项目后需要定义一个DockerFile (二)通过DockerFile文件使用 docker build命令生产一个镜像 (三)通过run 命令去执行 上述流程全是手动操作,并且只能操作单个容器!     如果

docker教程从入门到精通-爱代码爱编程

安装docker docker 官方文档 https://docs.docker.com/engine/install/ Docker的镜像称为image,容器称为container。对于Docker来说,image是静态的,类似于操作系统快照,而container则是动态的,是image的运行实例。 有了镜像才能创建容器,如果数据在容器里,删除容器

Docker 入门到精通-爱代码爱编程

docker 入门到精通 文章目录 docker 入门到精通一 开篇介绍01.容器化技术概述02.docker简介及介绍03.docker的架构及工作原理(详解)二 深入学习docker01.centos7Docker安装及配置镜像加速02.docker镜像常用命令及基本操作03.docker容器常用命令及基本操作04.docker之常见应用部署

Docker从入门到-------入门-爱代码爱编程

Docker docker 是什么技术 开发运维 DevOps Docker学习东西 Docker概述Docker安装Docker命令 镜像命令容器命令操作命令Docker镜像!容器数据卷DockerFile 构建镜像Docker网络原理IDEA整合DockerDocker ComposeDocker Swarm 简化版的CI\CD Jenk

kafka从入门到精通:dockerredis哨兵集群-爱代码爱编程

一、MyBatis的框架设计 注:上图很大程度上参考了iteye 上的chenjc_it 所写的博文[原理分析之二:框架整体设计] 中的MyBatis架构体图,chenjc_it总结的非常好,赞一个! 1.接口层—和数据库交互的方式 MyBatis和数据库的交互有两种方式: a.使用传统的MyBatis提供的API; b. 使用Mapper接口

Docker入门到精通-爱代码爱编程

Docker简单使用 CentOS Docker 安装使用官方安装脚本自动安装手动安装卸载旧版本安装 Docker Engine-Community使用 Docker 仓库进行安装设置仓库使用官方源地址(比较慢)阿里云清华大学源安装 Docker Engine-Community有多个 Docker 仓库吗?要安装特定版本的 Docker Engi

Docker从入门到精通(八)——Docker Compose-爱代码爱编程

恭喜大家,学到这里,对于 docker 的基础玩法大家应该都会了,下面会介绍 docker的一些编排工具。 1、为什么需要 Docker Compose? 官网镇楼:https://www.runoob.com/docker/docker-compose.html 一句话概括: 帮助我们批量有规则的管理容器。 前面基础教程,我们介绍了

spark3.x入门到精通-阶段五(sparkstreaming详解原理&java&scala双语实战)_顶尖高手养成计划的博客-爱代码爱编程

SparkStreaming 简介 Spark Streaming 是 Spark 的一个子模块,用于快速构建可扩展,高吞吐量,高容错的流处理程序。具有以下特点: 通过高级 API 构建应用程序,简单易用;支持多种语言,如 Java,Scala 和 Python;良好的容错性,Spark Streaming 支持快速从失败中恢复丢失的操作状态;能够和

史上最全 redis 面试题及答案。_澎湖java架构师的博客-爱代码爱编程

花了大量时间 整理了这套 Redis 面试题 首发 50 题,绝无仅有 从入门到精通 从基础,高级知识点 再到集群,运维,方案… 弄明白了这些题 可以说可以成为面霸了 面试官都得折服 Redis 学得怎么

docker 从入门到精通-爱代码爱编程

目录 一、安装Docker 1. 安装必要的包 2. 设置镜像的仓库 3. 更新软件包的索引 4. 安装docker 5. 启动docker 6. 测试 hello-world 7. 查看的hello-world镜像 8. 卸载docker 9. 配置阿里云镜像加速  二、Docker 常用命令 镜像命令 (1)docker im

redis(三) 持久化 rdb+aof-爱代码爱编程

哈喽,大家好,我是有勇气的牛排(全网同名)🐮🐮🐮 有问题的小伙伴欢迎在文末评论,点赞、收藏是对我最大的支持!!!。 文章目录 1 RDB持久化1.1 官方介绍:1.2 配置文件1.2.1 Redis 6.0.16

6.docker入门到精通—配置3主3从redis集群-爱代码爱编程

【前提】:docker安装了redis:6.0.8镜像 3主3从redis 集群配置 关闭防火墙+启动 docker 后台服务 systemctl start docker 新建 6 个 docker 容器 redis 实例 docker run -d --name redis-node-1

redis(七):持久化:aof和rdb-爱代码爱编程

前言 上一篇介绍了 Redis 实现消息队列的三种方式。这节开始介绍 Redis 的持久化问题。 我们都知道 Redis 是基于内存的数据库,而内存又是易失性的,一旦遇到断电或异常重启等问题时,内存中的数据就会丢失。所以