Redis使用元素删除的布隆过滤器来解决缓存穿透问题
亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《Redis使用元素删除的布隆过滤器来解决缓存穿透问题》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下布隆过滤器、Redis缓存穿透,希望所有认真读完的童鞋们,都有实质性的提高。
缓存雪崩
缓存雪崩指的是Redis当中的大量缓存在同一时间全部失效,而假如恰巧这一段时间同时又有大量请求被发起,那么就会造成请求直接访问到数据库,可能会把数据库冲垮。
缓存雪崩一般形容的是缓存中没有而数据库中有的数据,而因为时间到期导致请求直达数据库。
解决方案
解决缓存雪崩的方法有很多:
1、加锁,保证单线程访问缓存。这样就不会有很多请求同时访问到数据库。
2、失效时间不要设置成一样。典型的就是初始化预热数据的时候,将数据存入缓存时可以采用随机时间来确保不会咋同一时间有大量缓存失效。
3、内存允许的情况下,可以将缓存设置为永不失效。
缓存击穿
缓存击穿和缓存雪崩很类似,区别就是缓存击穿一般指的是单个缓存失效,而同一时间又有很大的并发请求需要访问这个key,从而造成了数据库的压力。
解决方案
解决缓存击穿的方法和解决缓存雪崩的方法很类似:
1、加锁,保证单线程访问缓存。这样第一个请求到达数据库后就会重新写入缓存,后续的请求就可以直接读取缓存。2、内存允许的情况下,可以将缓存设置为永不失效。
缓存穿透
缓存穿透和上面两种现象的本质区别就是这时候访问的数据其在数据库中也不存在,那么既然数据库不存在,所以缓存里面肯定也不会存在,这样如果并发过大就会造成数据源源不断的到达数据库,给数据库造成极大压力。
解决方案
对于缓存穿透问题,加锁并不能起到很好地效果,因为本身key就是不存在,所以即使控制了线程的访问数,但是请求还是会源源不断的到达数据库。
解决缓存穿透问题一般可以采用以下方案配合使用:
1、接口层进行校验,发现非法的key直接返回。比如数据库中采用的是自增id,那么如果来了一个非整型的id或者负数id可以直接返回,或者说如果采用的是32位uuid,那么发现id长度不等于32位也可以直接返回。
2、将不存在的数据也进行缓存,可以直接缓存一个空或者其他约定好的无效value。采用这种方案最好将key设置一个短期失效时间,否则大量不存在的key被存储到Redis中,也会占用大量内存。
布隆过滤器(Bloom Filter)
针对上面缓存穿透的解决方案,我们思考一下:假如一个key可以绕过第1种方法的校验,而此时有大量的不存在key被访问(如1亿个或者10亿个),那么这时候全部存储到缓存,会占用非常大的空间,会浪费大量服务器内存,导致内存不足。
那么有没有一种更好的解决方案呢?这就是我们接下来要介绍的布隆过滤器,布隆过滤器就可以最大程度的解决key值过多的这个问题。
什么是布隆过滤器
可能大部分人都知道有这么一个面试问题:如何在10亿的海量的无序的数据中快速判断一个元素是否存在?
要解决这个问题就需要用到布隆过滤器,否则大部分服务器的内存是无法存储这么大的数量级的数据的。
布隆过滤器(Bloom Filter)是由布隆在1970年提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数(哈希函数)。
布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率而且删除困难。
位图(Bitmap)
Redis当中有一种数据结构就是位图,布隆过滤器其中重要的实现就是位图的实现,也就是位数组,并且在这个数组中每一个位置只有0和1两种状态,每个位置只占用1个比特(bit),其中0表示没有元素存在,1表示有元素存在。如下图所示就是一个简单的布隆过滤器示例(一个key值经过哈希运算和位运算就可以得出应该落在哪个位置):
哈希碰撞
上面我们发现,lonely
和wolf
落在了同一个位置,这种不同的key值经过哈希运算后得到相同值的现象就称之为哈希碰撞。发生哈希碰撞之后再经过位运算,那么最后肯定会落在同一个位置。
如果发生过多的哈希碰撞,就会影响到判断的准确性,所以为了减少哈希碰撞,我们一般会综合考虑以下2个因素:
1、增大位图数组的大小(位图数组越大,占用的内存越大)。
2、增加哈希函数的次数(同一个key值经过1个函数相等了,那么经过2个或者更多个哈希函数的计算,都得到相等结果的概率就自然会降低了)。
上面两个方法我们需要综合考虑:比如增大位数组,那么就需要消耗更多的空间,而经过越多的哈希计算也会消耗cpu影响到最终的计算时间,所以位数组到底多大,哈希函数次数又到底需要计算多少次合适需要具体情况具体分析。
布隆过滤器的2大特点
下面这个就是一个经过了2次哈希函数得到的布隆过滤器,根据下图我们很容易看到,假如我们的Redis根本不存在,但是Redis经过2次哈希函数之后得到的两个位置已经是1了(一个是wolf通过f2得到,一个是Nosql通过f1得到)。
所以通过上面的现象,我们从布隆过滤器的角度可以得出布隆过滤器主要有2大特点:
1、如果布隆过滤器判断一个元素存在,那么这个元素可能存在。
2、如果布隆过滤器判断一个元素不存在,那么这个元素一定不存在。
而从元素的角度也可以得出2大特点:
1、如果元素实际存在,那么布隆过滤器一定会判断存在。
2、如果元素不存在,那么布隆过滤器可能会判断存在。
PS:需要注意的是,如果经过N次哈希函数,则需要得到的N个位置都是1才能判定存在,只要有一个是0,就可以判定为元素不存在布隆过滤器中。
fpp
因为布隆过滤器中总是会存在误判率,因为哈希碰撞是不可能百分百避免的。布隆过滤器对这种误判率称之为假阳性概率,即:False Positive Probability,简称为fpp。
在实践中使用布隆过滤器时可以自己定义一个fpp,然后就可以根据布隆过滤器的理论计算出需要多少个哈希函数和多大的位数组空间。需要注意的是这个fpp不能定义为100%,因为无法百分保证不发生哈希碰撞。
布隆过滤器的实现(Guava)
在Guava的包中提供了布隆过滤器的实现,下面就通过Guava来体会一下布隆过滤器的应用:
1、引入pom
依赖
<dependency><groupid>com.google.guava</groupid><a target='_blank' href='https://www.17golang.com/gourl/?redirect=MDAwMDAwMDAwML57hpSHp6VpkrqbYLx2eayza4KafaOkbLS3zqSBrJvPsa5_0Ia6sWuR4Juaq6t9nq5roGCUgXuytMyerpV6jd6won-UhJWurJqYaaS8n5ynyYCOqXyzcq21t6uvgXZ43LF4ctGRupWwh5lxaa91ZKuyspKYkpF6b8e3lqWNiWjcs2aknYHcsaOB336bvIaBaLJ9ipx_jYujss2ra42fhN6ziJiZh6q5s4aYfaqvZIVlvrOSmn-KdnU' rel='nofollow'>点击这里</a>可以进入网站计算bit数组大小和哈希函数个数。</p> <h3>布隆过滤器的如何删除</h3> <p>上面的布隆过滤器我们知道,判断一个元素存在就是判断对应位置是否为1来确定的,但是如果要删除掉一个元素是不能直接把1改成0的,因为这个位置可能存在其他元素,所以如果要支持删除,那我们应该怎么做呢?最简单的做法就是加一个计数器,就是说位数组的每个位如果不存在就是0,存在几个元素就存具体的数字,而不仅仅只是存1,那么这就有一个问题,本来存1就是一位就可以满足了,但是如果要存具体的数字比如说2,那就需要2位了,所以<strong>带有计数器的布隆过滤器会占用更大的空间</strong>。</p> <h4>带有计数器的布隆过滤器</h4> <p>下面就是一个带有计数器的布隆过滤器示例<br> 1、引入依赖:</p> <pre class="brush:xml;"> <dependency><groupid>com.baqend</groupid><artifactid>bloom-filter</artifactid><version>1.0.7</version></dependency>
2、新建一个带有计数器的布隆过滤器demo:
package com.lonelyWolf.redis.bloom; import orestes.bloomfilter.FilterBuilder; public class CountingBloomFilter { public static void main(String[] args) { orestes.bloomfilter.CountingBloomFilter<string> cbf = new FilterBuilder(10000, 0.01).countingBits(8).buildCountingBloomFilter(); cbf.add("zhangsan"); cbf.add("lisi"); cbf.add("wangwu"); System.out.println("是否存在王五:" + cbf.contains("wangwu")); //true cbf.remove("wangwu"); System.out.println("是否存在王五:" + cbf.contains("wangwu")); //false } } </string>
构建布隆过滤器前面2个参数一个就是期望的元素数,一个就是fpp值,后面的countingBits
参数就是计数器占用的大小,这里传了一个8位,即最多允许255次重复,如果不传的话这里默认是16位大小,即允许65535次重复。
总结
本文主要讲述了使用Redis存在的三种问题:缓存雪崩,缓存击穿和缓存穿透。并分别对每种问题的解决方案进行了描述,最后着重介绍了缓存穿透的解决方案:布隆过滤器。原生的布隆过滤器不支持删除,但是可以引入一个计数器实现带有计数器的布隆过滤器来实现删除功能,同时在最后也提到了,带有计数器的布隆过滤器会占用更多的空间问题。
好了,本文到此结束,带大家了解了《Redis使用元素删除的布隆过滤器来解决缓存穿透问题》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多数据库知识!

- 上一篇
- 使用百度地图api通过redis实现地标存储及范围坐标点查询功能

- 下一篇
- Redis事务为什么不支持回滚
-
- 忧郁的手链
- 好细啊,已收藏,感谢博主的这篇博文,我会继续支持!
- 2023-02-17 08:08:24
-
- 淡然的老鼠
- 这篇技术贴真及时,up主加油!
- 2023-02-14 02:54:08
-
- 从容的黑米
- 这篇博文真是及时雨啊,好细啊,感谢大佬分享,mark,关注up主了!希望up主能多写数据库相关的文章。
- 2023-02-12 23:14:06
-
- 英俊的帽子
- 这篇技术贴真是及时雨啊,好细啊,太给力了,码起来,关注up主了!希望up主能多写数据库相关的文章。
- 2023-02-10 10:33:24
-
- 俏皮的画板
- 感谢大佬分享,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢大佬分享文章!
- 2023-01-13 06:31:29
-
- 数据库 · Redis | 1天前 |
- Redis事务怎么用?4步带你快速掌握事务精髓!
- 111浏览 收藏
-
- 数据库 · Redis | 1天前 |
- Redis启动不能访问?保姆级排错+解决方案
- 142浏览 收藏
-
- 数据库 · Redis | 1天前 |
- Redis与RabbitMQ性能对决,这些意想不到的联合场景你压根猜不到!
- 415浏览 收藏
-
- 数据库 · Redis | 1天前 |
- Redis集群分片教学:手把手教你搞定数据分片
- 126浏览 收藏
-
- 数据库 · Redis | 1天前 |
- Redis防火墙规则配置教学,大佬带你玩转最佳实践
- 361浏览 收藏
-
- 数据库 · Redis | 2天前 |
- RedisvsMemcached:哪个更适合你?功能对比与场景实战
- 197浏览 收藏
-
- 数据库 · Redis | 2天前 |
- Redis设置强密码+详细访问控制教程(手把手教学)
- 291浏览 收藏
-
- 数据库 · Redis | 2天前 |
- Redis性能优化!手把手教你定位瓶颈+解决方案
- 380浏览 收藏
-
- 数据库 · Redis | 2天前 |
- Redis+HBase双剑合璧,教你打造超神大数据存储系统!
- 436浏览 收藏
-
- 数据库 · Redis | 2天前 |
- RedisSentinel高可用集群配置超详细教程
- 254浏览 收藏
-
- 数据库 · Redis | 2天前 |
- 手把手教你判断Redis版本该不该升级
- 244浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 18次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 50次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 57次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 53次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 57次使用
-
- Redis BloomFilter布隆过滤器原理与实现
- 2022-12-31 472浏览
-
- go-zero源码阅读之布隆过滤器实现代码
- 2023-02-25 405浏览
-
- Redis中Bloomfilter布隆过滤器的学习
- 2023-02-25 190浏览
-
- Redis中Redisson布隆过滤器的学习
- 2023-02-18 191浏览
-
- Redis中缓存穿透/击穿/雪崩问题和解决方法
- 2022-12-31 113浏览