布隆过滤器

网上有关“布隆过滤器”话题很是火热,小编也是针对布隆过滤器寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。

布隆过滤器 (英语:Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个集合中。

通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景,一般想到的是将集合中所有元素保存起来,然后通过比较确定。链表、树、散列表(又叫哈希表,Hash table)等等数据结构都是这种思路。但是随着集合中元素的增加,我们需要的存储空间也会呈现线性增长,最终达到瓶颈。同时检索速度也越来越慢,上述三种结构的检索时间复杂度分别为,,。

这个时候,布隆过滤器(Bloom Filter)就应运而生。

了解布隆过滤器原理之前,先回顾下 Hash 函数原理。

哈希函数的概念是:将任意大小的输入数据转换成特定大小的输出数据的函数,转换后的数据称为哈希值或哈希编码,也叫散列值。下面是一幅示意图:

所有散列函数都有如下基本特性:

但是用 hash表存储大数据量时,空间效率还是很低,当只有一个 hash 函数时,还很容易发生哈希碰撞。

BloomFilter 是由一个固定大小的二进制向量或者位图(bitmap)和一系列映射函数组成的。

在初始状态时,对于长度为 m 的位数组,它的所有位都被置为0,如下图所示:

[上传失败...(image-303c04-1595324887187)]

当有变量被加入集合时,通过 K 个映射函数将这个变量映射成位图中的 K 个点,把它们置为 1(假定有两个变量都通过 3 个映射函数)。

查询某个变量的时候我们只要看看这些点是不是都是 1 就可以大概率知道集合中有没有它了

为什么说是可能存在,而不是一定存在呢?那是因为映射函数本身就是散列函数,散列函数是会有碰撞的。

布隆过滤器的误判是指多个输入经过哈希之后在相同的bit位置1了,这样就无法判断究竟是哪个输入产生的,因此误判的根源在于相同的 bit 位被多次映射且置 1。

这种情况也造成了布隆过滤器的删除问题,因为布隆过滤器的每一个 bit 并不是独占的,很有可能多个元素共享了某一位。如果我们直接删除这一位的话,会影响其他的元素。(比如上图中的第 3 位)

相比于其它的数据结构,布隆过滤器在空间和时间方面都有巨大的优势。布隆过滤器存储空间和插入/查询时间都是常数 ,另外,散列函数相互之间没有关系,方便由硬件并行实现。布隆过滤器不需要存储元素本身,在某些对保密要求非常严格的场合有优势。

布隆过滤器可以表示全集,其它任何数据结构都不能;

但是布隆过滤器的缺点和优点一样明显。误算率是其中之一。随着存入的元素数量增加,误算率随之增加。但是如果元素数量太少,则使用散列表足矣。

另外,一般情况下不能从布隆过滤器中删除元素。我们很容易想到把位数组变成整数数组,每插入一个元素相应的计数器加 1, 这样删除元素时将计数器减掉就可以了。然而要保证安全地删除元素并非如此简单。首先我们必须保证删除的元素的确在布隆过滤器里面。这一点单凭这个过滤器是无法保证的。另外计数器回绕也会造成问题。

在降低误算率方面,有不少工作,使得出现了很多布隆过滤器的变种。

在程序的世界中,布隆过滤器是程序员的一把利器,利用它可以快速地解决项目中一些比较棘手的问题。

如网页 URL 去重、垃圾邮件识别、大集合中重复元素的判断和缓存穿透等问题。

布隆过滤器的典型应用有:

知道了布隆过滤器的原理和使用场景,我们可以自己实现一个简单的布隆过滤器

分布式环境中,布隆过滤器肯定还需要考虑是可以共享的资源,这时候我们会想到 Redis,是的,Redis 也实现了布隆过滤器。

当然我们也可以把布隆过滤器通过 bloomFilter.writeTo() 写入一个文件,放入OSS、S3这类对象存储中。

Redis 提供的 bitMap 可以实现布隆过滤器,但是需要自己设计映射函数和一些细节,这和我们自定义没啥区别。

Redis 官方提供的布隆过滤器到了 Redis 4.0 提供了插件功能之后才正式登场。布隆过滤器作为一个插件加载到 Redis Server 中,给 Redis 提供了强大的布隆去重功能。

在已安装 Redis 的前提下,安装 RedisBloom,有两种方式

直接编译进行安装

使用Docker进行安装

使用

布隆过滤器基本指令:

我们只有这几个参数,肯定不会有误判,当元素逐渐增多时,就会有一定的误判了,这里就不做这个实验了。

上面使用的布隆过滤器只是默认参数的布隆过滤器,它在我们第一次 add 的时候自动创建。

Redis 还提供了自定义参数的布隆过滤器,bf.reserve 过滤器名 error_rate initial_size

但是这个操作需要在 add 之前显式创建。如果对应的 key 已经存在,bf.reserve 会报错

我是一名 Javaer,肯定还要用 Java 来实现的,Java 的 Redis 客户端比较多,有些还没有提供指令扩展机制,笔者已知的 Redisson 和 lettuce 是可以使用布隆过滤器的,我们这里用 Redisson

为了解决布隆过滤器不能删除元素的问题,布谷鸟过滤器横空出世。论文《Cuckoo Filter:Better Than Bloom》作者将布谷鸟过滤器和布隆过滤器进行了深入的对比。相比布谷鸟过滤器而言布隆过滤器有以下不足:查询性能弱、空间利用效率低、不支持反向操作(删除)以及不支持计数。

关于“布隆过滤器”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!

本文来自作者[南城旧梦]投稿,不代表盛龙号立场,如若转载,请注明出处:https://m.snlon.net/sn/1983.html

(185)

文章推荐

  • 必看教程“手机跑胡子开挂是真的吗”(原来确实是有挂)

    >亲,手机跑胡子开挂是真的吗这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 弊辅助软件。

    2025年09月26日
    155323
  • 实操教程“手机打牌怎么控制输赢”附开挂脚本详细步骤

    亲,手机打牌怎么控制输赢这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的通过添加客服微:本司针对手游进行匹配,选择我们的四大理由:1、软件是

    2025年10月01日
    160304
  • 心理学从起源到现在是怎样发展的-在生活中的应用都有哪些-

    网上有关“心理学从起源到现在是怎样发展的?在生活中的应用都有哪些?”话题很是火热,小编也是针对心理学从起源到现在是怎样发展的?在生活中的应用都有哪些?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。作为一门科学的科学史,心理学的历史却十分短暂。19世纪中叶以后

    2025年11月16日
    156319
  • 早起开嗓最简单的方法

    网上有关“早起开嗓最简单的方法”话题很是火热,小编也是针对早起开嗓最简单的方法寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。不需要刻意的去发声.很平常的说说话.尽量保护好嗓子,这几天好好休息.保证充足的睡眠.唱歌前1小时不要吃东西以免用气息的时候会打嗝.开

    2025年11月23日
    161323
  • 教程开挂辅助“雀神麻将小程序有挂吗-另有马脚”其实确实有挂

    >亲,雀神麻将小程序有挂吗-另有马脚这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 弊辅

    2025年11月28日
    139313
  • 疏散指示标志设置要求

    网上有关“疏散指示标志设置要求”话题很是火热,小编也是针对疏散指示标志设置要求寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。法律分析:疏散指示标志的设置应符合的要求:1、疏散指示标志的方向指示标志图形应指向最近的疏散出口或安全出口;2、设置在安全出口或疏散出

    2025年12月14日
    123309
  • 为什么有的超市工资那么低还能招到人呢?

    网上有关“为什么有的超市工资那么低还能招到人呢?”话题很是火热,小编也是针对为什么有的超市工资那么低还能招到人呢?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。超市普通员工的工资确实不高。以收银员为例,大概都维持在当地的最低工资标准上。而超

    2025年12月16日
    117319
  • 舞蹈可以带来什么好处

    网上有关“舞蹈可以带来什么好处”话题很是火热,小编也是针对舞蹈可以带来什么好处寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。舞蹈可以带来的好处有:促进身体健康、改善心理健康、增加社交互动、提高认知能力、创造和表达。1、促进身体健康:舞蹈是一种有氧运动,可以促

    2026年01月11日
    95313
  • 深圳社保怎么办理定点医院

    网上有关“深圳社保怎么办理定点医院”话题很是火热,小编也是针对深圳社保怎么办理定点医院寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。3种方式建立医保个人账户家庭成员关联(一)社会保险服务个人网页自助办理:在个人网页输入相关信息,自行关联。具体操作如下:登陆个

    2026年02月08日
    66304
  • 辅助神器“微乐小程序麻将到底是不是有挂”开挂辅助脚本+详细开挂安装教程

    1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启软件,就会全程后台自动连接程序,无需用户时时盯着软件。 3、安全保障,使用这款软件的用户可以非常安心,绝对没有被封的危险存在。 4、快速稳定,使用这款软件的用户肯定是土豪。安卓定制版

    2026年02月08日
    55313
  • 辅助神器“边锋二七十有没有挂免费”(免费)开挂辅助教学(最新辅助开挂教程)

    您好:,软件加微信【添加图中QQ群】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的,添加客服微信【添加图中QQ群】安装软件.1、起手看牌2、随意选牌3、控制牌型4、注明,就是

    2026年02月18日
    44300
  • 辅助神器“微信小程序微乐麻将必赢神器”开挂辅助脚本+详细开挂安装教程

    了解更多开挂安装加图片二维码是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐跑得快万能开挂器通用版下载可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义大贰小程序系统规律,只需要输入自己想要的开挂功能,一键便可以生成出大贰小程

    2026年03月03日
    44319

发表回复

本站作者才能评论

评论列表(3条)

  • 南城旧梦的头像
    南城旧梦 2025年09月20日

    我是盛龙号的签约作者“南城旧梦”

  • 南城旧梦
    南城旧梦 2025年09月20日

    本文概览:网上有关“布隆过滤器”话题很是火热,小编也是针对布隆过滤器寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。 布隆过滤器 (英语:Blo...

  • 南城旧梦
    用户092010 2025年09月20日

    文章不错《布隆过滤器》内容很有帮助