redis实现布隆过滤器

news/2024/11/29 2:52:52/

1 概述

布隆过滤器是一种基于概率的数据结构,用于判断一个元素是否存在于一个集合中。相比于传统的数据结构,布隆过滤器具有占用空间少、查询速度快的特点,常被用于缓存、爬虫去重等场景。Redis 作为一款流行的 NoSQL 数据库,也提供了对布隆过滤器的支持。本文将介绍如何使用 Redis 实现布隆过滤器,并提供 Java 示例代码和单元测试。

1.1 原理

布隆过滤器的原理是基于多个哈希函数和一个位数组。当一个元素被加入布隆过滤器中时,利用多个哈希函数计算出多个哈希值,并将对应的位数组位置设为1。当要查询一个元素是否存在时,同样利用多个哈希函数计算出多个哈希值,并查询对应的位数组位置,如果所有位置的值都为1,则认为该元素存在,否则认为该元素不存在。

1.2 布隆过滤特点

布隆过滤器具有以下几个特点:

  1. 占用空间少:布隆过滤器使用位数组来表示集合,相较于其他数据结构,布隆过滤器能够有效地节省空间。虽然随着集合中元素数量的增加,误判率也会增加,但整体空间占用相对较小。

  2. 查询速度快:布隆过滤器通过多次哈希映射将元素映射到位数组中,可以快速地进行查询操作。无论集合中元素数量的增加,查询时间基本保持恒定,不受集合大小的影响。

  3. 支持高并发:由于布隆过滤器只涉及位数组的读写操作,而位数组的读写操作通常是原子性操作,布隆过滤器可以支持高并发的环境。

  4. 不可逆操作:布隆过滤器只能判断元素可能存在或一定不存在,无法从位数组中反推出原始数据。这一特点使得布隆过滤器在某些对保密要求严格的场景有一定优势。

  5. 可能存在误判:由于布隆过滤器使用多个哈希函数进行映射,在进行查找时可能会出现哈希冲突,导致误判。误判率随元素数量的增加而增加,需要在设计时根据业务需求和可接受的误判率进行权衡。

1.3 实现步骤

  1. 安装 Redis 布隆过滤器扩展模块:在 Redis 官方提供的扩展模块 redisbloom 中,我们可以找到 Bloom Filter 的实现。首先需要在 Redis 中下载并安装 redisbloom 模块。
  2. 创建布隆过滤器:利用 redisbloom 提供的指令,我们可以在 Redis 中创建布隆过滤器。需要指定布隆过滤器的名称、期望包含元素的数量以及期望的错误率。
  3. 添加元素:利用 redisbloom 提供的指令,我们可以向布隆过滤器中添加元素。
  4. 查询元素:利用 redisbloom 提供的指令,我们可以查询元素是否存在于布隆过滤器中。

2 Java示例代码

2.1 引入 pom jar 包

引入 jrebloom 最新版本包

<dependency><groupId>com.redislabs</groupId><artifactId>jrebloom</artifactId><version>2.2.2</version></dependency>

2.2 Java 使用示例

import io.rebloom.client.Client;public class BloomFilterExample {public static void main(String[] args) {Client client = new Client("localhost", 6379);// 创建布隆过滤器client.createFilter("filter", 100000, 0.01);// 添加元素client.add("filter", "element1");client.add("filter", "element2");// 查询元素boolean exists = client.exists("filter", "element1");System.out.println("Element1 exists: " + exists);}
}

3 单元测试

import io.rebloom.client.Client;
import org.junit.jupiter.api.BeforeEach;
import org.junit.jupiter.api.Test;import static org.junit.jupiter.api.Assertions.*;public class BloomFilterTest {private Client client;@BeforeEachpublic void setUp() {client = new Client("localhost", 6379);client.createFilter("filter", 100000, 0.01);}@Testpublic void testBloomFilter() {client.add("filter", "element1");assertTrue(client.exists("filter", "element1"));assertFalse(client.exists("filter", "element2"));}
}

4 总结

在实际应用中,布隆过滤器可以有效地减少 I/O 操作和网络请求,提升系统性能和效率。通过 Redis 提供的布隆过滤器扩展模块,我们可以方便地在Java中实现布隆过滤器功能。本文介绍了 Redis 实现布隆过滤器的原理和步骤,并提供了 Java 示例代码和单元测试,帮助开发者更好地理解和应用布隆过滤器。

https://github.com/RedisBloom/JRedisBloom


http://www.ppmy.cn/news/1129301.html

相关文章

源码编译安装pkg-config

安装环境&#xff1a;银河麒麟 1 到这个网址下载pkg-config源码&#xff1a; Index of /releases (pkg-config.freedesktop.org) 2 解压 3 进入解压后的目录。输入 ./configure 但是报错。 4 根据报错信息&#xff0c;将configure改为&#xff1a; ./configure --with-i…

Spring Cloud Netflix 教程和源码

本教程目标 想要系统地学习 Spring Cloud Netflix&#xff0c; 把自己的学习过程记录下来。 状态 持续更新中 微服务架构 微服务架构是一种将应用程序拆分为一组独立的、可独立部署的服务的架构模式。每个服务都运行在自己的进程中&#xff0c;可以独立地进行开发、测试和…

038:mapboxGL 旋转地图(rotateTo)

第038个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+mapbox中旋转地图。 直接复制下面的 vue+mapbox源代码,操作2分钟即可运行实现效果 文章目录 示例效果配置方式示例源代码(共68行)相关API参考:专栏目标示例效果 配置方式 1)查看基础设置:https://xiaozhuan…

0x2C动态定义数据标识符服务

其实就是临时在指定地址创建个信息DID&#xff0c;里面可以存写临时数据&#xff0c;到时候可以给自己读写&#xff0c;但是这东西一重启或者过段时间就没了。要用0x22服务去读取&#xff0c;0x2A来写&#xff0c;不能用0x2E来写&#xff0c;协议认为0x2E不能指定地址来写。 这…

git_06_创建分支/查看分支

创建分支 # 创建分支的同时&#xff0c;切换到该分支上 > git checkout -b 分支名称 # 将本地分支推送到远端 > git push origin 分支名称:分支名称查看分支 # 查看本地分支 > git branch # 查看远程分支 > git branch -r # 查看所有分支 > git branch -a切换…

蓝桥等考Python组别七级003

第一部分:选择题 1、Python L7 (15分) 下面for循环语句中,变量i的取值范围是( )。 for i in range(1, 8): print(i) 1~81~70~80~7正确答案:B 2、Python L7 (15分) 下面哪一年是闰年?( ) 1994年

Oracle 11g_FusionOS_安装文档

同事让安装数据库&#xff0c;查询服务器信息发现操作系统是超聚变根据华为openEuler操作系统更改的自研操作系统&#xff0c;安装过程中踩坑不少&#xff0c;最后在超聚变厂商的技术支持下安装成功&#xff0c;步骤可参数该文。 一、 安装环境准备 1.1 软件下载 下载地址:…

Docker制作镜像并部署bind9(yum安装bind)--use

镜像制作 1.1 下载镜像 docker pull centos:centos7.9.2009 1.2 运行容器 [rootlocalhost ~]# docker run -d \ --privileged \ --namebind9 \ --restartalways \ -p 53:53/udp \ -p 53:53/tcp \ -v /data/bind9:/etc/bind \ -v /sys/fs/cgroup:/sys/fs/cgroup \ centos:ce…