• 2024-08-06海量 url 去重类问题(布隆过滤器)
    布隆过滤器(BloomFilter)是一种空间效率非常高的概率数据结构,主要用于判断一个元素是否在一个集合中。它由一个位数组和一组哈希函数组成,可以用于处理海量数据的去重问题,例如海量URL去重。布隆过滤器的基本原理位数组(BitArray):布隆过滤器使用一个位数组来存储数据。初