当前位置: 首页 > BloomFilter
  • BloomFilter是一种高效的随机数据结构,被用于检测一个元素是否是一个集合中的一个元素,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,即如果它判断元素不在集合里,此元素一定不是集合中的元素,如果判断元素在集合里,有可能存在一定的错误率,可见 Bloom filter 是牺牲了正确率换取时间和空间。

    阅读全文
    网站开发 1,437 人阅读 抢沙发 , ,
  • Bloom filter:可以用来实现数据字典,进行数据的判重,或者集合求交集。Hashing:快速查找,删除的基本数据结构,通常需要总数据量可以放入内存。bit-map:可进行数据的快速查找,判重,删除,一般来说数据范围是int的10倍以下。堆:海量数据前n大,并且n比较小,堆可以放入内存。双层桶划分:第k大,中位数,不重复或重复的数字。数据库索引:大数据量的增删改查。倒排索引:搜索引擎,关键字查询。外排序:大数据的排序,去重。

    阅读全文