一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務(wù)器之家:專注于服務(wù)器技術(shù)及軟件下載分享
分類導(dǎo)航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|數(shù)據(jù)庫技術(shù)|

服務(wù)器之家 - 數(shù)據(jù)庫 - Redis - Redis實現(xiàn)布隆過濾器的方法及原理

Redis實現(xiàn)布隆過濾器的方法及原理

2020-03-01 14:13平頭一哥 Redis

布隆過濾器優(yōu)點是空間效率和查詢時間都比一般的算法要好的多,缺點是有一定的誤識別率和刪除困難。本文將介紹布隆過濾器的原理以及Redis如何實現(xiàn)布隆過濾器,感興趣的朋友跟隨小編一起看看吧

布隆過濾器(Bloom Filter)是1970年由布隆提出的。它實際上是一個很長的二進制向量和一系列隨機映射函數(shù)。布隆過濾器可以用于檢索一個元素是否在一個集合中。它的優(yōu)點是空間效率和查詢時間都比一般的算法要好的多,缺點是有一定的誤識別率和刪除困難。

本文將介紹布隆過濾器的原理以及Redis如何實現(xiàn)布隆過濾器。

應(yīng)用場景

1、50億個電話號碼,現(xiàn)有10萬個電話號碼,如何判斷這10萬個是否已經(jīng)存在在50億個之中?(可能方案:數(shù)據(jù)庫,set, hyperloglog)
2、新聞客戶端看新聞時,它會不斷推薦新的內(nèi)容,每次推薦時都要去重,那么如何實現(xiàn)推送去重?
3、爬蟲URL去重?
4、NoSQL數(shù)據(jù)庫領(lǐng)域降低數(shù)據(jù)庫的IO請求數(shù)量?
5、郵箱系統(tǒng)的垃圾郵件過濾?

布隆過濾器(Bloom Filter)就是專門來解決這種問題的,它起到去重的同時,在空間上還能節(jié)省90%以上,只是存在一定的誤判概率。

認識布隆過濾器

布隆過濾器是一種類似set的數(shù)據(jù)結(jié)構(gòu),只是不太準確,當用bf.exists判斷元素是否存在時返回結(jié)果存在但真實不一定存在;當返回不存在時肯定是不存在,所以判斷去重時有一定的誤判概率。
當然,誤判只會發(fā)生在過濾器沒有添加過的元素,對于添加過的元素不會發(fā)生誤判。
特點:高效地插入和查詢,占用空間少,返回的結(jié)果是不確定性的。

布隆過濾器原理

每個布隆過濾器對應(yīng)到Redis的數(shù)據(jù)結(jié)構(gòu)中就是一個大型的位數(shù)組和幾個不同的無偏hash函數(shù),無偏表示分布均勻。

添加key時,使用多個hash函數(shù)對key進行hash運算得到一個整數(shù)索引值,對位數(shù)組長度進行取模運算得到一個位置,每個hash函數(shù)都會得到一個不同的位置,將這幾個位置都置1就完成了add操作。

查詢同理,只要有一位是0就表示這個key不存在,但如果都是1,則不一定存在對應(yīng)的key。

空間占用估計

布隆過濾器的空間占用有一個簡單的計算公式,但推導(dǎo)比較繁瑣。布隆過濾器有兩個參數(shù),預(yù)計元素數(shù)量n,錯誤率f,公式得到兩個輸出,位數(shù)組長度L(即存儲空間大小bit),hash函數(shù)的最佳數(shù)量k。

k = 0.7*(1/n)
f = 0.6185^(L/n)

1、位數(shù)組相對長度越長,錯誤率越低;
2、位數(shù)組相對長度越長,需要的hash函數(shù)越多;
3、當一個元素平均需要一個字節(jié)(8bit)的指紋空間時(L/n=8),錯誤率大約為2%。

實際元素超出時,誤判率會怎樣變化?

f = (1-0.5^t)^k  # t為實際元素與預(yù)計元素的倍數(shù)
1、當錯誤率為10%時,倍數(shù)比為2時,錯誤率接近40%;
2、當錯誤率為1%,倍數(shù)比為2時,錯誤率15%;
3、當錯誤率為0.1%,倍數(shù)為2時,錯誤率5%

Redis實現(xiàn)簡單Bloom Filter

要想使用redis提供的布隆過濾器,必須添加redis 4.0版本以上的插件才行,具體參照網(wǎng)上安裝步驟。

布隆過濾器有兩個基本指令,bf.add添加元素,bf.exists查詢元素是否存在,bf.madd一次添加多個元素,bf.mexists一次查詢多個元素。

> bf.add spiderurl www.baidu.com
> bf.exists spiderurl www.baidu.com
> bf.madd spiderurl www.sougou.com www.jd.com
> bf.mexists spiderurl www.jd.com www.taobao.com

布隆過濾器在第一次add的時候自動創(chuàng)建基于默認參數(shù)的過濾器,Redis還提供了自定義參數(shù)的布隆過濾器。

在add之前使用bf.reserve指令顯式創(chuàng)建,其有3個參數(shù),key,error_rate, initial_size,錯誤率越低,需要的空間越大,error_rate表示預(yù)計錯誤率,initial_size參數(shù)表示預(yù)計放入的元素數(shù)量,當實際數(shù)量超過這個值時,誤判率會上升,所以需要提前設(shè)置一個較大的數(shù)值來避免超出。

默認的error_rate是0.01,initial_size是100。

利用布隆過濾器減少磁盤 IO 或者網(wǎng)絡(luò)請求,因為一旦一個值必定不存在的話,我們可以不用進行后續(xù)昂貴的查詢請求。

總結(jié)

以上所述是小編給大家介紹的Redis實現(xiàn)布隆過濾器的方法及原理,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復(fù)大家的!

原文鏈接:https://blog.csdn.net/william0318/article/details/89332970

延伸 · 閱讀

精彩推薦
  • RedisRedis 事務(wù)知識點相關(guān)總結(jié)

    Redis 事務(wù)知識點相關(guān)總結(jié)

    這篇文章主要介紹了Redis 事務(wù)相關(guān)總結(jié),幫助大家更好的理解和學習使用Redis,感興趣的朋友可以了解下...

    AsiaYe8232021-07-28
  • RedisRedis全量復(fù)制與部分復(fù)制示例詳解

    Redis全量復(fù)制與部分復(fù)制示例詳解

    這篇文章主要給大家介紹了關(guān)于Redis全量復(fù)制與部分復(fù)制的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用Redis爬蟲具有一定的參考學習...

    豆子先生5052019-11-27
  • Redisredis實現(xiàn)排行榜功能

    redis實現(xiàn)排行榜功能

    排行榜在很多地方都能使用到,redis的zset可以很方便地用來實現(xiàn)排行榜功能,本文就來簡單的介紹一下如何使用,具有一定的參考價值,感興趣的小伙伴們...

    乘月歸5022021-08-05
  • Redisredis 交集、并集、差集的具體使用

    redis 交集、并集、差集的具體使用

    這篇文章主要介紹了redis 交集、并集、差集的具體使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友...

    xiaojin21cen10152021-07-27
  • RedisRedis如何實現(xiàn)數(shù)據(jù)庫讀寫分離詳解

    Redis如何實現(xiàn)數(shù)據(jù)庫讀寫分離詳解

    Redis的主從架構(gòu),能幫助我們實現(xiàn)讀多,寫少的情況,下面這篇文章主要給大家介紹了關(guān)于Redis如何實現(xiàn)數(shù)據(jù)庫讀寫分離的相關(guān)資料,文中通過示例代碼介紹...

    羅兵漂流記6092019-11-11
  • RedisRedis的配置、啟動、操作和關(guān)閉方法

    Redis的配置、啟動、操作和關(guān)閉方法

    今天小編就為大家分享一篇Redis的配置、啟動、操作和關(guān)閉方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧 ...

    大道化簡5312019-11-14
  • Redis詳解Redis復(fù)制原理

    詳解Redis復(fù)制原理

    與大多數(shù)db一樣,Redis也提供了復(fù)制機制,以滿足故障恢復(fù)和負載均衡等需求。復(fù)制也是Redis高可用的基礎(chǔ),哨兵和集群都是建立在復(fù)制基礎(chǔ)上實現(xiàn)高可用的...

    李留廣10222021-08-09
  • Redisredis中如何使用lua腳本讓你的靈活性提高5個逼格詳解

    redis中如何使用lua腳本讓你的靈活性提高5個逼格詳解

    這篇文章主要給大家介紹了關(guān)于redis中如何使用lua腳本讓你的靈活性提高5個逼格的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具...

    一線碼農(nóng)5812019-11-18
主站蜘蛛池模板: 亚洲黑人巨大videos0 | 人体做爰aaaa免费 | 性一交一无一伦一精一品 | 国产 国语对白 露脸正在播放 | 亚洲欧美日韩精品久久亚洲区 | 日韩高清一区二区三区不卡 | 国产成人免费高清激情明星 | 无码人妻精品一区二区蜜桃在线看 | 亚洲成人黄色 | 女仆掀起蕾丝裙被打屁股作文 | poronovideos极度变态 | 女教师巨大乳孔中文字幕免费 | www视频在线免费观看 | 亚洲AV无码乱码在线观看浪潮 | 色婷婷在线播放 | 美女的让男人桶爽30分钟的 | 18未年禁止免费观看 | 国产欧美日韩图片一区二区 | 红色毛片 | 亚洲国产剧情中文视频在线 | 欧美日韩亚洲综合在线一区二区 | 午夜亚洲精品久久久久久 | 精品一成人岛国片在线观看 | 亚洲小视频网站 | 欧美日韩人成在线观看 | 日本在线观看免费高清 | 草草视频在线观看最新 | 午夜国产在线 | 喷潮女王cytherea全部视频 | 欧美高清无砖专区欧美精品 | 韩国帅男同gay网站 韩国三级在线播放 | 色涩导航| 动漫美女日批 | 免费国产在线观看 | 视频在线播放 | 饭冈加奈子在线播放观看 | 日本人泡妞xxxxxx69 | 性的张力 | 香蕉91xj.cc| kk4444在线影视播放 | 第一国内永久免费福利视频 |