關(guān)于Redis你可能不了解的一些事

156次閱讀

共計(jì) 6304 個(gè)字符，預(yù)計(jì)需要花費(fèi) 16 分鐘才能閱讀完成。

Redis 是一個(gè)高性能分布式的 key-value 數(shù)據(jù)庫(kù)。它支持多種數(shù)據(jù)結(jié)構(gòu)，并可應(yīng)用于緩存、隊(duì)列等多種場(chǎng)景下。使用過 Redis 的小伙伴們可能對(duì)這些已經(jīng)非常熟知了，下面我想來(lái)談?wù)?Redis 也許并不被每個(gè)人了解的那點(diǎn)事。

Redis 持久化機(jī)制

剛看到標(biāo)題你可能會(huì)說(shuō)，我知道，不就是 RDB 和 AOF 嘛。這些已經(jīng)是老生常談了。那么我們今天就深入談?wù)勥@兩種持久化方式的邏輯和原理。

RDB 的原理

在 Redis 中 RDB 持久化的觸發(fā)分為兩種：自己手動(dòng)觸發(fā)與 Redis 定時(shí)觸發(fā)。

針對(duì) RDB 方式的持久化，手動(dòng)觸發(fā)可以使用：

(1)save：會(huì)阻塞當(dāng)前 Redis 服務(wù)器，直到持久化完成，線上應(yīng)該禁止使用。
(2)bgsave：該觸發(fā)方式會(huì) fork 一個(gè)子進(jìn)程，由子進(jìn)程負(fù)責(zé)持久化過程，因此阻塞只會(huì)發(fā)生在 fork 子進(jìn)程的時(shí)候。

而自動(dòng)觸發(fā)的場(chǎng)景如下：

根據(jù)我們的 save m n 配置規(guī)則自動(dòng)觸發(fā)；
從節(jié)點(diǎn)全量復(fù)制時(shí)，主節(jié)點(diǎn)發(fā)送 rdb 文件給從節(jié)點(diǎn)完成復(fù)制操作，主節(jié)點(diǎn)會(huì)觸發(fā) bgsave；
執(zhí)行 debug reload 時(shí)處罰；
執(zhí)行 shutdown 時(shí)，如果沒有開啟 aof，也會(huì)觸發(fā)。

由于 save 基本不會(huì)被使用到，我們來(lái)看看 bgsave 這個(gè)命令是如何完成 RDB 的持久化的。

RDB 文件保存過程

(1)redis 調(diào)用 fork, 現(xiàn)在有了子進(jìn)程和父進(jìn)程。
(2)父進(jìn)程繼續(xù)處理 client 請(qǐng)求，子進(jìn)程負(fù)責(zé)將內(nèi)存內(nèi)容寫入到臨時(shí)文件。由于 os 的寫時(shí)復(fù)制機(jī)制（copy on write)父子進(jìn)程會(huì)共享相同的物理頁(yè)面，當(dāng)父進(jìn)程處理寫請(qǐng)求時(shí) os 會(huì)為父進(jìn)程要修改的頁(yè)面創(chuàng)建副本，而不是寫共享的頁(yè)面。所以子進(jìn)程的地址空間內(nèi)的數(shù)據(jù)是 fork 時(shí)刻整個(gè)數(shù)據(jù)庫(kù)的一個(gè)快照。
(3)當(dāng)子進(jìn)程將快照寫入臨時(shí)文件完畢后，用臨時(shí)文件替換原來(lái)的快照文件，然后子進(jìn)程退出。

PS：fork 操作會(huì)阻塞，導(dǎo)致 Redis 讀寫性能下降。我們可以控制單個(gè) Redis 實(shí)例的最大內(nèi)存，來(lái)盡可能降低 Redis 在 fork 時(shí)的時(shí)間消耗；或者控制自動(dòng)觸發(fā)的頻率減少 fork 次數(shù)。

AOF 的原理

AOF 的整個(gè)流程大體來(lái)看可以分為兩步，一步是命令的實(shí)時(shí)寫入（如果是 appendfsync everysec 配置，會(huì)有 1s 損耗），第二步是對(duì) aof 文件的重寫。

對(duì)于增量追加到文件這一步主要的流程是：

(1)命令寫入
(2)追加到 aof_buf
(3)同步到 aof 磁盤

那么這里為什么要先寫入 buf 再同步到磁盤呢？如果實(shí)時(shí)寫入磁盤會(huì)帶來(lái)非常高的磁盤 IO，影響整體性能。

AOF 重寫

你可以會(huì)想，每一條寫命令都生成一條日志，那么 AOF 文件是不是會(huì)很大？答案是肯定的，AOF 文件會(huì)越來(lái)越大，所以 Redis 又提供了一個(gè)功能，叫做 AOF rewrite。其功能就是重新生成一份 AOF 文件，新的 AOF 文件中一條記錄的操作只會(huì)有一次，而不像一份老文件那樣，可能記錄了對(duì)同一個(gè)值的多次操作。

手動(dòng)觸發(fā)：bgrewriteaof

自動(dòng)觸發(fā)就是根據(jù)配置規(guī)則來(lái)觸發(fā)，當(dāng)然自動(dòng)觸發(fā)的整體時(shí)間還跟 Redis 的定時(shí)任務(wù)頻率有關(guān)系。

下面來(lái)看看重寫的流程圖：

(1)redis 調(diào)用 fork，現(xiàn)在有父子兩個(gè)進(jìn)程
(2)子進(jìn)程根據(jù)內(nèi)存中的數(shù)據(jù)庫(kù)快照，往臨時(shí)文件中寫入重建數(shù)據(jù)庫(kù)狀態(tài)的命令
(3)父進(jìn)程繼續(xù)處理 client 請(qǐng)求，除了把寫命令寫入到原來(lái)的 aof 文件中。同時(shí)把收到的寫命令緩存起來(lái)。這樣就能保證如果子進(jìn)程重寫失敗的話并不會(huì)出問題。
(4)當(dāng)子進(jìn)程把快照內(nèi)容寫到臨時(shí)文件中后，子進(jìn)程發(fā)信號(hào)通知父進(jìn)程。然后父進(jìn)程把緩存的寫命令也寫入到臨時(shí)文件。
(5)現(xiàn)在父進(jìn)程可以使用臨時(shí)文件替換老的 aof 文件，并重命名，后面收到的寫命令也開始往新的 aof 文件中追加。

PS：需要注意到是重寫 aof 文件的操作，并沒有讀取舊的 aof 文件，而是將整個(gè)內(nèi)存中的數(shù)據(jù)庫(kù)內(nèi)容用命令的方式重寫了一個(gè)新的 aof 文件, 這點(diǎn)和快照有點(diǎn)類似。

Redis 為什么這么快？

Redis 采用的是基于內(nèi)存的單進(jìn)程單線程模型的 KV 數(shù)據(jù)庫(kù)，由 C 語(yǔ)言編寫，官方提供的數(shù)據(jù)是可以達(dá)到 100000+ 的 QPS（每秒內(nèi)查詢次數(shù)）。這個(gè)數(shù)據(jù)不比采用單進(jìn)程多線程的同樣基于內(nèi)存的 KV 數(shù)據(jù)庫(kù) Memcached 差！原因如下：

1、完全基于內(nèi)存，絕大部分請(qǐng)求是純粹的內(nèi)存操作，非常快速；
2、數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單，對(duì)數(shù)據(jù)操作也簡(jiǎn)單，Redis 中的數(shù)據(jù)結(jié)構(gòu)是專門進(jìn)行設(shè)計(jì)的；
3、采用單線程，避免了不必要的上下文切換和競(jìng)爭(zhēng)條件，也不存在多進(jìn)程或者多線程導(dǎo)致的切換而消耗 CPU，不用去考慮各種鎖的問題，不存在加鎖釋放鎖的操作，也不可能出現(xiàn)死鎖而導(dǎo)致的性能消耗；
4、使用多路 I / O 復(fù)用模型，非阻塞 IO；
5、使用的底層模型不同，底層實(shí)現(xiàn)方式以及與客戶端之間通信的應(yīng)用協(xié)議不一樣，Redis 直接構(gòu)建了自己的 VM 機(jī)制。

多路 I / O 復(fù)用模型

多路 I / O 復(fù)用模型是利用 select、poll、epoll 可以同時(shí)監(jiān)察多個(gè)流的 I/O 事件的能力，在空閑的時(shí)候，會(huì)把當(dāng)前線程阻塞掉，當(dāng)有一個(gè)或多個(gè)流有 I/O 事件時(shí)，就從阻塞態(tài)中喚醒，于是程序就會(huì)輪詢一遍所有的流（epoll 是只輪詢那些真正發(fā)出了事件的流），并且只依次順序的處理就緒的流，這種做法就避免了大量的無(wú)用操作。這里“多路”指的是多個(gè)網(wǎng)絡(luò)連接，“復(fù)用”指的是復(fù)用同一個(gè)線程。采用多路 I/O 復(fù)用技術(shù)可以讓單個(gè)線程高效的處理多個(gè)連接請(qǐng)求（盡量減少網(wǎng)絡(luò) IO 的時(shí)間消耗）。

Redis 事務(wù)

Redis 中的事務(wù) (transaction) 是一組命令的集合。事務(wù)同命令一樣都是 Redis 最小的執(zhí)行單位，一個(gè)事務(wù)中的命令要么都執(zhí)行，要么都不執(zhí)行。Redis 事務(wù)的實(shí)現(xiàn)需要 MULTI 和 EXEC 兩個(gè)命令，事務(wù)開始的時(shí)候先向 Redis 服務(wù)器發(fā)送 MULTI 命令，然后依次發(fā)送需要在本次事務(wù)中處理的命令，最后再發(fā)送 EXEC 命令表示事務(wù)命令結(jié)束。

舉個(gè)例子，使用 redis-cli 連接 redis，然后在命令行工具中輸入如下命令：

從輸出中可以看到，當(dāng)輸入 MULTI 命令后，服務(wù)器返回 OK 表示事務(wù)開始成功，然后依次輸入需要在本次事務(wù)中執(zhí)行的所有命令，每次輸入一個(gè)命令服務(wù)器并不會(huì)馬上執(zhí)行，而是返回”QUEUED”，這表示命令已經(jīng)被服務(wù)器接受并且暫時(shí)保存起來(lái)，最后輸入 EXEC 命令后，本次事務(wù)中的所有命令才會(huì)被依次執(zhí)行，可以看到最后服務(wù)器一次性返回了三個(gè) OK，這里返回的結(jié)果與發(fā)送的命令是按順序，這說(shuō)明這次事務(wù)中的命令全都執(zhí)行成功了。

再舉個(gè)例子，在命令行工具中輸入如下命令：

和前面的例子一樣，先輸入 MULTI 最后輸入 EXEC 表示中間的命令屬于一個(gè)事務(wù)，不同的是中間輸入的命令有一個(gè)錯(cuò)誤(set 寫成了 sett)，這樣因?yàn)橛幸粋€(gè)錯(cuò)誤的命令導(dǎo)致事務(wù)中的其他命令都不執(zhí)行了，可見事務(wù)中的所有命令是保持一致的。

如果客戶端在發(fā)送 EXEC 命令之前斷線了，則服務(wù)器會(huì)清空事務(wù)隊(duì)列，事務(wù)中的所有命令都不會(huì)被執(zhí)行。而一旦客戶端發(fā)送了 EXEC 命令之后，事務(wù)中的所有命令都會(huì)被執(zhí)行，即使此后客戶端斷線也沒關(guān)系，因?yàn)榉?wù)器已經(jīng)保存了事務(wù)中的所有命令。

除了保證事務(wù)中的所有命令要么全執(zhí)行要么全不執(zhí)行外，Redis 的事務(wù)還能保證一個(gè)事務(wù)中的命令依次執(zhí)行而不會(huì)被其他命令插入。試想一個(gè)客戶端 A 需要執(zhí)行幾條命令，同時(shí)客戶端 B 發(fā)送了幾條命令，如果不使用事務(wù)，則客戶端 B 的命令有可能會(huì)插入到客戶端 A 的幾條命令中，如果想避免這種情況發(fā)生，也可以使用事務(wù)。

Redis 事務(wù)錯(cuò)誤處理

如果一個(gè)事務(wù)中的某個(gè)命令執(zhí)行出錯(cuò)，Redis 會(huì)怎樣處理呢？要回答這個(gè)問題，首先要搞清楚是什么原因?qū)е旅顖?zhí)行出錯(cuò)：

1. 語(yǔ)法錯(cuò)誤: 就像上面的例子一樣，語(yǔ)法錯(cuò)誤表示命令不存在或者參數(shù)錯(cuò)誤，這種情況需要區(qū)分 Redis 的版本，Redis 2.6.5 之前的版本會(huì)忽略錯(cuò)誤的命令，執(zhí)行其他正確的命令，2.6.5 之后的版本會(huì)忽略這個(gè)事務(wù)中的所有命令，都不執(zhí)行

2. 運(yùn)行錯(cuò)誤運(yùn)行錯(cuò)誤表示命令在執(zhí)行過程中出現(xiàn)錯(cuò)誤，比如用 GET 命令獲取一個(gè)散列表類型的鍵值。這種錯(cuò)誤在命令執(zhí)行之前 Redis 是無(wú)法發(fā)現(xiàn)的，所以在事務(wù)里這樣的命令會(huì)被 Redis 接受并執(zhí)行。如果食物里有一條命令執(zhí)行錯(cuò)誤，其他命令依舊會(huì)執(zhí)行（包括出錯(cuò)之后的命令）。

Redis 中的事務(wù)并沒有關(guān)系型數(shù)據(jù)庫(kù)中的事務(wù)回滾 (rollback) 功能，因此使用者必須自己收拾剩下的爛攤子。不過由于 Redis 不支持事務(wù)回滾功能，這也使得 Redis 的事務(wù)簡(jiǎn)潔快速。

WATCH、UNWATCH、DISCARD 命令

從上面的例子我們可以看到，事務(wù)中的命令要全部執(zhí)行完之后才能獲取每個(gè)命令的結(jié)果，但是如果一個(gè)事務(wù)中的命令 B 依賴于他上一個(gè)命令 A 的結(jié)果的話該怎么辦呢？就比如說(shuō)實(shí)現(xiàn)類似 Java 中的 i ++ 的功能，先要獲取當(dāng)前值，才能在當(dāng)前值的基礎(chǔ)上做加一操作。這種場(chǎng)合僅僅使用上面介紹的 MULTI 和 EXEC 是不能實(shí)現(xiàn)的，因?yàn)?MULTI 和 EXEC 中的命令是一起執(zhí)行的，并不能將其中一條命令的執(zhí)行結(jié)果作為另一條命令的執(zhí)行參數(shù)，所以這個(gè)時(shí)候就需要引進(jìn) Redis 事務(wù)家族中的另一成員：WATCH 命令

換個(gè)角度思考上面說(shuō)到的實(shí)現(xiàn) i ++ 的方法，可以這樣實(shí)現(xiàn)：

監(jiān)控 i 的值，保證 i 的值不被修改
獲取 i 的原值
如果過程中 i 的值沒有被修改，則將當(dāng)前的 i 值 +1，否則不執(zhí)行

WATCH 命令可以監(jiān)控一個(gè)或多個(gè)鍵，一旦其中有一個(gè)鍵被修改（或刪除），之后的事務(wù)就不會(huì)執(zhí)行，監(jiān)控一直持續(xù)到 EXEC 命令（事務(wù)中的命令是在 EXEC 之后才執(zhí)行的，EXEC 命令執(zhí)行完之后被監(jiān)控的鍵會(huì)自動(dòng)被 UNWATCH）。舉個(gè)例子：

上面的例子中，首先設(shè)置 mykey 的鍵值為 1，然后使用 WATCH 命令監(jiān)控 mykey，隨后更改 mykey 的值為 2，然后進(jìn)入事務(wù)，事務(wù)中設(shè)置 mykey 的值為 3，然后執(zhí)行 EXEC 運(yùn)行事務(wù)中的命令，最后使用 get 命令查看 mykey 的值，發(fā)現(xiàn) mykey 的值還是 2，也就是說(shuō)事務(wù)中的命令根本沒有執(zhí)行（因?yàn)?WATCH 監(jiān)控 mykey 的過程中，mykey 被修改了，所以隨后的事務(wù)便會(huì)被取消）。

UNWATCH 命令可以在 WATCH 命令執(zhí)行之后、MULTI 命令執(zhí)行之前取消對(duì)某個(gè)鍵的監(jiān)控。舉個(gè)例子：

上面的例子中，首先設(shè)置 mykey 的鍵值為 1，然后使用 WATCH 命令監(jiān)控 mykey，隨后更改 mykey 的值為 2，然后取消對(duì) mykey 的監(jiān)控，再進(jìn)入事務(wù)，事務(wù)中設(shè)置 mykey 的值為 3，然后執(zhí)行 EXEC 運(yùn)行事務(wù)中的命令，最后使用 get 命令查看 mykey 的值，發(fā)現(xiàn) mykey 的值還是 3，也就是說(shuō)事務(wù)中的命令運(yùn)行成功。

DISCARD 命令則可以在 MULTI 命令執(zhí)行之后，EXEC 命令執(zhí)行之前取消 WATCH 命令并清空事務(wù)隊(duì)列，然后從事務(wù)狀態(tài)中退出。舉個(gè)例子：

上面的例子中，首先設(shè)置 mykey 的鍵值為 1，然后使用 WATCH 命令監(jiān)控 mykey，隨后更改 mykey 的值為 2，然后進(jìn)入事務(wù)，事務(wù)中設(shè)置 mykey 的值為 3，然后執(zhí)行 DISCARD 命令，再執(zhí)行 EXEC 運(yùn)行事務(wù)中的命令，發(fā)現(xiàn)報(bào)錯(cuò)“ERR EXEC without MULTI”，說(shuō)明 DISCARD 命令成功執(zhí)行——取消 WATCH 命令并清空事務(wù)隊(duì)列，然后從事務(wù)狀態(tài)中退出。

Redis 分布式鎖

上面介紹的 Redis 的 WATCH、MULTI 和 EXEC 命令，只會(huì)在數(shù)據(jù)被其他客戶端搶先修改的情況下，通知執(zhí)行這些命令的客戶端，讓它撤銷對(duì)數(shù)據(jù)的修改操作，并不能阻止其他客戶端對(duì)數(shù)據(jù)進(jìn)行修改，所以只能稱之為樂觀鎖（optimistic locking）。

而這種樂觀鎖并不具備可擴(kuò)展性——當(dāng)客戶端嘗試完成一個(gè)事務(wù)的時(shí)候，可能會(huì)因?yàn)槭聞?wù)執(zhí)行失敗而進(jìn)行反復(fù)的重試。保證數(shù)據(jù)準(zhǔn)確性非常重要，但是當(dāng)負(fù)載變大的時(shí)候，使用樂觀鎖的做法并不完美。這時(shí)就需要使用 Redis 實(shí)現(xiàn)分布式鎖。

分布式鎖：是控制分布式系統(tǒng)之間同步訪問共享資源的一種方式。在分布式系統(tǒng)中，常常需要協(xié)調(diào)他們的動(dòng)作。如果不同的系統(tǒng)或是同一個(gè)系統(tǒng)的不同主機(jī)之間共享了一個(gè)或一組資源，那么訪問這些資源的時(shí)候，往往需要互斥來(lái)防止彼此干擾來(lái)保證一致性，在這種情況下，便需要使用到分布式鎖。

Redis 命令介紹：

Redis 實(shí)現(xiàn)分布式鎖主要用到命令是 SETNX 命令（SET if Not eXists）。

語(yǔ)法：SETNX key value

功能：當(dāng)且僅當(dāng) key 不存在，將 key 的值設(shè)為 value，并返回 1；若給定的 key 已經(jīng)存在，則 SETNX 不做任何動(dòng)作，并返回 0。

使用 Redis 構(gòu)建鎖：

思路：將“l(fā)ock:”+ 參數(shù)名設(shè)置為鎖的鍵，使用 SETNX 命令嘗試將一個(gè)隨機(jī)的 uuid 設(shè)置為鎖的值，并為鎖設(shè)置過期時(shí)間，使用 SETNX 設(shè)置鎖的值可以防止鎖被其他進(jìn)程獲取。如果嘗試獲取鎖的時(shí)候失敗，那么程序?qū)⒉粩嘀卦嚕钡匠晒Λ@取鎖或者超過給定是時(shí)限為止。

代碼：

public String acquireLockWithTimeout(Jedis conn, String lockName, long acquireTimeout, long lockTimeout)
 String identifier = UUID.randomUUID().toString(); // 鎖的值
 String lockKey = "lock:" + lockName; // 鎖的鍵
 int lockExpire = (int)(lockTimeout / 1000); // 鎖的過期時(shí)間
 long end = System.currentTimeMillis() + acquireTimeout; // 嘗試獲取鎖的時(shí)限
 while (System.currentTimeMillis() end) { // 判斷是否超過獲取鎖的時(shí)限
 if (conn.setnx(lockKey, identifier) == 1){ // 判斷設(shè)置鎖的值是否成功
 conn.expire(lockKey, lockExpire); // 設(shè)置鎖的過期時(shí)間
 return identifier; // 返回鎖的值
 if (conn.ttl(lockKey) == -1) { // 判斷鎖是否超時(shí)
 conn.expire(lockKey, lockExpire);
 try {Thread.sleep(1000); // 等待 1 秒后重新嘗試設(shè)置鎖的值
 }catch(InterruptedException ie){Thread.currentThread().interrupt();
 // 獲取鎖失敗時(shí)返回 null
 return null;
 }

鎖的釋放：

思路：使用 WATCH 命令監(jiān)視代表鎖的鍵，然后檢查鍵的值是否和加鎖時(shí)設(shè)置的值相同，并在確認(rèn)值沒有變化后刪除該鍵。

代碼：

public boolean releaseLock(Jedis conn, String lockName, String identifier) {
 String lockKey = "lock:" + lockName; // 鎖的鍵
 while (true){conn.watch(lockKey); // 監(jiān)視鎖的鍵
 if (identifier.equals(conn.get(lockKey))){ // 判斷鎖的值是否和加鎖時(shí)設(shè)置的一致，即檢查進(jìn)程是否仍然持有鎖
 Transaction trans = conn.multi();
 trans.del(lockKey); // 在 Redis 事務(wù)中釋放鎖
 List Object results = trans.exec();
 if (results == null){ 
 continue; // 事務(wù)執(zhí)行失敗后重試（監(jiān)視的鍵被修改導(dǎo)致事務(wù)失敗，重新監(jiān)視并釋放鎖）return true;
 conn.unwatch(); // 解除監(jiān)視
 break;
 return false;
 }

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，謝謝大家對(duì)丸趣 TV 的支持。

向 AI 問一下細(xì)節(jié)

丸趣 TV 網(wǎng) – 提供最優(yōu)質(zhì)的資源集合！

正文完