怎么從開發(fā)者的角度學習Linux內(nèi)存管理

151次閱讀

共計 4318 個字符，預計需要花費 11 分鐘才能閱讀完成。

今天就跟大家聊聊有關怎么從開發(fā)者的角度學習 Linux 內(nèi)存管理，可能很多人都不太了解，為了讓大家更加了解，丸趣 TV 小編給大家總結了以下內(nèi)容，希望大家根據(jù)這篇文章可以有所收獲。

內(nèi)存管理一向是所有操作系統(tǒng)書籍不惜筆墨重點討論的內(nèi)容，無論市面上或是網(wǎng)上都充斥著大量涉及內(nèi)存管理的教材和資料。因此，我們這里所要寫的 Linux 內(nèi)存管理采取避重就輕的策略，從理論層面就不去班門弄斧，貽笑大方了。我們最想做的和可能做到的是從開發(fā)者的角度談談對內(nèi)存管理的理解，最終目的是把我們在內(nèi)核開發(fā)中使用內(nèi)存的經(jīng)驗和對 Linux 內(nèi)存管理的認識與大家共享。

進程如何使用內(nèi)存？

毫無疑問，所有進程（執(zhí)行的程序）都必須占用一定數(shù)量的內(nèi)存，它或是用來存放從磁盤載入的程序代碼，或是存放取自用戶輸入的數(shù)據(jù)等等。不過進程對這些內(nèi)存的管理方式因內(nèi)存用途不一而不盡相同，有些內(nèi)存是事先靜態(tài)分配和統(tǒng)一回收的，而有些卻是按需要動態(tài)分配和回收的。

對任何一個普通進程來講，它都會涉及到 5 種不同的數(shù)據(jù)段。稍有編程知識的朋友都能想到這幾個數(shù)據(jù)段中包含有“程序代碼段”、“程序數(shù)據(jù)段”、“程序堆棧段”等。不錯，這幾種數(shù)據(jù)段都在其中，但除了以上幾種數(shù)據(jù)段之外，進程還另外包含兩種數(shù)據(jù)段。下面我們來簡單歸納一下進程對應的內(nèi)存空間中所包含的 5 種不同的數(shù)據(jù)區(qū)。

代碼段：代碼段是用來存放可執(zhí)行文件的操作指令，也就是說是它是可執(zhí)行程序在內(nèi)存中的鏡像。代碼段需要防止在運行時被非法修改，所以只準許讀取操作，而不允許寫入（修改）操作——它是不可寫的。

數(shù)據(jù)段：數(shù)據(jù)段用來存放可執(zhí)行文件中已初始化全局變量，換句話說就是存放程序靜態(tài)分配的變量和全局變量。

BSS 段：BSS 段包含了程序中未初始化的全局變量，在內(nèi)存中 bss 段全部置零。

堆（heap）：堆是用于存放進程運行中被動態(tài)分配的內(nèi)存段，它的大小并不固定，可動態(tài)擴張或縮減。當進程調(diào)用 malloc 等函數(shù)分配內(nèi)存時，新分配的內(nèi)存就被動態(tài)添加到堆上（堆被擴張）；當利用 free 等函數(shù)釋放內(nèi)存時，被釋放的內(nèi)存從堆中被剔除（堆被縮減）

棧：棧是用戶存放程序臨時創(chuàng)建的局部變量，也就是說我們函數(shù)括弧“{}”中定義的變量（但不包括 static 聲明的變量，static 意味著在數(shù)據(jù)段中存放變量）。除此以外，在函數(shù)被調(diào)用時，其參數(shù)也會被壓入發(fā)起調(diào)用的進程棧中，并且待到調(diào)用結束后，函數(shù)的返回值也會被存放回棧中。由于棧的先進先出特點，所以棧特別方便用來保存 / 恢復調(diào)用現(xiàn)場。從這個意義上講，我們可以把堆?？闯梢粋€寄存、交換臨時數(shù)據(jù)的內(nèi)存區(qū)。

進程如何組織這些區(qū)域？

上述幾種內(nèi)存區(qū)域中數(shù)據(jù)段、BSS 和堆通常是被連續(xù)存儲的——內(nèi)存位置上是連續(xù)的，而代碼段和棧往往會被獨立存放。有趣的是，堆和棧兩個區(qū)域關系很“曖昧”，他們一個向下“長”（i386 體系結構中棧向下、堆向上），一個向上“長”，相對而生。但你不必擔心他們會碰頭，因為他們之間間隔很大（到底大到多少，你可以從下面的例子程序計算一下），絕少有機會能碰到一起。

下圖簡要描述了進程內(nèi)存區(qū)域的分布：

“事實勝于雄辯”，我們用一個小例子（原形取自《User-Level Memory Management》）來展示上面所講的各種內(nèi)存區(qū)的差別與位置。

#include

它的結果如下

below are addresses of types of process s mem
Text location:
Address of main(Code Segment):0x8048388
____________________________
Stack Location:
Initial end of stack:0xbffffab4
new end of stack:0xbffffab0
____________________________
Data Location:
Address of data_var(Data Segment):0x8049758
New end of data_var(Data Segment):0x804975c
__________________________
BSS Location:
Address of bss_var:0x8049864
____________________________
Heap Location:
Initial end of heap:0x8049868
New end of heap:0x804986c

利用 size 命令也可以看到程序的各段大小，比如執(zhí)行 size example 會得到

text data bss dec hex filename
1654 280 8 1942 796 example

但這些數(shù)據(jù)是程序編譯的靜態(tài)統(tǒng)計，而上面顯示的是進程運行時的動態(tài)值，但兩者是對應的。

通過前面的例子，我們對進程使用的邏輯內(nèi)存分布已先睹為快。這部分我們就繼續(xù)進入操作系統(tǒng)內(nèi)核看看，進程對內(nèi)存具體是如何進行分配和管理的。

從用戶向內(nèi)核看，所使用的內(nèi)存表象形式會依次經(jīng)歷“邏輯地址”——“線性地址”——“物理地址”幾種形式（關于幾種地址的解釋在前面已經(jīng)講述了）。邏輯地址經(jīng)段機制轉(zhuǎn)化成線性地址；線性地址又經(jīng)過頁機制轉(zhuǎn)化為物理地址。（但是我們要知道 Linux 系統(tǒng)雖然保留了段機制，但是將所有程序的段地址都定死為 0 -4G，所以雖然邏輯地址和線性地址是兩種不同的地址空間，但在 Linux 中邏輯地址就等于線性地址，它們的值是一樣的）。沿著這條線索，我們所研究的主要問題也就集中在下面幾個問題。

1. 進程空間地址如何管理？

2. 進程地址如何映射到物理內(nèi)存？

3. 物理內(nèi)存如何被管理？

以及由上述問題引發(fā)的一些子問題。如系統(tǒng)虛擬地址分布；內(nèi)存分配接口；連續(xù)內(nèi)存分配與非連續(xù)內(nèi)存分配等。

進程內(nèi)存空間

Linux 操作系統(tǒng)采用虛擬內(nèi)存管理技術，使得每個進程都有各自互不干涉的進程地址空間。該空間是塊大小為 4G 的線性虛擬空間，用戶所看到和接觸到的都是該虛擬地址，無法看到實際的物理內(nèi)存地址。利用這種虛擬地址不但能起到保護操作系統(tǒng)的效果（用戶不能直接訪問物理內(nèi)存），而且更重要的是，用戶程序可使用比實際物理內(nèi)存更大的地址空間（具體的原因請看硬件基礎部分）。

在討論進程空間細節(jié)前，這里先要澄清下面幾個問題：

***、4G 的進程地址空間被人為的分為兩個部分——用戶空間與內(nèi)核空間。用戶空間從 0 到 3G（0xC0000000），內(nèi)核空間占據(jù) 3G 到 4G。用戶進程通常情況下只能訪問用戶空間的虛擬地址，不能訪問內(nèi)核空間虛擬地址。只有用戶進程進行系統(tǒng)調(diào)用（代表用戶進程在內(nèi)核態(tài)執(zhí)行）等時刻可以訪問到內(nèi)核空間。

第二、用戶空間對應進程，所以每當進程切換，用戶空間就會跟著變化；而內(nèi)核空間是由內(nèi)核負責映射，它并不會跟著進程改變，是固定的。內(nèi)核空間地址有自己對應的頁表（init_mm.pgd），用戶進程各自有不同的頁表。

第三、每個進程的用戶空間都是完全獨立、互不相干的。不信的話，你可以把上面的程序同時運行 10 次（當然為了同時運行，讓它們在返回前一同睡眠 100 秒吧），你會看到 10 個進程占用的線性地址一模一樣。

進程內(nèi)存管理

進程內(nèi)存管理的對象是進程線性地址空間上的內(nèi)存鏡像，這些內(nèi)存鏡像其實就是進程使用的虛擬內(nèi)存區(qū)域（memory region）。進程虛擬空間是個 32 或 64 位的“平坦”（獨立的連續(xù)區(qū)間）地址空間（空間的具體大小取決于體系結構）。要統(tǒng)一管理這么大的平坦空間可絕非易事，為了方便管理，虛擬空間被劃分為許多大小可變的 (但必須是 4096 的倍數(shù)) 內(nèi)存區(qū)域，這些區(qū)域在進程線性地址中像停車位一樣有序排列。這些區(qū)域的劃分原則是“將訪問屬性一致的地址空間存放在一起”，所謂訪問屬性在這里無非指的是“可讀、可寫、可執(zhí)行等”。

如果你要查看某個進程占用的內(nèi)存區(qū)域，可以使用命令 cat /proc/

/maps 獲得（pid 是進程號，你可以運行上面我們給出的例子——./example pid 便會打印到屏幕），你可以發(fā)現(xiàn)很多類似于下面的數(shù)字信息。

由于程序 example 使用了動態(tài)庫，所以除了 example 本身使用的的內(nèi)存區(qū)域外，還會包含那些動態(tài)庫使用的內(nèi)存區(qū)域（區(qū)域順序是：代碼段、數(shù)據(jù)段、bss 段）。

我們下面只抽出和 example 有關的信息，除了前兩行代表的代碼段和數(shù)據(jù)段外，*** 一行是進程使用的?？臻g。

08048000-08049000 r-xp 00000000 03:03 439029 /home/mm/src/example 
08049000-0804a000 rw-p 00000000 03:03 439029 /home/mm/src/example
bfffe000 - c0000000 rwxp ffff000 00:00 0

每行數(shù)據(jù)格式如下：

（內(nèi)存區(qū)域）開始-結束訪問權限偏移主設備號：次設備號 i 節(jié)點文件。

注意，你一定會發(fā)現(xiàn)進程空間只包含三個內(nèi)存區(qū)域，似乎沒有上面所提到的堆、bss 等，其實并非如此，程序內(nèi)存段和進程地址空間中的內(nèi)存區(qū)域是種模糊對應，也就是說，堆、bss、數(shù)據(jù)段（初始化過的）都在進程空間中由數(shù)據(jù)段內(nèi)存區(qū)域表示。

在 Linux 內(nèi)核中對應進程內(nèi)存區(qū)域的數(shù)據(jù)結構是: vm_area_struct, 內(nèi)核將每個內(nèi)存區(qū)域作為一個單獨的內(nèi)存對象管理，相應的操作也都一致。采用面向?qū)ο蠓椒ㄊ?VMA 結構體可以代表多種類型的內(nèi)存區(qū)域--比如內(nèi)存映射文件或進程的用戶空間棧等，對這些區(qū)域的操作也都不盡相同。

vm_area_strcut 結構比較復雜，關于它的詳細結構請參閱相關資料。我們這里只對它的組織方法做一點補充說明。vm_area_struct 是描述進程地址空間的基本管理單元，對于一個進程來說往往需要多個內(nèi)存區(qū)域來描述它的虛擬空間，如何關聯(lián)這些不同的內(nèi)存區(qū)域呢？大家可能都會想到使用鏈表，的確 vm_area_struct 結構確實是以鏈表形式鏈接，不過為了方便查找，內(nèi)核又以紅黑樹（以前的內(nèi)核使用平衡樹）的形式組織內(nèi)存區(qū)域，以便降低搜索耗時。并存的兩種組織形式，并非冗余：鏈表用于需要遍歷全部節(jié)點的時候用，而紅黑樹適用于在地址空間中定位特定內(nèi)存區(qū)域的時候。內(nèi)核為了內(nèi)存區(qū)域上的各種不同操作都能獲得高性能，所以同時使用了這兩種數(shù)據(jù)結構。

下圖反映了進程地址空間的管理模型：

進程的地址空間對應的描述結構是“內(nèi)存描述符結構”, 它表示進程的全部地址空間，——包含了和進程地址空間有關的全部信息，其中當然包含進程的內(nèi)存區(qū)域。

看完上述內(nèi)容，你們對怎么從開發(fā)者的角度學習 Linux 內(nèi)存管理有進一步的了解嗎？如果還想了解更多知識或者相關內(nèi)容，請關注丸趣 TV 行業(yè)資訊頻道，感謝大家的支持。

正文完