久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

怎么從開發(fā)者的角度學習Linux內(nèi)存管理

151次閱讀
沒有評論

共計 4318 個字符,預計需要花費 11 分鐘才能閱讀完成。

今天就跟大家聊聊有關怎么從開發(fā)者的角度學習 Linux 內(nèi)存管理,可能很多人都不太了解,為了讓大家更加了解,丸趣 TV 小編給大家總結了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

內(nèi)存管理一向是所有操作系統(tǒng)書籍不惜筆墨重點討論的內(nèi)容,無論市面上或是網(wǎng)上都充斥著大量涉及內(nèi)存管理的教材和資料。因此,我們這里所要寫的 Linux 內(nèi)存管理采取避重就輕的策略,從理論層面就不去班門弄斧,貽笑大方了。我們最想做的和可能做到的是從開發(fā)者的角度談談對內(nèi)存管理的理解,最終目的是把我們在內(nèi)核開發(fā)中使用內(nèi)存的經(jīng)驗和對 Linux 內(nèi)存管理的認識與大家共享。

進程如何使用內(nèi)存?

毫無疑問,所有進程(執(zhí)行的程序)都必須占用一定數(shù)量的內(nèi)存,它或是用來存放從磁盤載入的程序代碼,或是存放取自用戶輸入的數(shù)據(jù)等等。不過進程對這些內(nèi)存的管理方式因內(nèi)存用途不一而不盡相同,有些內(nèi)存是事先靜態(tài)分配和統(tǒng)一回收的,而有些卻是按需要動態(tài)分配和回收的。

對任何一個普通進程來講,它都會涉及到 5 種不同的數(shù)據(jù)段。稍有編程知識的朋友都能想到這幾個數(shù)據(jù)段中包含有“程序代碼段”、“程序數(shù)據(jù)段”、“程序堆棧段”等。不錯,這幾種數(shù)據(jù)段都在其中,但除了以上幾種數(shù)據(jù)段之外,進程還另外包含兩種數(shù)據(jù)段。下面我們來簡單歸納一下進程對應的內(nèi)存空間中所包含的 5 種不同的數(shù)據(jù)區(qū)。

代碼段:代碼段是用來存放可執(zhí)行文件的操作指令,也就是說是它是可執(zhí)行程序在內(nèi)存中的鏡像。代碼段需要防止在運行時被非法修改,所以只準許讀取操作,而不允許寫入(修改)操作——它是不可寫的。

數(shù)據(jù)段:數(shù)據(jù)段用來存放可執(zhí)行文件中已初始化全局變量,換句話說就是存放程序靜態(tài)分配的變量和全局變量。

BSS 段:BSS 段包含了程序中未初始化的全局變量,在內(nèi)存中 bss 段全部置零。

堆(heap):堆是用于存放進程運行中被動態(tài)分配的內(nèi)存段,它的大小并不固定,可動態(tài)擴張或縮減。當進程調(diào)用 malloc 等函數(shù)分配內(nèi)存時,新分配的內(nèi)存就被動態(tài)添加到堆上(堆被擴張);當利用 free 等函數(shù)釋放內(nèi)存時,被釋放的內(nèi)存從堆中被剔除(堆被縮減)

棧:棧是用戶存放程序臨時創(chuàng)建的局部變量,也就是說我們函數(shù)括弧“{}”中定義的變量(但不包括 static 聲明的變量,static 意味著在數(shù)據(jù)段中存放變量)。除此以外,在函數(shù)被調(diào)用時,其參數(shù)也會被壓入發(fā)起調(diào)用的進程棧中,并且待到調(diào)用結束后,函數(shù)的返回值也會被存放回棧中。由于棧的先進先出特點,所以棧特別方便用來保存 / 恢復調(diào)用現(xiàn)場。從這個意義上講,我們可以把堆??闯梢粋€寄存、交換臨時數(shù)據(jù)的內(nèi)存區(qū)。

進程如何組織這些區(qū)域?

上述幾種內(nèi)存區(qū)域中數(shù)據(jù)段、BSS 和堆通常是被連續(xù)存儲的——內(nèi)存位置上是連續(xù)的,而代碼段和棧往往會被獨立存放。有趣的是,堆和棧兩個區(qū)域關系很“曖昧”,他們一個向下“長”(i386 體系結構中棧向下、堆向上),一個向上“長”,相對而生。但你不必擔心他們會碰頭,因為他們之間間隔很大(到底大到多少,你可以從下面的例子程序計算一下),絕少有機會能碰到一起。

下圖簡要描述了進程內(nèi)存區(qū)域的分布:

“事實勝于雄辯”,我們用一個小例子(原形取自《User-Level Memory Management》)來展示上面所講的各種內(nèi)存區(qū)的差別與位置。

#include

它的結果如下

below are addresses of types of process s mem
Text location:
Address of main(Code Segment):0x8048388
____________________________
Stack Location:
Initial end of stack:0xbffffab4
new end of stack:0xbffffab0
____________________________
Data Location:
Address of data_var(Data Segment):0x8049758
New end of data_var(Data Segment):0x804975c
__________________________
BSS Location:
Address of bss_var:0x8049864
____________________________
Heap Location:
Initial end of heap:0x8049868
New end of heap:0x804986c

利用 size 命令也可以看到程序的各段大小,比如執(zhí)行 size example 會得到

text data bss dec hex filename
1654 280 8 1942 796 example

但這些數(shù)據(jù)是程序編譯的靜態(tài)統(tǒng)計,而上面顯示的是進程運行時的動態(tài)值,但兩者是對應的。

通過前面的例子,我們對進程使用的邏輯內(nèi)存分布已先睹為快。這部分我們就繼續(xù)進入操作系統(tǒng)內(nèi)核看看,進程對內(nèi)存具體是如何進行分配和管理的。

從用戶向內(nèi)核看,所使用的內(nèi)存表象形式會依次經(jīng)歷“邏輯地址”——“線性地址”——“物理地址”幾種形式(關于幾種地址的解釋在前面已經(jīng)講述了)。邏輯地址經(jīng)段機制轉(zhuǎn)化成線性地址;線性地址又經(jīng)過頁機制轉(zhuǎn)化為物理地址。(但是我們要知道 Linux 系統(tǒng)雖然保留了段機制,但是將所有程序的段地址都定死為 0 -4G,所以雖然邏輯地址和線性地址是兩種不同的地址空間,但在 Linux 中邏輯地址就等于線性地址,它們的值是一樣的)。沿著這條線索,我們所研究的主要問題也就集中在下面幾個問題。

1. 進程空間地址如何管理?

2. 進程地址如何映射到物理內(nèi)存?

3. 物理內(nèi)存如何被管理?

以及由上述問題引發(fā)的一些子問題。如系統(tǒng)虛擬地址分布;內(nèi)存分配接口;連續(xù)內(nèi)存分配與非連續(xù)內(nèi)存分配等。

進程內(nèi)存空間

Linux 操作系統(tǒng)采用虛擬內(nèi)存管理技術,使得每個進程都有各自互不干涉的進程地址空間。該空間是塊大小為 4G 的線性虛擬空間,用戶所看到和接觸到的都是該虛擬地址,無法看到實際的物理內(nèi)存地址。利用這種虛擬地址不但能起到保護操作系統(tǒng)的效果(用戶不能直接訪問物理內(nèi)存),而且更重要的是,用戶程序可使用比實際物理內(nèi)存更大的地址空間(具體的原因請看硬件基礎部分)。

在討論進程空間細節(jié)前,這里先要澄清下面幾個問題:

***、4G 的進程地址空間被人為的分為兩個部分——用戶空間與內(nèi)核空間。用戶空間從 0 到 3G(0xC0000000),內(nèi)核空間占據(jù) 3G 到 4G。用戶進程通常情況下只能訪問用戶空間的虛擬地址,不能訪問內(nèi)核空間虛擬地址。只有用戶進程進行系統(tǒng)調(diào)用(代表用戶進程在內(nèi)核態(tài)執(zhí)行)等時刻可以訪問到內(nèi)核空間。

第二、用戶空間對應進程,所以每當進程切換,用戶空間就會跟著變化;而內(nèi)核空間是由內(nèi)核負責映射,它并不會跟著進程改變,是固定的。內(nèi)核空間地址有自己對應的頁表(init_mm.pgd),用戶進程各自有不同的頁表。

第三、每個進程的用戶空間都是完全獨立、互不相干的。不信的話,你可以把上面的程序同時運行 10 次(當然為了同時運行,讓它們在返回前一同睡眠 100 秒吧),你會看到 10 個進程占用的線性地址一模一樣。

進程內(nèi)存管理

進程內(nèi)存管理的對象是進程線性地址空間上的內(nèi)存鏡像,這些內(nèi)存鏡像其實就是進程使用的虛擬內(nèi)存區(qū)域(memory region)。進程虛擬空間是個 32 或 64 位的“平坦”(獨立的連續(xù)區(qū)間)地址空間(空間的具體大小取決于體系結構)。要統(tǒng)一管理這么大的平坦空間可絕非易事,為了方便管理,虛擬空間被劃分為許多大小可變的 (但必須是 4096 的倍數(shù)) 內(nèi)存區(qū)域,這些區(qū)域在進程線性地址中像停車位一樣有序排列。這些區(qū)域的劃分原則是“將訪問屬性一致的地址空間存放在一起”,所謂訪問屬性在這里無非指的是“可讀、可寫、可執(zhí)行等”。

如果你要查看某個進程占用的內(nèi)存區(qū)域,可以使用命令 cat /proc/

/maps 獲得(pid 是進程號,你可以運行上面我們給出的例子——./example pid 便會打印到屏幕),你可以發(fā)現(xiàn)很多類似于下面的數(shù)字信息。

由于程序 example 使用了動態(tài)庫,所以除了 example 本身使用的的內(nèi)存區(qū)域外,還會包含那些動態(tài)庫使用的內(nèi)存區(qū)域(區(qū)域順序是:代碼段、數(shù)據(jù)段、bss 段)。

我們下面只抽出和 example 有關的信息,除了前兩行代表的代碼段和數(shù)據(jù)段外,*** 一行是進程使用的??臻g。

08048000-08049000 r-xp 00000000 03:03 439029 /home/mm/src/example 
08049000-0804a000 rw-p 00000000 03:03 439029 /home/mm/src/example
bfffe000 - c0000000 rwxp ffff000 00:00 0

每行數(shù)據(jù)格式如下:

(內(nèi)存區(qū)域)開始-結束 訪問權限 偏移 主設備號:次設備號 i 節(jié)點 文件。

注意,你一定會發(fā)現(xiàn)進程空間只包含三個內(nèi)存區(qū)域,似乎沒有上面所提到的堆、bss 等,其實并非如此,程序內(nèi)存段和進程地址空間中的內(nèi)存區(qū)域是種模糊對應,也就是說,堆、bss、數(shù)據(jù)段(初始化過的)都在進程空間中由數(shù)據(jù)段內(nèi)存區(qū)域表示。

在 Linux 內(nèi)核中對應進程內(nèi)存區(qū)域的數(shù)據(jù)結構是: vm_area_struct, 內(nèi)核將每個內(nèi)存區(qū)域作為一個單獨的內(nèi)存對象管理,相應的操作也都一致。采用面向?qū)ο蠓椒ㄊ?VMA 結構體可以代表多種類型的內(nèi)存區(qū)域--比如內(nèi)存映射文件或進程的用戶空間棧等,對這些區(qū)域的操作也都不盡相同。

vm_area_strcut 結構比較復雜,關于它的詳細結構請參閱相關資料。我們這里只對它的組織方法做一點補充說明。vm_area_struct 是描述進程地址空間的基本管理單元,對于一個進程來說往往需要多個內(nèi)存區(qū)域來描述它的虛擬空間,如何關聯(lián)這些不同的內(nèi)存區(qū)域呢?大家可能都會想到使用鏈表,的確 vm_area_struct 結構確實是以鏈表形式鏈接,不過為了方便查找,內(nèi)核又以紅黑樹(以前的內(nèi)核使用平衡樹)的形式組織內(nèi)存區(qū)域,以便降低搜索耗時。并存的兩種組織形式,并非冗余:鏈表用于需要遍歷全部節(jié)點的時候用,而紅黑樹適用于在地址空間中定位特定內(nèi)存區(qū)域的時候。內(nèi)核為了內(nèi)存區(qū)域上的各種不同操作都能獲得高性能,所以同時使用了這兩種數(shù)據(jù)結構。

下圖反映了進程地址空間的管理模型:

進程的地址空間對應的描述結構是“內(nèi)存描述符結構”, 它表示進程的全部地址空間,——包含了和進程地址空間有關的全部信息,其中當然包含進程的內(nèi)存區(qū)域。

看完上述內(nèi)容,你們對怎么從開發(fā)者的角度學習 Linux 內(nèi)存管理有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注丸趣 TV 行業(yè)資訊頻道,感謝大家的支持。

正文完
 
丸趣
版權聲明:本站原創(chuàng)文章,由 丸趣 2023-08-25發(fā)表,共計4318字。
轉(zhuǎn)載說明:除特殊說明外本站除技術相關以外文章皆由網(wǎng)絡搜集發(fā)布,轉(zhuǎn)載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 安义县| 黎城县| 中方县| 兴山县| 内丘县| 界首市| 南通市| 宁都县| 兴和县| 寿阳县| 临西县| 天峨县| 安仁县| 昆山市| 汕头市| 柘荣县| 新乐市| 桂平市| 双城市| 钟山县| 乌拉特中旗| 色达县| 来凤县| 荃湾区| 佳木斯市| 英德市| 芒康县| 嫩江县| 宜阳县| 乐业县| 桑日县| 银川市| 留坝县| 海兴县| 杨浦区| 四子王旗| 宁晋县| 嘉义县| 加查县| 宁国市| 旅游|