linux線程該如何淺析

160次閱讀

共計(jì) 4462 個(gè)字符，預(yù)計(jì)需要花費(fèi) 12 分鐘才能閱讀完成。

本篇文章為大家展示了 linux 線程該如何淺析，內(nèi)容簡(jiǎn)明扼要并且容易理解，絕對(duì)能使你眼前一亮，通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

在許多經(jīng)典的操作系統(tǒng)教科書中, 總是把進(jìn)程定義為程序的執(zhí)行實(shí)例, 它并不執(zhí)行什么, 只是維護(hù)應(yīng)用程序所需的各種資源. 而線程則是真正的執(zhí)行實(shí)體. 為了讓進(jìn)程完成一定的工作, 進(jìn)程必須至少包含一個(gè)線程.

進(jìn)程所維護(hù)的是程序所包含的資源(靜態(tài)資源), 如: 地址空間, 打開(kāi)的文件句柄集, 文件系統(tǒng)狀態(tài), 信號(hào)處理 handler, 等; 線程所維護(hù)的運(yùn)行相關(guān)的資源(動(dòng)態(tài)資源), 如: 運(yùn)行棧, 調(diào)度相關(guān)的控制信息, 待處理的信號(hào)集, 等;

然而, 一直以來(lái), linux 內(nèi)核并沒(méi)有線程的概念. 每一個(gè)執(zhí)行實(shí)體都是一個(gè) task_struct 結(jié)構(gòu), 通常稱之為進(jìn)程. 進(jìn)程是一個(gè)執(zhí)行單元, 維護(hù)著執(zhí)行相關(guān)的動(dòng)態(tài)資源. 同時(shí), 它又引用著程序所需的靜態(tài)資源(注意這里說(shuō)的是 linux 中的進(jìn)程). 通過(guò)系統(tǒng)調(diào)用 clone 創(chuàng)建子進(jìn)程時(shí), 可以有選擇性地讓子進(jìn)程共享父進(jìn)程所引用的資源. 這樣的子進(jìn)程通常稱為輕量級(jí)進(jìn)程.

linux 上的線程就是基于輕量級(jí)進(jìn)程, 由用戶態(tài)的 pthread 庫(kù)實(shí)現(xiàn)的. 使用 pthread 以后, 在用戶看來(lái), 每一個(gè) task_struct 就對(duì)應(yīng)一個(gè)線程, 而一組線程以及它們所共同引用的一組資源就是一個(gè)進(jìn)程.

但是, 一組線程并不僅僅是引用同一組資源就夠了, 它們還必須被視為一個(gè)整體. 對(duì)此, POSIX 標(biāo)準(zhǔn)提出了如下要求:

(1) 查看進(jìn)程列表的時(shí)候, 相關(guān)的一組 task_struct 應(yīng)當(dāng)被展現(xiàn)為列表中的一個(gè)節(jié)點(diǎn);

(2) 發(fā)送給這個(gè) 進(jìn)程的信號(hào)(對(duì)應(yīng) kill 系統(tǒng)調(diào)用), 將被對(duì)應(yīng)的這一組 task_struct 所共享, 并且被其中的任意一個(gè) 線程處理;

(3) 發(fā)送給某個(gè) 線程的信號(hào)(對(duì)應(yīng) pthread_kill), 將只被對(duì)應(yīng)的一個(gè) task_struct 接收, 并且由它自己來(lái)處理;

(4) 當(dāng) 進(jìn)程被停止或繼續(xù)時(shí)(對(duì)應(yīng) SIGSTOP/SIGCONT 信號(hào)), 對(duì)應(yīng)的這一組 task_struct 狀態(tài)將改變;

(5) 當(dāng) 進(jìn)程收到一個(gè)致命信號(hào)(比如由于段錯(cuò)誤收到 SIGSEGV 信號(hào)), 對(duì)應(yīng)的這一組 task_struct 將全部退出;

(6) 等等(以上可能不夠全);

1. Linuxthreads

在 linux 2.6 以前, pthread 線程庫(kù)對(duì)應(yīng)的實(shí)現(xiàn)是一個(gè)名叫 linuxthreads 的 lib. linuxthreads 利用前面提到的輕量級(jí)進(jìn)程來(lái)實(shí)現(xiàn)線程, 但是對(duì)于 POSIX 提出的那些要求, linuxthreads 除了第 5 點(diǎn)以外, 都沒(méi)有實(shí)現(xiàn)(實(shí)際上是無(wú)能為力):

(1) 如果運(yùn)行了 A 程序, A 程序創(chuàng)建了 10 個(gè)線程, 那么在 shell 下執(zhí)行 ps 命令時(shí)將看到 11 個(gè) A 進(jìn)程, 而不是 1 個(gè)(注意, 也不是 10 個(gè), 下面會(huì)解釋);

(2) 不管是 kill 還是 pthread_kill, 信號(hào)只能被一個(gè)對(duì)應(yīng)的線程所接收;

(3) SIGSTOP/SIGCONT 信號(hào)只對(duì)一個(gè)線程起作用。

還好 linuxthreads 實(shí)現(xiàn)了第 5 點(diǎn), 我認(rèn)為這一點(diǎn)是最重要的. 如果某個(gè)線程掛了, 整個(gè)進(jìn)程還在若無(wú)其事地運(yùn)行著, 可能會(huì)出現(xiàn)很多的不一致?tīng)顟B(tài). 進(jìn)程將不是一個(gè)整體, 而線程也不能稱為線程. 或許這也是為什么 linuxthreads 雖然與 POSIX 的要求差距甚遠(yuǎn), 卻能夠存在, 并且還被使用了好幾年的原因吧~。但是, linuxthreads 為了實(shí)現(xiàn)這個(gè) 第 5 點(diǎn) , 還是付出了很多代價(jià), 并且創(chuàng)造了 linuxthreads 本身的一大性能瓶頸.

接下來(lái)要說(shuō)說(shuō), 為什么 A 程序創(chuàng)建了 10 個(gè)線程, 但是 ps 時(shí)卻會(huì)出現(xiàn) 11 個(gè) A 進(jìn)程了. 因?yàn)?linuxthreads 自動(dòng)創(chuàng)建了一個(gè)管理線程. 上面提到的第 5 點(diǎn) 就是靠管理線程來(lái)實(shí)現(xiàn)的. 當(dāng)程序開(kāi)始運(yùn)行時(shí), 并沒(méi)有管理線程存在 (因?yàn)楸M管程序已經(jīng)鏈接了 pthread 庫(kù), 但是未必會(huì)使用多線程). 程序 *** 次調(diào)用 pthread_create 時(shí), linuxthreads 發(fā)現(xiàn)管理線程不存在, 于是創(chuàng)建這個(gè)管理線程. 這個(gè)管理線程是進(jìn)程中的 *** 個(gè)線程(主線程) 的兒子. 然后在 pthread_create 中, 會(huì)通過(guò) pipe 向管理線程發(fā)送一個(gè)命令, 告訴它創(chuàng)建線程. 即是說(shuō), 除主線程外, 所有的線程都是由管理線程來(lái)創(chuàng)建的, 管理線程是它們的父親. 于是, 當(dāng)任何一個(gè)子線程退出時(shí), 管理線程將收到 SIGUSER1 信號(hào)(這是在通過(guò) clone 創(chuàng)建子線程時(shí)指定的). 管理線程在對(duì)應(yīng)的 sig_handler 中會(huì)判斷子線程是否正常退出, 如果不是, 則殺死所有線程, 然后自殺. 那么, 主線程怎么辦呢? 主線程是管理線程的父親, 其退出時(shí)并不會(huì)給管理線程發(fā)信號(hào). 于是, 在管理線程的主循環(huán)中通過(guò) getppid 檢查父進(jìn)程的 ID 號(hào), 如果 ID 號(hào)是 1, 說(shuō)明父親已經(jīng)退出, 并把自己托管給了 init 進(jìn)程(1 號(hào)進(jìn)程). 這時(shí)候, 管理線程也會(huì)殺掉所有子線程, 然后自殺. 那么, 如果主線程是調(diào)用 pthread_exit 主動(dòng)退出的呢? 按照 posix 的標(biāo)準(zhǔn)，這種情況下其他子線程是應(yīng)該繼續(xù)運(yùn)行的. 于是, 在 linuxthreads 中, 主線程調(diào)用 pthread_exit 以后并不會(huì)真正退出, 而是會(huì)在 pthread_exit 函數(shù)中阻塞等待所有子線程都退出了, pthread_exit 才會(huì)讓主線程退出. (在這個(gè)等等過(guò)程中, 主線程一直處于睡眠狀態(tài).)

可見(jiàn), 線程的創(chuàng)建與銷毀都是通過(guò)管理線程來(lái)完成的, 于是管理線程就成了 linuxthreads 的一個(gè)性能瓶頸. 創(chuàng)建與銷毀需要一次進(jìn)程間通信, 一次上下文切換之后才能被管理線程執(zhí)行, 并且多個(gè)請(qǐng)求會(huì)被管理線程串行地執(zhí)行.

2. NPTL

到了 linux 2.6, glibc 中有了一種新的 pthread 線程庫(kù) –NPTL(Native POSIX Threading Library). NPTL 實(shí)現(xiàn)了前面提到的 POSIX 的全部 5 點(diǎn)要求. 但是, 實(shí)際上, 與其說(shuō)是 NPTL 實(shí)現(xiàn)了, 不如說(shuō)是 linux 內(nèi)核實(shí)現(xiàn)了.

在 linux 2.6 中, 內(nèi)核有了線程組的概念, task_struct 結(jié)構(gòu)中增加了一個(gè) tgid(thread group id)字段. 如果這個(gè) task 是一個(gè) 主線程 , 則它的 tgid 等于 pid, 否則 tgid 等于進(jìn)程的 pid(即主線程的 pid). 在 clone 系統(tǒng)調(diào)用中, 傳遞 CLONE_THREAD 參數(shù)就可以把新進(jìn)程的 tgid 設(shè)置為父進(jìn)程的 tgid(否則新進(jìn)程的 tgid 會(huì)設(shè)為其自身的 pid).

類似的 XXid 在 task_struct 中還有兩個(gè)：task- signal- pgid 保存進(jìn)程組的打頭進(jìn)程的 pid、task- signal- session 保存會(huì)話打頭進(jìn)程的 pid。通過(guò)這兩個(gè) id 來(lái)關(guān)聯(lián)進(jìn)程組和會(huì)話。

有了 tgid, 內(nèi)核或相關(guān)的 shell 程序就知道某個(gè) tast_struct 是代表一個(gè)進(jìn)程還是代表一個(gè)線程, 也就知道在什么時(shí)候該展現(xiàn)它們, 什么時(shí)候不該展現(xiàn)(比如在 ps 的時(shí)候, 線程就不要展現(xiàn)了).

而 getpid(獲取進(jìn)程 ID)系統(tǒng)調(diào)用返回的也是 tast_struct 中的 tgid, 而 tast_struct 中的 pid 則由 gettid 系統(tǒng)調(diào)用來(lái)返回.

在執(zhí)行 ps 命令的時(shí)候不展現(xiàn)子線程，也是有一些問(wèn)題的。比如程序 a.out 運(yùn)行時(shí)，創(chuàng)建了一個(gè)線程。假設(shè)主線程的 pid 是 10001、子線程是 10002（它們的 tgid 都是 10001）。這時(shí)如果你 kill 10002，是可以把 10001 和 10002 這兩個(gè)線程一起殺死的，盡管執(zhí)行 ps 命令的時(shí)候根本看不到 10002 這個(gè)進(jìn)程。如果你不知道 linux 線程背后的故事，肯定會(huì)覺(jué)得遇到靈異事件了。

我們可以作如下驗(yàn)證，有程序段 test.cpp 如下：

#include  unistd.h  #include  stdlib.h  #include  stdio.h  #include  pthread.h  using namespace std; void* doit(void*); int main(void) { pthread_t tid; pthread_create( tid,NULL,doit,NULL); pause();// 主線程掛起（否則主線程終止，子線程也就掛了） } void* doit(void* agr) { printf( thread is created!\n  pause(); // 掛起線程  }

這個(gè)程序創(chuàng)建一個(gè)線程后掛起，子線程在輸出“thread is created!”也掛起。運(yùn)行結(jié)果如圖 1.

圖 1

之后查看進(jìn)程 pid，發(fā)現(xiàn) a.out 的 pid 是 23130，我們使用 kill 終止 pid 為 23131 的進(jìn)程（注意 ps 中并沒(méi)有這個(gè)進(jìn)程），如圖 2.

圖 2

但是結(jié)果發(fā)現(xiàn)，a.out 進(jìn)程也終止了，如圖 3. 其原因就是 23131 就是所創(chuàng)建線程的 pid，線程異常終止了，進(jìn)程也就終止了。

圖 3

為了應(yīng)付發(fā)送給進(jìn)程的信號(hào) 和發(fā)送給線程的信號(hào) ,task_struct 里面維護(hù)了兩套 signal_pending, 一套是線程組共享的, 一套是線程獨(dú)有的. 通過(guò) kill 發(fā)送的信號(hào)被放在線程組共享的 signal_pending 中, 可以由任意一個(gè)線程來(lái)處理; 通過(guò) pthread_kill 發(fā)送的信號(hào) (pthread_kill 是 pthread 庫(kù)的接口, 對(duì)應(yīng)的系統(tǒng)調(diào)用中 tkill) 被放在線程獨(dú)有的 signal_pending 中, 只能由本線程來(lái)處理. 當(dāng)線程停止 / 繼續(xù), 或者是收到一個(gè)致命信號(hào)時(shí), 內(nèi)核會(huì)將處理動(dòng)作施加到整個(gè)線程組中.

3. NGPT

說(shuō)到這里, 也順便提一下 NGPT(Next Generation POSIX Threads). 上面提到的兩種線程庫(kù)使用的都是內(nèi)核級(jí)線程(每個(gè)線程都對(duì)應(yīng)內(nèi)核中的一個(gè)調(diào)度實(shí)體), 這種模型稱為 1:1 模型(1 個(gè)線程對(duì)應(yīng) 1 個(gè)內(nèi)核級(jí)線程); 而 NGPT 則打算實(shí)現(xiàn) M:N 模型(M 個(gè)線程對(duì)應(yīng) N 個(gè)內(nèi)核級(jí)線程), 也就是說(shuō)若干個(gè)線程可能是在同一個(gè)執(zhí)行實(shí)體上實(shí)現(xiàn)的.

線程庫(kù)需要在一個(gè)內(nèi)核提供的執(zhí)行實(shí)體上抽象出若干個(gè)執(zhí)行實(shí)體, 并實(shí)現(xiàn)它們之間的調(diào)度. 這樣被抽象出來(lái)的執(zhí)行實(shí)體稱為用戶級(jí)線程. 大體上, 這可以通過(guò)為每個(gè)用戶級(jí)線程分配一個(gè)棧, 然后通過(guò) longjmp 的方式進(jìn)行上下文切換. (百度一下 setjmp/longjmp , 你就知道.)但是實(shí)際上要處理的細(xì)節(jié)問(wèn)題非常之多. 目前的 NGPT 好像并沒(méi)有實(shí)現(xiàn)所有預(yù)期的功能, 并且暫時(shí)也不準(zhǔn)備去實(shí)現(xiàn).

用戶級(jí)線程的切換顯然要比內(nèi)核級(jí)線程的切換快一些, 前者可能只是一個(gè)簡(jiǎn)單的長(zhǎng)跳轉(zhuǎn), 而后者則需要保存 / 裝載寄存器, 進(jìn)入然后退出內(nèi)核態(tài). (進(jìn)程切換則還需要切換地址空間等.)而用戶級(jí)線程則不能享受多處理器, 因?yàn)槎鄠€(gè)用戶級(jí)線程對(duì)應(yīng)到一個(gè)內(nèi)核級(jí)線程上, 一個(gè)內(nèi)核級(jí)線程在同一時(shí)刻只能運(yùn)行在一個(gè)處理器上.

不過(guò), M:N 的線程模型畢竟提供了這樣一種手段, 可以讓不需要并行執(zhí)行的線程運(yùn)行在一個(gè)內(nèi)核級(jí)線程對(duì)應(yīng)的若干個(gè)用戶級(jí)線程上, 可以節(jié)省它們的切換開(kāi)銷. 據(jù)說(shuō)一些類 UNIX 系統(tǒng) (如 Solaris) 已經(jīng)實(shí)現(xiàn)了比較成熟的 M:N 線程模型, 其性能比起 linux 的線程還是有著一定的優(yōu)勢(shì).

上述內(nèi)容就是 linux 線程該如何淺析，你們學(xué)到知識(shí)或技能了嗎？如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備，歡迎關(guān)注丸趣 TV 行業(yè)資訊頻道。

正文完