進(jìn)程間通信 提供更強(qiáng)的安全保障

2020-12-16 10:06:22

使用多進(jìn)程協(xié)作來實(shí)現(xiàn)應(yīng)用和系統(tǒng)是一種被廣泛使用的開發(fā)方法。多進(jìn)程協(xié)作主要有以下三點(diǎn)優(yōu)勢(shì)。

將功能模塊化,避免重復(fù)造輪子。

增強(qiáng)模塊間的隔離,提供更強(qiáng)的安全保障。

提高應(yīng)用的容錯(cuò)能力。

進(jìn)程間通信(Inter-Process Communication,IPC)則是多進(jìn)程協(xié)作的基礎(chǔ)。一般而言,IPC至少需要兩方(如兩個(gè)進(jìn)程)參與。根據(jù)信息流動(dòng)的方向,這兩方通常被稱為發(fā)送者和接收者。在實(shí)際使用中,IPC經(jīng)常被用于服務(wù)調(diào)用,因此參與IPC的兩方又被稱為調(diào)用者和被調(diào)用者,或者客戶端和服務(wù)端。

圖7-1是一個(gè)簡(jiǎn)單的IPC設(shè)計(jì)。它假設(shè)內(nèi)核已為兩個(gè)進(jìn)程映射了一段共享內(nèi)存,且共享內(nèi)存剛好可以存放兩個(gè)消息(發(fā)送者消息和接受者消息)。

01 進(jìn)程間通信的重要功能

數(shù)據(jù)傳遞:消息傳遞(message passing)是IPC中常用的數(shù)據(jù)傳遞方式,即將數(shù)據(jù)抽象成一個(gè)個(gè)的消息進(jìn)行傳遞。不同的IPC設(shè)計(jì)有不同的消息抽象,且消息傳遞往往需要一個(gè)“中間人”(如共享內(nèi)存)。

控制流轉(zhuǎn)移:當(dāng)一個(gè)通信發(fā)生時(shí),內(nèi)核將控制流從發(fā)送者進(jìn)程切換到接收者進(jìn)程(返回的過程類似)。IPC中的控制流轉(zhuǎn)移,通常是利用內(nèi)核對(duì)進(jìn)程的運(yùn)行狀態(tài)和運(yùn)行時(shí)間的控制來實(shí)現(xiàn)的。

02 進(jìn)程間通信的分類

單向IPC、雙向IPC、單/雙向IPC:?jiǎn)蜗騃PC通常指消息在一個(gè)連接上只能從一端發(fā)送到另一端,雙向IPC則允許雙方互相發(fā)送消息。而單/雙向IPC則會(huì)根據(jù)通信中具體的配置選項(xiàng)等來判斷是否需要支持單向或雙向的通信。實(shí)際中,很多系統(tǒng)選擇的是單/雙向IPC,這樣可以比較好地支持各種場(chǎng)景。當(dāng)然,如管道、信號(hào)等只支持單向IPC的機(jī)制在實(shí)際中同樣有較多的應(yīng)用。

同步IPC和異步IPC:簡(jiǎn)單來看,同步IPC指它的IPC操作(如Send)會(huì)阻塞進(jìn)程直到該操作完成;而異步IPC則通常是非阻塞的,進(jìn)程只要發(fā)起一次操作即可返回,而不需要等待其完成。相比異步而言,同步IPC有著更好的編程抽象。然而同步IPC在操作系統(tǒng)的發(fā)展中,逐漸表現(xiàn)出一些不足。一個(gè)典型的問題是并發(fā)??偟膩砜?,目前大部分操作系統(tǒng)內(nèi)核都會(huì)選擇同時(shí)實(shí)現(xiàn)同步和異步IPC,以滿足不同的應(yīng)用需求。

03 進(jìn)程間通信的相關(guān)機(jī)制

超時(shí)機(jī)制:超時(shí)機(jī)制擴(kuò)展了IPC通信雙方的接口,允許發(fā)送者/接收者指定它們發(fā)送/接收請(qǐng)求的等待時(shí)間。比如,一個(gè)應(yīng)用程序可以花費(fèi)5秒等待文件系統(tǒng)進(jìn)程的IPC請(qǐng)求處理操作。如果超過5秒仍然沒有反饋,則由操作系統(tǒng)內(nèi)核結(jié)束這次IPC調(diào)用,返回一個(gè)超時(shí)的錯(cuò)誤。

通信連接管理:對(duì)于基于共享內(nèi)存的進(jìn)程間通信方案,通信連接的建立通常是在建立共享區(qū)域的一瞬間完成的;而對(duì)于涉及內(nèi)核的控制流轉(zhuǎn)移的通信而言,通信連接管理是內(nèi)核IPC模塊的很重要的一部分。雖然實(shí)際的系統(tǒng)中會(huì)有各種不同的實(shí)現(xiàn),但是它們大部分可以被歸為兩類——直接通信和間接通信。直接通信是指通信的進(jìn)程一方需要顯式地標(biāo)識(shí)另一方。間接通信需要經(jīng)過一個(gè)中間的信箱來完成通信,每個(gè)信箱有自己唯一的標(biāo)識(shí)符,而進(jìn)程間通過共享一個(gè)信箱來交換消息。

權(quán)限檢查:進(jìn)程間通信通常依賴于一套權(quán)限檢查的機(jī)制來保證連接的安全性。例如,seL4等微內(nèi)核系統(tǒng)中的Capability機(jī)制,會(huì)將所有的通信連接抽象成一個(gè)個(gè)的內(nèi)核對(duì)象。而每個(gè)進(jìn)程對(duì)內(nèi)核對(duì)象的訪問權(quán)限(以及能夠在該內(nèi)核對(duì)象上執(zhí)行的操作)由Capability來刻畫。當(dāng)一個(gè)進(jìn)程企圖和某其他進(jìn)程通信時(shí),內(nèi)核會(huì)檢查該進(jìn)程是否擁有一個(gè)Capability,是否有足夠的權(quán)限訪問一個(gè)連接對(duì)象并且對(duì)象是指向目標(biāo)進(jìn)程的。類似地,宏內(nèi)核,如Linux系統(tǒng),通常會(huì)復(fù)用其有效用戶/有效組的文件權(quán)限,以刻畫進(jìn)程對(duì)于某個(gè)連接的權(quán)限。

命名服務(wù):命名服務(wù)像是一個(gè)全局的看板,可以協(xié)調(diào)服務(wù)端進(jìn)程和客戶端進(jìn)程之間的信息。簡(jiǎn)單來說,服務(wù)端進(jìn)程可以將自己提供的服務(wù)告訴命名服務(wù)進(jìn)程,比如文件系統(tǒng)進(jìn)程可以注冊(cè)一個(gè)“文件系統(tǒng)服務(wù)”,網(wǎng)絡(luò)系統(tǒng)進(jìn)程可以注冊(cè)一個(gè)“網(wǎng)絡(luò)服務(wù)”。而客戶端進(jìn)程可以去命名服務(wù)上查詢當(dāng)前的服務(wù),并選擇自己希望建立連接的服務(wù)去嘗試獲取權(quán)限。具體是否分發(fā)權(quán)限給對(duì)應(yīng)的客戶端進(jìn)程,是由命名服務(wù)和對(duì)應(yīng)的服務(wù)端進(jìn)程根據(jù)特定的策略來判斷的。

04 宏內(nèi)核進(jìn)程間通信

宏內(nèi)核下的典型的進(jìn)程間通信機(jī)制,具體包括管道,System V中的消息隊(duì)列、信號(hào)量、共享內(nèi)存,Linux信號(hào)機(jī)制,以及套接字機(jī)制(socket)。

宏內(nèi)核操作系統(tǒng)中進(jìn)程間通信更多的是應(yīng)用之間的交互,因此,設(shè)計(jì)的重心通常會(huì)放在接口的易用性、穩(wěn)定性等方面。圖7-5給出了典型的宏內(nèi)核進(jìn)程間通信機(jī)制的對(duì)比??梢钥吹?,雖然在IPC的幾個(gè)設(shè)計(jì)角度上幾個(gè)方案都各有異同,但是它們之間的主要區(qū)別是在數(shù)據(jù)抽象上。在實(shí)際的應(yīng)用中,雖然多種IPC方案都可以作為通信的選擇,但是應(yīng)用程序往往會(huì)根據(jù)對(duì)數(shù)據(jù)抽象的需求來選擇具體的方案。

05 微內(nèi)核進(jìn)程間通信

由于進(jìn)程間通信對(duì)于微內(nèi)核系統(tǒng)性能的重要意義,大部分微內(nèi)核操作系統(tǒng)都會(huì)優(yōu)先從性能角度來設(shè)計(jì)和實(shí)現(xiàn)進(jìn)程間通信。

Mach:早期的微內(nèi)核進(jìn)程間通信設(shè)計(jì)

Mach通過兩種基本的抽象——端口(port)和消息(message),設(shè)計(jì)和實(shí)現(xiàn)了一種間接通信IPC:通信的雙方不需要顯式指定另一方,而是通過端口進(jìn)行通信(對(duì)應(yīng)于“信箱”)。進(jìn)程之間通過端口流通的數(shù)據(jù)就是消息。

作為一個(gè)早期的微內(nèi)核系統(tǒng),Mach系統(tǒng)的性能比起當(dāng)時(shí)的宏內(nèi)核系統(tǒng)(如UNIX)還是存在不小的差距。其中一個(gè)原因是Mach為了實(shí)現(xiàn)大量的目標(biāo),如可裁剪性、可移植性等,導(dǎo)致其內(nèi)核復(fù)雜,且代碼量較大。不過,Mach的IPC設(shè)計(jì)仍對(duì)后來的很多系統(tǒng)有著非常重大的影響。Mach中端口和消息的設(shè)計(jì)使得進(jìn)程間的通信和具體的進(jìn)程是隔離開的。只要一個(gè)進(jìn)程擁有某個(gè)端口,其就能夠通過這個(gè)端口和“另一端”的進(jìn)程進(jìn)行通信。后續(xù)的微內(nèi)核系統(tǒng)設(shè)計(jì)大都考慮了Mach的思想,不管是借鑒其設(shè)計(jì)還是將其缺陷引以為戒。

L4:圍繞進(jìn)程間通信優(yōu)化而設(shè)計(jì)的微內(nèi)核系統(tǒng)

根據(jù)Mach的經(jīng)驗(yàn),Liedtke等研究人員開始研發(fā)L4系列的微內(nèi)核系統(tǒng)。L4系列微內(nèi)核系統(tǒng)的一個(gè)突出思路是:進(jìn)程間通信是微內(nèi)核的核心功能,需要圍繞通信去完成整個(gè)系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)。L4是當(dāng)下仍然十分主流的微內(nèi)核系統(tǒng),特別是后續(xù)衍生出了各種變體和相關(guān)的系統(tǒng)。

在L4微內(nèi)核中,內(nèi)核只保留了基本的功能,包括地址空間、線程、進(jìn)程間通信等,并且不考慮如兼容性等要求,而是選擇針對(duì)特定硬件做極致的性能優(yōu)化。這樣做的好處就是內(nèi)核的代碼量非常少,可以把少量的功能盡可能支持好。

LRPC:遷移線程模型

遷移線程(thread migration)是一個(gè)比較“極端”的優(yōu)化性能的IPC設(shè)計(jì)。截止到目前,我們了解到優(yōu)化IPC性能的大部分工作會(huì)關(guān)注兩個(gè)部分:優(yōu)化控制流切換的性能和優(yōu)化數(shù)據(jù)傳輸?shù)男阅?。遷移線程認(rèn)為,其他的IPC設(shè)計(jì)可以看成將需要處理的數(shù)據(jù)發(fā)送到另一個(gè)進(jìn)程并讓其處理。這也是為什么控制流切換和數(shù)據(jù)傳輸會(huì)成為主要的瓶頸。如果換一個(gè)角度,將另一個(gè)進(jìn)程處理數(shù)據(jù)的代碼拉到當(dāng)前進(jìn)程,那么我們是不是可以避免控制流的切換(仍然是當(dāng)前進(jìn)程處理)以及數(shù)據(jù)傳輸(數(shù)據(jù)已經(jīng)準(zhǔn)備在當(dāng)前進(jìn)程中)呢?遷移線程就是圍繞這個(gè)新的視角進(jìn)行設(shè)計(jì)的。

遷移線程方案被用在LRPC、Mach(優(yōu)化版本)等系統(tǒng)中,是目前純軟件進(jìn)程間通信優(yōu)化中效果最好的設(shè)計(jì)之一。遷移線程的基本原則是:簡(jiǎn)化控制流切換,讓客戶端線程執(zhí)行“服務(wù)端的代碼”;簡(jiǎn)化數(shù)據(jù)傳輸,共享參數(shù)棧和寄存器;簡(jiǎn)化接口,減少序列化等開銷;優(yōu)化并發(fā),避免共享的全局?jǐn)?shù)據(jù)結(jié)構(gòu)。其中,前兩點(diǎn)原則都基于“將代碼拉到本地”這個(gè)新的視角。

遷移線程IPC和主流IPC設(shè)計(jì)的對(duì)比如圖7-13所示。要做到“將代碼拉到本地”,遷移線程首先需要對(duì)線程結(jié)構(gòu)進(jìn)行解耦,明確線程中哪些部分是對(duì)通信請(qǐng)求處理起關(guān)鍵作用的。然后,這部分允許被調(diào)用者(負(fù)責(zé)處理請(qǐng)求的邏輯)運(yùn)行在調(diào)用者的上下文中,將跨進(jìn)程調(diào)用變成更接近函數(shù)調(diào)用的形式。

如果使用遷移線程模型,在進(jìn)程間通信過程中,內(nèi)核不會(huì)阻塞調(diào)用者線程,但是會(huì)讓調(diào)用者線程執(zhí)行被調(diào)用者的代碼。整個(gè)過程沒有被調(diào)用者線程被喚醒,相反,被調(diào)用者端更像是一個(gè)“代碼提供者”。此外,內(nèi)核不會(huì)進(jìn)行完整的上下文切換,而是只切換地址空間(頁(yè)表)等和請(qǐng)求處理相關(guān)的系統(tǒng)狀態(tài)。其中,不會(huì)涉及線程和優(yōu)先級(jí)的切換,也不會(huì)調(diào)用調(diào)度器。遷移線程的優(yōu)點(diǎn)在于減少了內(nèi)核調(diào)度的時(shí)間,并簡(jiǎn)化了內(nèi)核中的IPC處理。在多核場(chǎng)景下,遷移線程方案還可以避免跨核通信引入的開銷。

06 案例分析:Android Binder

在Android場(chǎng)景下,進(jìn)程間通信在大部分情況下做的其實(shí)是“遠(yuǎn)程過程調(diào)用”。服務(wù)端進(jìn)程負(fù)責(zé)提供具體的服務(wù),客戶端進(jìn)程則通過進(jìn)程間通信來發(fā)起服務(wù)請(qǐng)求,并獲得服務(wù)端進(jìn)程處理后的結(jié)果。除了通信雙方進(jìn)程外,在Binder IPC中還引入了一個(gè)Context Manager進(jìn)程。Context Manager提供命名服務(wù),它的任務(wù)是建立通信連接。在Binder IPC的內(nèi)核設(shè)計(jì)中,提供了句柄(handle)的抽象來表示IPC對(duì)象(即一個(gè)通信連接)。句柄和我們熟悉的文件描述符其實(shí)很相似,用戶通過對(duì)句柄的操作來發(fā)起對(duì)特定進(jìn)程的通信。

和之前的進(jìn)程間通信設(shè)計(jì)不同的一點(diǎn)是,Binder IPC中采用了“線程池”的服務(wù)端模型。也就是說,在服務(wù)端中,Binder的用戶態(tài)和內(nèi)核會(huì)有一個(gè)響應(yīng)線程池的概念。當(dāng)某個(gè)客戶端進(jìn)程發(fā)起通信時(shí),內(nèi)核會(huì)從(服務(wù)端的)線程池中選擇一個(gè)可用的線程來響應(yīng)。這種設(shè)計(jì)能夠在同步進(jìn)程間通信的情況下比較好地處理并發(fā)的通信請(qǐng)求。

標(biāo)簽: 進(jìn)程間通信

關(guān)閉
新聞速遞