摘 要:大多數(shù)嵌入式操作系統(tǒng)在進(jìn)入中斷后進(jìn)行中斷現(xiàn)場保護(hù)時(shí)選擇保護(hù)所有通用寄存器,這種普遍的做法延長了微處理器的訪存時(shí)間,并且增加了產(chǎn)生存儲(chǔ)器分體沖突的可能性。本文提出根據(jù)中斷服務(wù)子程序?qū)νㄓ眉拇嫫鞯男枨蠖M(jìn)行中斷現(xiàn)場保護(hù)的策略,有效減少了中斷現(xiàn)場保護(hù)時(shí)所需保護(hù)的通用寄存器數(shù)量,縮短了中斷響應(yīng)時(shí)間,提高了系統(tǒng)的中斷實(shí)時(shí)性。最后,對(duì)這種優(yōu)化策略進(jìn)行了總結(jié)。
關(guān)鍵詞:嵌入式系統(tǒng)、實(shí)時(shí)性、中斷響應(yīng)、中斷延遲、現(xiàn)場保護(hù)
一、嵌入式系統(tǒng)的實(shí)時(shí)性
嵌入式系統(tǒng)是以應(yīng)用為中心,以計(jì)算機(jī)技術(shù)為基礎(chǔ),并且軟硬件可裁剪,適用于應(yīng)用系統(tǒng)對(duì)功能、可靠性、成本、體積、功耗有嚴(yán)格要求的專用計(jì)算機(jī)系統(tǒng),而高實(shí)時(shí)性是嵌入式系統(tǒng)的基本要求。
IEEE(美國電氣電子工程師協(xié)會(huì))定義實(shí)時(shí)系統(tǒng)為“那些正確性不僅取決于計(jì)算的邏輯結(jié)果,也取決于產(chǎn)生結(jié)果所花費(fèi)的時(shí)間的系統(tǒng)”。實(shí)時(shí)系統(tǒng)一般可分為硬件實(shí)時(shí)和軟件實(shí)時(shí)這兩大類:硬實(shí)時(shí)系統(tǒng)有一個(gè)強(qiáng)制性的、不可改變的時(shí)間限制,它不允許任何超出時(shí)限的錯(cuò)誤。超時(shí)錯(cuò)誤會(huì)帶來損害甚至導(dǎo)致系統(tǒng)失效、或者系統(tǒng)不能實(shí)現(xiàn)它的預(yù)期目標(biāo)。軟實(shí)時(shí)系統(tǒng)的時(shí)限是柔性靈活的,它可以容忍偶然的超時(shí)錯(cuò)誤。失敗造成的后果并不嚴(yán)重,僅僅是輕微的降低了系統(tǒng)的吞吐量。
二、中斷響應(yīng)時(shí)間
中斷的實(shí)時(shí)性是實(shí)時(shí)系統(tǒng)的一個(gè)重要方面。中斷響應(yīng)時(shí)間是影響中斷實(shí)時(shí)性的主要因素。中斷響應(yīng)定義為從中斷發(fā)生到開始執(zhí)行用戶的中斷服務(wù)代碼來處理這個(gè)中斷的時(shí)間[1],其中包括中斷延遲時(shí)間和保護(hù)中斷現(xiàn)場的時(shí)間。所有實(shí)時(shí)系統(tǒng)在進(jìn)入臨界區(qū)代碼段之前都要關(guān)中斷,執(zhí)行完臨界代碼之后再開中斷。中斷延遲時(shí)間即是從發(fā)出中斷請(qǐng)求到任務(wù)開中斷的這段時(shí)間[1]。保護(hù)中斷現(xiàn)場有兩個(gè)作用。首先是為了保護(hù)中斷前任務(wù)的現(xiàn)場。其次,如果發(fā)生中斷嵌套,還必須保護(hù)上層中斷的現(xiàn)場。因此,整個(gè)中斷響應(yīng)過程如圖1所示。要讓中斷服務(wù)盡快得到處理,就必須減少中斷響應(yīng)時(shí)間。但是從圖中可以看出,中斷延遲時(shí)間是由中斷前任務(wù)決定的,在進(jìn)入中斷時(shí)只能通過盡量縮短中斷現(xiàn)場保護(hù)的時(shí)間來達(dá)到減少中斷響應(yīng)時(shí)間,從而提高中斷實(shí)時(shí)性。
[align=center]
圖1. 中斷響應(yīng)示意圖[/align]
三、中斷現(xiàn)場保護(hù)的改進(jìn)
3.1 傳統(tǒng)中斷現(xiàn)場保護(hù)方法
對(duì)于現(xiàn)在大多數(shù)嵌入式操作系統(tǒng),在進(jìn)入中斷時(shí)首先做的第一件事就是保護(hù)中斷發(fā)生前的現(xiàn)場,即保存返回地址、程序狀態(tài)字、堆棧指針以及所有通用寄存器到中斷堆棧,以防止用戶中斷服務(wù)子程序?qū)χ袛喾祷睾蟋F(xiàn)場的破壞。以µC/OS-II微內(nèi)核為例,在ARM和X86兩種體系結(jié)構(gòu)微處理器上進(jìn)入中斷后保存現(xiàn)場的過程如圖2所示。從代碼中可見,兩種不同的體系結(jié)構(gòu)中,為保護(hù)現(xiàn)場,都需要執(zhí)行三條訪存指令,其中一條為批量訪存指令(STMFD SP!,{R0-R12}和PUSHA)用以保護(hù)通用寄存器R0-R12和AX,CX,DX,BX,SP,BP,SI,DI。
[align=center]
圖2. ARM、X86上µC/OS-II中斷現(xiàn)場保護(hù)[/align]
根據(jù)量化公式:
公式中以CPU時(shí)間來衡量微處理器體系結(jié)構(gòu)的性能。其中前半部分是指令的執(zhí)行時(shí)間,包括取指、分析、執(zhí)行等,而后半部分表明如果指令是訪存指令則在cache不命中時(shí)CPU時(shí)間還應(yīng)該加上訪存的時(shí)間。由于訪存速度遠(yuǎn)遠(yuǎn)大于CPU的執(zhí)行速度,尤其是批量訪存指令,一旦遇到存儲(chǔ)器分體沖突,將等待更長的時(shí)間。而在ARM7TDMI、ARM9TDMI這些沒有cache的微處理器內(nèi)核中,批量訪存指令的CPU時(shí)間公式就完全變成如下形式:
因此,在這些處理器內(nèi)核中在處理諸如任務(wù)切換和進(jìn)入中斷的現(xiàn)場保護(hù)的批量訪存指令時(shí),系統(tǒng)將等待,從而影響實(shí)時(shí)性。
3.2 中斷現(xiàn)場保護(hù)的優(yōu)化策略
中斷現(xiàn)場保護(hù)中,保護(hù)返回地址、程序狀態(tài)字、堆棧指針是必需的,否則中斷結(jié)束后將無法順利返回。而保護(hù)通用寄存器的目的在于防止用戶中斷服務(wù)子程序使用其中的寄存器,造成對(duì)原有內(nèi)容的覆蓋而在中斷返回后任務(wù)執(zhí)行出錯(cuò)。因此在中斷里對(duì)通用寄存器的保護(hù)完全可以取決于中斷服務(wù)子程序?qū)νㄓ眉拇嫫鞯氖褂们闆r,僅僅保存中斷服務(wù)子程序中所用到的有限的幾個(gè)通用寄存器,而不必保存所有通用寄存器。以ARM體系結(jié)構(gòu)為例,在用戶模式下可用的通用寄存器為R0~R12,R13用作堆棧指針、R14為返回地址、R15用作PC,如果在中斷服務(wù)子程序中只用到R0~R12中的一小部分,則在中斷到來時(shí)可以僅僅只保存通用存器中的這一小部分,從而能夠減少訪存時(shí)間,最終達(dá)到縮短中斷響應(yīng)提高中斷實(shí)時(shí)性的目的。
在實(shí)際情況中,這種策略是具有可行性的。首先,每個(gè)中斷服務(wù)子程序中所需要的通用寄存器是可知的。在使用匯編語言編寫用戶中斷服務(wù)子程序時(shí),所需要的通用寄存器由程序員控制,使用C語言則由編譯器決定具體使用到哪幾個(gè)通用寄存器。其次,在現(xiàn)有的嵌入式操作系統(tǒng)中,往往要求中斷服務(wù)子程序盡可能的短小,例如在Linux中,把中斷服務(wù)子程序分成Bottom Half和Top Half。因此,在大多數(shù)中斷服務(wù)子程序中并沒有用到所保護(hù)的全部通用寄存器,造成對(duì)其余通用寄存器的多余保護(hù)。
3.3 µC/OS-II時(shí)鐘中斷現(xiàn)場保護(hù)優(yōu)化
時(shí)鐘中斷是操作系統(tǒng)中比較重要的一個(gè)部分,也是實(shí)時(shí)性要求較高的部分,在UNIX中時(shí)鐘中斷的優(yōu)先級(jí)定義為6,僅次于最高優(yōu)先級(jí)。以µC/OS-II時(shí)鐘中斷處理為例,中斷處理過程如圖3。µC/OS-II時(shí)鐘中斷服務(wù)中,首先要對(duì)中斷嵌套計(jì)數(shù)器OSIntNesting進(jìn)行加1操作,防止在嵌套的中斷中進(jìn)行任務(wù)調(diào)度;隨后調(diào)用OSTimeTick()對(duì)每個(gè)睡眠任務(wù)的OSTCBDly進(jìn)行減1以及對(duì)系統(tǒng)時(shí)間OSTime加1操作;最后調(diào)用OSIntExit()進(jìn)行任務(wù)調(diào)度,如果不需要任務(wù)切換則返回到中斷服務(wù)程序中??梢娫跁r(shí)鐘中斷處理中,操作最多的集中在OSTimeTick()和OSIntExit()這兩個(gè)函數(shù)上。通過ARMCC編譯器的-s選項(xiàng)對(duì)兩者進(jìn)行編譯,在得到的匯編代碼中,前者需要使用R0、R1、R4-R7,后者需要R0-R3,沒有使用R8-R12,而OSIntNesting++的操作也完全可以使用R0-R7進(jìn)行,這樣,在進(jìn)入中斷處理時(shí),需要保存的通用寄存器僅僅為R0-R7。因此對(duì)圖3中的①進(jìn)行改寫得到的保護(hù)中斷現(xiàn)場的代碼如圖4所示。
[align=center]
圖3. µC/OS-II時(shí)鐘中斷處理
圖4 µC/OS-II時(shí)鐘中斷現(xiàn)場保護(hù)[/align]
µC/OS-II其他的中斷處理與時(shí)鐘中斷相似,僅僅需要把OSTimeTick()替換成對(duì)應(yīng)的處理,如果能在不犧牲代碼效率的情況下,將相應(yīng)處理集中到R0-R3這幾個(gè)寄存器中,則該中斷處理中,僅僅使用R0-R3,只要對(duì)它們進(jìn)行保護(hù)即可,從而能更進(jìn)一步縮短中斷響應(yīng)時(shí)間,大大縮短中斷響應(yīng)時(shí)間,提高中斷實(shí)時(shí)性。
四、總結(jié)
傳統(tǒng)的中斷現(xiàn)場保護(hù)保存所有寄存器的內(nèi)容,雖然使得程序的設(shè)計(jì)得到簡化,但是同時(shí)造成了多余的寄存器保護(hù),增加了中斷響應(yīng)的時(shí)間。有限中斷現(xiàn)場保護(hù)策略能夠根據(jù)具體中斷服務(wù)中所需要使用的通用寄存器而進(jìn)行相應(yīng)的有限的保護(hù),縮短了現(xiàn)場保護(hù)的時(shí)間,使用戶中斷服務(wù)能夠盡早的到處理,提高了中斷實(shí)時(shí)性。但是同時(shí),有限中斷現(xiàn)場保護(hù)的效率也受到中斷服務(wù)處理復(fù)雜程度以及編譯器性能的影響。對(duì)于中斷服務(wù)簡單,而對(duì)實(shí)時(shí)性要求高的中斷,效果較明顯,而對(duì)于復(fù)雜的中斷服務(wù),需要的通用寄存器較多,從而中斷現(xiàn)場保護(hù)的寄存器也較多。而在同一中斷服務(wù)中,效率高的編譯器能夠在不犧牲代碼效率的情況下使用盡可能少的寄存器來完成中斷服務(wù),從而減少了需要中斷現(xiàn)場保護(hù)的寄存器數(shù),達(dá)到提高中斷實(shí)時(shí)性的要求。
參考文獻(xiàn)
[1] Jean J. L,µC/OS-II, The Real-Time Kernel,R&D Technical Books, 1998
[2] John L.H,David A.P,計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法:第3版,機(jī)械工業(yè)出版社,2002
[3] 毛德操,胡席明,嵌入式系統(tǒng):采用公開源代碼和StrongARM/Xscale處理器,浙江大學(xué)出版社,2003