摘 要:在嵌入式系統(tǒng)中常常需要處理大量的實時數(shù)據(jù),特別是在面向視頻應用的系統(tǒng)中。如何使CPU高效運行的問題契待解決。常用解決方法有:用匯編語言優(yōu)化代碼、移植嵌入式實時操作系統(tǒng)等。本文首先介紹了基于BF533的視覺監(jiān)控系統(tǒng)的硬件平臺設計,然后闡述了實時操作系統(tǒng)ucos-ii針對此硬件平臺的移植過程。經(jīng)實際運行,證明該設計能良好完成對運動目標跟蹤等功能并且運行效率得到有效提高。
關鍵詞:ucos-ii,BF533,嵌入式操作系統(tǒng),優(yōu)先級搶占
引言
嵌入式系統(tǒng)常用在一些特定專用設備上,通常這些設備的硬件資源(如處理器、存儲器等)非常有限,并且對成本很敏感,實時響應要求很高,特別是在面向視頻應用的系統(tǒng)中。嵌入式操作系統(tǒng)具有體積小、實時性好等優(yōu)點。嵌入式操作系統(tǒng)ucos-ii就是基于任務優(yōu)先級搶占的嵌入式實時操作系統(tǒng)。
1 系統(tǒng)硬件平臺設計
系統(tǒng)使用的主芯片是ADI公司Blackfin系列DSP中的BF533,這是一款專門面向視頻應用的DSP,擁有豐富的外設接口和較好的系統(tǒng)擴展性。本系統(tǒng)利用BF533的PPI接口采集數(shù)字圖像,利用芯片的EBIU總線,擴展SDRAM和網(wǎng)絡芯片。BF533工作在600MHz頻率,單個芯片即可完成對運動目標跟蹤和網(wǎng)絡傳輸?shù)裙δ??;贐F533的嵌入式系統(tǒng)的外圍電路主要可分為三個部分:圖像采集部分,網(wǎng)絡傳輸部分,存儲器部分。系統(tǒng)硬件框圖如圖1:
[align=center]
圖1 系統(tǒng)硬件框圖[/align]
圖像采集電路部分采用了TI公司的TVP5150A型視頻解碼芯片,它將NTSC/PAL/SECAM制式的視頻信號轉換成8bits的ITU-656格式,并按照YCbCr格式以4:2:2的比例轉化成數(shù)字信號,支持兩路模擬輸入,解碼芯片通過I2C串行接口編程。
網(wǎng)絡傳輸部分采用LAN91C111芯片。這是SMSC公司為嵌入式應用系統(tǒng)推出的第三代快速以太網(wǎng)控制器。本系統(tǒng)中,LAN91C111被當作了是異步存儲空間,利用AMS3把它映射在BF533的0x20300000地址空間。這樣就可以通過DMA操作實現(xiàn)對LAN91C111內部存儲空間讀寫操作,提高了傳輸效率并使復雜的網(wǎng)絡數(shù)據(jù)傳輸過程簡單化。
存儲器部分BF533的存儲結構是統(tǒng)一的4GB尋址空間。同步存儲器、異步存儲器、外設存儲空間和片內存儲器全部統(tǒng)一映射在4GB的空間。BF533的EBIU接口中有專門的SDRAM控制單元SDC,可以和SDRAM無縫連接。BF533支持的SDRAM地址是從0x00000000到0x08000000的空間,最大128MB。本系統(tǒng)中使用MICRON公司的MT48LC系列SDRAM,存儲空間32MB,用于存儲圖像處理中的中間結果。另外,BF533支持四塊連續(xù)的異步存儲空間,每塊空間大小為1MB,地址從0x20000000到0x20400000,由相應的AMS0-AMS3引腳選擇使能。本系統(tǒng)使用的是ST公司的M29W系列FLASH,大小1MB。由AMS0片選使能,映射在BF533的第一塊異步存儲空間。
2 ucos-ii的移植
ucos-ii是一種具有可剝奪實時內核的實時操作系統(tǒng),而且是免費公開源代碼、結構小巧。其內核提供任務調度與管理、時間管理、任務間同步與通信、內存管理和中斷服務等功能,具有執(zhí)行效率高、占用空間小、實時性能優(yōu)良和可擴展性強等特點。最小內核可編譯至2KB,適合小型控制系統(tǒng)。與CPU 硬件相關的部分用匯編語言編寫,其他絕大部分代碼采用C語言編寫。ucos-ii在硬件平臺上的移植主要分為兩大步驟:ucos-ii中與處理器相關的程序的修改、應用程序的添加。
2.1 ucos-ii與嵌入式監(jiān)控系統(tǒng)的軟硬件架構
所有的嵌入式操作系統(tǒng)都是與CPU密切相關的,做移植前需要熟悉被移植CPU平臺的硬件架構和ucos-ii的運行原理,圖2是ucos-ii與本嵌入式監(jiān)控系統(tǒng)的軟硬件架構。
[align=center]
圖2 系統(tǒng)架構圖[/align]
2.2 基于BF533的ucos-ii的移植
移植ucos-ii需要理解處理器及C編譯器的技術細節(jié)。處理器和編譯器滿足了ucos-ii的要求,并且已經(jīng)有了必要工具。移植工作通常包括以下幾個內容:
A 用#define設置一個常量的值(OS_CPU.H);
B 聲明10個數(shù)據(jù)類型(OS_CPU.H);
C 用#define聲明三個宏(OS_CPU.H);
D 用C語言編寫六個簡單的函數(shù)(OS_CPU_C.C);
E 編寫四個匯編語言函數(shù)(OS_CPU_A.ASM);
針對不同的CPU平臺,移植ucos-ii的過程也會有稍許不同。在本系統(tǒng)中,移植過程大致分為兩大部分:1)修改部分文件使ucos-ii與DSP能夠實現(xiàn)良好的接口(主要指ucos-ii對DSP硬件架構的支持);2)添加針對嵌入式監(jiān)控系統(tǒng)硬件平臺的初始化及驅動代碼。
2.2.1 針對BF533的ucos-ii的代碼修改
由于BF533是基于MSA(微信號架構)的16位定點DSP,為了能與ucos-ii數(shù)據(jù)處理單位統(tǒng)一,需要在OS_CPU.H文件中設置BF533的數(shù)據(jù)單元長度。部分宏定義代碼如下:
typedef bool BOOLEAN;
typedef signed char INT8S;
typedef signed short int INT16S;
typedef signed int INT32S;
另外在OS_CPU.H文件中還需設置幾個堆棧的參數(shù)如堆棧的增長方向、堆棧的操作單位等。BF533支持的是自頂向下的堆棧增長方式,即堆??臻g從高地址向低地址增長。單次堆棧操作單位是INT32U。最后在OS_CPU.H還要對三個函數(shù)進行宏定義:屏蔽所有中斷,恢復所有中斷,進行任務切換。這三個函數(shù)在ucos-ii中十分重要,前兩個是為了保證一些重要函數(shù)或任務運行中的數(shù)據(jù)不會被改變(即通常所說的代碼臨界段),第三個是用于ucos-ii的任務切換,在ucos-ii中要求任務的切換就好象是剛發(fā)生過一次中斷一樣。在本系統(tǒng)中首先假設申請切換的任務已經(jīng)把相關的寄存器變量等參數(shù)保存,并將堆棧指針指向了優(yōu)先級高的任務。這樣任務切換函數(shù)就只需要完成中斷返回操作。
開發(fā)軟件采用VisualDSP++,它的編譯器支持在C語言中嵌入?yún)R編,因此我們把這個宏定義直接寫成了一條軟件中斷指令:raise 14。這樣一旦系統(tǒng)進行任務切換,實際上引起了一個中斷操作,在OS_CPU_A.ASM文件中我們在此中斷操作中完成任務切換前的保存寄存器等工作,最后是一條中斷返回指令:RTS。這樣優(yōu)先級更高的任務運行時就會好像剛從中斷返回一樣。
在文件OS_CPU_A.ASM中還需要編寫幾個匯編函數(shù)來實現(xiàn)ucos-ii的時鐘節(jié)拍、正常任務切換、中斷級任務切換、初始化任務堆棧等功能。
在ucos-ii中,我們可以把時鐘節(jié)拍TICKS比做是它的心臟節(jié)拍。TICKS為系統(tǒng)提供了一個時間基準并為各個任務提供了時間等待等服務。本系統(tǒng)使用BF533的核心定時器來完成系統(tǒng)時鐘節(jié)拍的功能。系統(tǒng)TICKS設定的是100mS。以下是部分初始化核心定時器的匯編代碼:
_CoreTimerInit:
p1.H = ( TCNTL >>16 ); //設置時間控制寄存器
p1.L = ( TCNTL &0xFFFF );
r3 = 1;
[ p1 ] = r3;
p1.H = ( TCOUNT >>16 ); //裝載計數(shù)值
p1.L = ( TCOUNT &0xFFFF );
[ p1 ] = r1;
p1.H = ( TCNTL >>16 ); //開啟定時器
p1.L = ( TCNTL &0xFFFF );
r1 = 0x07;
[ p1 ] = r1;
_CoreTimerInit.end:
除增加上述功能函數(shù)外,在ucos-ii啟動代碼的程序中加入BF533的一些必須的初始化程序如CPU頻率的設定等, ucos-ii就可以在本系統(tǒng)上運行起來。
2.2.2 嵌入式監(jiān)控系統(tǒng)在ucos-ii中的系統(tǒng)驅動程序添加
ucos-ii移植完成后,嵌入式系統(tǒng)要實現(xiàn)應有的功能還需要添加一些外圍電路的驅動程序如:網(wǎng)卡芯片LAN91C111的初始化程序,視頻A/D芯片的初始化程序等。由于Blackfin系列DSP支持存儲空間的DMA操作,為了充分發(fā)揮BF533的硬件優(yōu)勢,本系統(tǒng)專門建立一個文件DMA_TRANS.C實現(xiàn)多個存儲空間的DMA操作的初始化配置,以方便各個任務實現(xiàn)其功能調用。以下就是實現(xiàn)網(wǎng)卡芯片DMA存儲操作的部分配置文件:
void init_dma(LAN91C111_DATA *d)
?。鹍ev =d; // 為LAN91C11設置一個全局靜態(tài)變量,實現(xiàn)對它的數(shù)據(jù)訪問
SET_SHORT((dev->DstStreamBaseAddr+OFFSET_CONFIG),(unsignedshort)0x0);
// 對目標地址的配置清零
SET _SHORT((dev->SrcStreamBaseAddr+OFFSET_CONFIG),(unsigned short)0x0);
//對源地址的配置清零
dma_mask_en(1); //將SIC控制寄存器的相應DMA傳輸位置1。}
2.3 基于ucos-ii和監(jiān)控系統(tǒng)的任務程序添加
在ucos-ii中系統(tǒng)的各個應用程序被當成是任務,每個任務被分配一個優(yōu)先級,ucos-ii支持的最大任務數(shù)可在OS_CFG .H文件中指定。ucos-ii可以管理多達64個任務,并從中保留了四個最高優(yōu)先級和四個最低優(yōu)先級的任務供自己使用,所以用戶可以使用的只有56個任務。因為ucos-ii不支持相同優(yōu)先級的任務,所以每建立一個任務就需要為任務分配一個優(yōu)先級并建立一個獨立的堆??臻g。
本智能監(jiān)控系統(tǒng)主要實現(xiàn)對運動目標的跟蹤監(jiān)控和將原始數(shù)字圖象轉化為BMP格式并向網(wǎng)絡發(fā)送現(xiàn)場圖片的功能。在ucos-ii中分配了兩個任務優(yōu)先級0和1給對運動目標的跟蹤和網(wǎng)絡傳輸。之所以使網(wǎng)絡傳輸?shù)娜蝿諆?yōu)先級低于對運動目標跟蹤的任務,是因為考慮到網(wǎng)絡延時等因素會造成對運動目標跟蹤的實時性效果比較差,對圖像做二值化和差分等運算的時間不大于150mS以及攝像機云臺運動一次的時間大概是500mS。本系統(tǒng)在對運動目標跟蹤任務中采取的策略是:每當任務完成一次跟蹤,就使自己進入掛起狀態(tài),直到每秒定時到后,在時鐘節(jié)拍中斷服務程序中喚醒該任務使之處于就緒狀態(tài)。任務的狀態(tài)圖如圖3:
[align=center]
圖3 任務狀態(tài)圖[/align]
3 結論
在ucos-ii的移植和系統(tǒng)應用程序的開發(fā)過程中,針對不同的CPU有不同的開發(fā)細節(jié),在嵌入式監(jiān)控系統(tǒng)中應注意以下幾點:
A 移植過程中,對ucos-ii的堆棧的理解很重要,它的任務切換的實質就是利用堆棧的改變和軟件中斷來實現(xiàn)任務的跳轉。并且在系統(tǒng)的中斷服務程序中也要注意到這一點,采取適當?shù)亩褩2僮饕允怪疂M足任務切換的條件。
B 在ucos-ii上增加應用任務之前,最好是編寫幾個如串口發(fā)送之類的簡單任務來測試移植ucos-ii后系統(tǒng)的可靠性,然后在此基礎上逐漸添加一些復雜的任務。
C 要分析好ucos-ii各個任務的功能與時間要求,特別是在以時間為任務運行條件的情況下,可以在時鐘中斷服務中創(chuàng)建任務。如果系統(tǒng)是應用在對時間不敏感的場合,可以使用ucos-ii自帶的郵箱功能,用一個運行中的任務在滿足一定條件下來喚醒另一個任務。
將ucos-ii應用在嵌入式智能視覺監(jiān)控系統(tǒng)中后,經(jīng)實際運行,該系統(tǒng)能良好完成預期的所有功能,對非高速的運動目標跟蹤效果良好,局域網(wǎng)的PC主機能收到較清晰的Half D1分辨率、256灰度等級的現(xiàn)場BMP圖片。
本文創(chuàng)新點:本文針對圖像處理系統(tǒng)中實時處理數(shù)據(jù)量大的問題,將實時操作系統(tǒng)ucos-ii應用于系統(tǒng)中,使CPU運行速率得到了有效的提高。
參考文獻
1 陳峰.Blackfin系列DSP原理與系統(tǒng)設計[M].北京:電子工業(yè)出版社,2004,1。
2 Analog Devices, Inc. ADSP-BF533 Blackfin Processor Hardware Reference. USA: Analog Devices, Inc, March 2003.
3 邵貝貝等譯.嵌入式實時操作系統(tǒng)UC/OS-II.北京:北京航空航天大學出版社 2003。
4 徐偉,潭樹人,黃浩亮.基于AT91RM9200 的圖像采集系統(tǒng)設計[J].微計算機信息,2006,11-2:120-123。