【文章內(nèi)容簡介】
725/35/5032K21C20935/504KC2405016K54411F2405054416K11C241508K54411F241505448K11C242504K54411F243505448K11 TMS320C54XTMS320C54X是為實現(xiàn)低功耗、高性能而專門設計的定點DSP芯片,其主要應用是無線通信系統(tǒng)等。該芯片的內(nèi)部結(jié)構(gòu)與TMS320C5X不同,因而指令系統(tǒng)與TMS320C5X和TMS320C2X等是互不兼容的。 TMS320C54X的主要特點包括:(1) 運算速度快。指令周期為25/20/15/,運算能力為40/50/66/80/100 MIPS;(2) 優(yōu)化的CPU結(jié)構(gòu)。內(nèi)部有1個40位的算術邏輯單元,2個40位的累加器,2個40位加法器,1個1717的乘法器和1個40位的桶形移位器。有4條內(nèi)部總線和2個地址產(chǎn)生器。此外,內(nèi)部還集成了維特比加速器,用于提高維特比編譯碼的速度。先進的DSP結(jié)構(gòu)可高效地實現(xiàn)無線通信系統(tǒng)中的各種功能,如用TMS320C54X實現(xiàn)全速率的GSM MIPS,實現(xiàn)半速率GSM MIPS,而實現(xiàn)全速率GSM MIPS,實現(xiàn)IS54/136 MIPS;(3) 低功耗方式。,三個低功耗方式(IDLEIDLE2和IDLE3)可以節(jié)省DSP的功耗,TMS320C54X特別適合于無線移動設備。用TMS320C54X實現(xiàn)IS54/136 ,實現(xiàn)GSM ;(4) 智能外設。除了標準的串行口和時分復用(TDM)串行口外,TMS320C54X還提供了自動緩沖串行口BSP(autoBuffered Serial Port)和與外部處理器通信的HPI(Host Port Interface)接口。BSP可提供2K字數(shù)據(jù)緩沖的讀寫能力,從而降低處理器的額外開銷,指令周期為20ns時,BSP的最大數(shù)據(jù)吞吐量為50M bit/s,即使在IDLE方式下,BSP也可以全速工作。HPI可以與外部標準的微處理器直接接口。 TMS320C54X的資源配置TMS320C54X指令周期(ns)工作電壓(V)片內(nèi)RAM(字)片內(nèi)ROM(字)串行口BSPHPIC54120/255/5K28K2個標準口C54220/255/10K 2K1個TDM口11C54320/2510K2K1個TDM口1C54520/256K48K1個標準口11C54620/256K48K1個標準口1C54815/20/2532K2K1個TDM口21LC/VC54910/32K16K1個TDM口21VC54021016K4K21 TMS320C62X這是TI公司于1997年開發(fā)的一種新型定點DSP芯片。該芯片的內(nèi)部結(jié)構(gòu)與以前的DSP芯片不同,內(nèi)部集成了多個功能單元,可同時執(zhí)行8條指令,運算能力達1600MIPS。其主要特點有:(1) 運行速度快。指令周期為5ns,運算能力為1600MIPS;(2) 內(nèi)部結(jié)構(gòu)不同于一般DSP芯片。內(nèi)部同時集成了2個乘法器和6個算術運算單元,且它們之間是高度正交的,使得在一個指令周期內(nèi)最大能支持8條32bit的指令;(3) 指令集不同。為充分發(fā)揮其內(nèi)部集成的各執(zhí)行單元的獨立運行能力,TI公司使用了VelociTT 超長指令字(VLIW)結(jié)構(gòu)。它在一條指令中組合了幾個執(zhí)行單元,結(jié)合其獨特的內(nèi)部結(jié)構(gòu),可在一個時鐘周期內(nèi)并行執(zhí)行幾個指令;(4) 大容量的片內(nèi)存儲器和大范圍的尋址能力。片內(nèi)集成了512K字程序存儲器和512K字數(shù)據(jù)存儲器,并擁有32bit的外部存儲器界面;(5) 智能外設。內(nèi)部集成了 4個DMA接口,2個多通道緩存串口,2個32bit 計時器;(6) 低廉的使用成本。在一個無線基站的應用中,每片TMS320C62X能同時完成30路的語音編解碼,每路成本為3美元,而以前的DSP系列最大只能完成5路,每路的成本為7美元。這種芯片適合于無線基站、無線PDA、組合Modem、GPS導航等需要大運算能力的應用場合。 TI浮點DSP芯片 TMS320C3XTMS320C3X是TI的第三代產(chǎn)品,也是第一代浮點DSP芯片。TMS320C3X中目前具有TMS320CTMS320C31和TMS320C32三種。TMS320C31是TMS320C30的簡化和改進型,它在TMS320C30的基礎上去掉了一般用戶不常用的一些資源,降低了成本,是一個性能價格比較高的浮點處理器,在國內(nèi)已得到了較廣泛的應用。TMS320C32是TMS320C31的進一步簡化和改進。 三種TMS320C3X芯片的比較特征TMS320C30TMS320C31TMS320C32數(shù)據(jù)/程序總線主總線STRB:32位數(shù)據(jù),24位地址擴展總線IOSTRB:32位數(shù)據(jù),13位地址STRB:32位數(shù)據(jù),24位地址STRB0:8/16/32位 STRB1: 8/16/32位IOSTRB:32位內(nèi)部RAM2K字2K字512字串行I/O口2個串行口1個串行口1個串行口用戶程序、數(shù)據(jù)ROM4K字/16K字節(jié)無無DMA控制器單通道單通道雙通道程序和數(shù)據(jù)存儲器寬度32位32位程序16/32位可選數(shù)據(jù)8/16/32位可選外部中斷觸發(fā)電平觸發(fā)電平觸發(fā)電平/邊沿可選中斷矢量表地址固定固定用戶可重定位程序引導無用戶可選用戶可選TMS320C30的指令周期為50/60/74ns,TMS320C31的指令周期為33/40/50/60/74ns,TMS320C32的指令周期則為33/40/50ns。 TMS320C3X的硬件資源TMS320C30的硬件資源相當豐富。其內(nèi)部包含了2K32位的快速RAM塊。分開的程序總線、數(shù)據(jù)總線和DMA總線使得取指、讀寫數(shù)據(jù)和DMA操作可并行進行,如CPU可以在一個周期內(nèi)完成下列操作: 在一個RAM塊中存取兩個數(shù)據(jù)值,進行一次外部取指,DMA裝入到另一個RAM塊。6432位的指令Cache用來存儲經(jīng)常使用的代碼塊,這可大大減少片外訪問的次數(shù),從而提高程序運行速度。由于主總線的地址總線是24位,因此TMS320C30可以訪問多達16M的32位字的存儲器空間,程序、數(shù)據(jù)和I/O空間都包含在TMS320C30這個16M字的空間中。TMS320C30有一個40/32位的浮點/整數(shù)乘法器,這個乘法器可以在單周期內(nèi)完成24位整數(shù)和32位浮點值的乘法,為了達到更高的性能,可以采用并行指令在單周期內(nèi)完成一次乘法和ALU操作。當乘法器進行浮點乘法時,輸入是32位單精度浮點值,而輸出則是40位的擴展精度浮點數(shù)。整數(shù)乘法時,輸入是24位,而輸出則是32位。TMS320C30的整數(shù)/浮點算術邏輯運算單元ALU可以進行單周期的32位整數(shù)、32位邏輯數(shù)和40位的浮點數(shù)操作,ALU的運算結(jié)果是32位整數(shù)或40位浮點數(shù)。內(nèi)部的桶形移位器可以在單周期內(nèi)進行高達32位的左移或右移。內(nèi)部總線CPU1/CPU2和REG1/REG2可從存儲器中取兩個操作數(shù)和從寄存器取兩個操作數(shù),這就使得對四個操作數(shù)進行乘和加/減可以在單周期內(nèi)完成。TMS320C30內(nèi)有兩個輔助寄存器算術單元(ARAU0和ARAU1), 它們可以在單周期內(nèi)產(chǎn)生兩個地址。ARAU 的操作是和乘法器及ALU的操作并行進行的。ARAU支持多種尋址方式。TMS320C30提供28個寄存器,這些寄存器可以由乘法器和ALU操作,可以用作通用的寄存器。但是,它們也有一些特殊的功能,如8個擴展精度的寄存器(R0~R7)可當累加器使用,特別適合用于存放擴展精度的浮點結(jié)果。8個輔助寄存器(AR0~AR7)支持一系列間接尋址方式,并且可以用作通用的32位整數(shù)和邏輯寄存器。其他寄存器提供一些系統(tǒng)功能,如尋址、堆棧管理、處理器狀態(tài)、中斷和塊重復等。TMS320C30的外設是通過存儲器映射的寄存器對外設總線進行控制的,外設總線由32位數(shù)據(jù)總線和24位地址總線組成,允許與外設直接通信。TMS320C30的外設包括兩個可支持8/16/24/32位數(shù)據(jù)交換的串行口和兩個32位定時器。串行口的時鐘可以由內(nèi)部產(chǎn)生也可由外部提供,串行口的引腳可以配置為通用的I/O引腳,特殊的握手方式可保證TMS320C30與串行口的同步。定時器是通用的32位定時器或事件計數(shù)器,具有兩種信號方式,可由內(nèi)部或外部提供時鐘,每個定時器對應有一個I/O引腳,可作為定時器的輸入時鐘或輸出時鐘,也可配置為通用的I/O引腳。片內(nèi)的DMA功能使得CPU與I/O操作可同時進行。DMA控制器可以在存儲器的任何地址進行讀寫操作而不干擾CPU的操作,因此TMS320C30可與外部的慢速存儲器或外設接口而不降低CPU的吞吐量。兩個通用的外部引腳(XF0,XF1)可由軟件設置為輸入或輸出,這兩個引腳也用作TMS320C30的互鎖操作,用于多處理器之間的通信。除了主總線之外,TMS320C30還有一條擴展總線。擴展總線的數(shù)據(jù)線為24位,地址線為13位,其操作可與主總線操作同時進行,也可獨立于主總線。與主總線相比,擴展總線上的I/O口的讀寫周期為2個H1周期,即是主總線的2倍。擴展總線通常用于I/O操作,如A/D、D/A等。TMS320C30內(nèi)部有4K字的ROM,在微計算機方式下,程序由內(nèi)部開始運行。TMS320C31是TMS320C30的簡化和改進型,它去掉了擴展總線、一個串行口和內(nèi)部的4K字ROM,增加了程序的引導功能。當MCBL/MP\引腳為高電平時,工作于微計算機自引導方式,在這種方式下,TMS320C31可從三個特定的地址裝入程序(BOOT1,BOOT2,BOOT3),也可從串行口裝入程序。與EPROM接口時,用戶可用軟件設定等待周期個數(shù),當然也可用硬件來產(chǎn)生等待周期,可設定是按字節(jié)(8位)、半字(16位)或字(32位)裝入,應用靈活。從串行口裝入時,采用固定的32位突發(fā)方式。裝入方式設置是通過復位之后設置四個外部中斷之一來實現(xiàn)。TMS320C32是TMS320C31的簡化和改進型。簡化主要是將內(nèi)部的RAM由2K字減少為512字,以降低成本。改進之處包括:外部存儲器寬度可變,中斷矢量表可重定位,外部中斷可由軟件選擇是電平觸發(fā)還是邊沿觸發(fā),DMA控制器增加了一個通道,此外,還增加了兩種節(jié)電運行方式。TMS320C3X均提供HOLD功能和JTAG仿真功能。 TMS320C3X的軟件資源1.豐富的指令系統(tǒng)TMS320C3X的匯編語言指令集特別適合于數(shù)字信號處理。所有指令占一個機器字長,大部分指令是單周器的。指令集共有113條指令,可以分為六類: 數(shù)據(jù)傳送類、二操作數(shù)算術/邏輯類、三操作數(shù)算術/邏輯類、程序控制類、互鎖操作類及并行操作類。12條數(shù)據(jù)傳送指令可從存儲器中讀一個字裝入寄存器,將一個字從寄存器中存入存儲器中及進行堆棧操作。二操作數(shù)指令有35條,提供整數(shù)、浮點、邏輯運算及多精度算術操作。17條三操作數(shù)指令可以在一個指令周期內(nèi)完成具有三個操作數(shù)的運算,其中兩個是源操作數(shù),另一個是目的操作數(shù)。程序控制指令共16條,它們影響程序的流向,其中有塊重復指令RPTB和單指令重復指令RPTS。除了有標準跳轉(zhuǎn)指令外,還有延遲跳轉(zhuǎn)指令,有些指令具有條件運算功能。5條互鎖操作指令主要用來進行多處理器之間的通信。剩下的28條指令都是并行操作指令,每條并行指令由兩條指令用符號“||”連接,并行操作指令可使“||”前后的兩條指令并行完成。需要注意的是,并不是任意兩條指令都可構(gòu)成并行指令。2.靈活的程序控制TMS320C3X提供相當靈活的程序流控制。軟件的程序控制包括重復、跳轉(zhuǎn)、調(diào)用、陷阱及返回等。TMS320C3X重復方式可以實現(xiàn)無開銷循環(huán)。塊重復指令RPTB可以使一塊代碼重復執(zhí)行指定的次數(shù),而單指令重復指令RPTS使一條指令重復執(zhí)行指定的次數(shù),由于RPTS取指次數(shù)只有一次,因此減少了總線沖突的機會。這里需要特別注意的是,RPTS指令禁止中斷,而RPTB無此禁忌。因此在需要中斷的場合,建議采用RPTB指令代替RPTS指令。TMS320C3X提供兩種類型的跳轉(zhuǎn):標準跳轉(zhuǎn)和延遲跳轉(zhuǎn)。標準跳轉(zhuǎn)首先將流水線清空然后執(zhí)行跳轉(zhuǎn),這可保證程序計數(shù)器的正確管理,但卻使跳轉(zhuǎn)指令需4個周期才能執(zhí)行完畢。延遲跳轉(zhuǎn)則相反,它并不將流水線清空,而是保證在程序跳轉(zhuǎn)之前執(zhí)行它下面的3條指令,這樣使得跳轉(zhuǎn)指令本身僅需1個指令周期。當然有些指令(如CALL、RPTB等)不能出現(xiàn)在延遲跳轉(zhuǎn)指令下面的3條指令。延遲跳轉(zhuǎn)指令在它下面3條指令完成前禁止中斷?;ユi操作可用來實現(xiàn)多個TMS320C3X之間的通信。通過采用外部信號(XF0,XF1),互鎖操作指令提供強有力的同步機制,可用來實現(xiàn)忙等待循環(huán)、兩個TMS320C3X之間的同步(無需額外的硬件支撐)和多個計數(shù)器控制等。3.流水線操作流水線操作是TMS320C3X具有高性能的特性之一。5個功能單元控制TMS320C3X的操作:取指(F)、譯碼(D)、讀操作數(shù)(R)、執(zhí)行(E)和DMA。流水線操作就是一個基本指令的取指、譯碼、讀操作數(shù)和執(zhí)行的并行操作。周期 F D R Em3 W m2 X W m1 Y X W m Z Y X W ←完全重疊m+1 Z Y Xm+2 Z Ym+3 Z注:W、X、Y、Z代表指令;F、D、R、E分別代表取指、譯碼、讀操作數(shù)和執(zhí)行。 TMS320C3X的流水線結(jié)構(gòu)圖中在m周期,流水線完全重疊,4個單元的操作同時