freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

arm流水線-資料下載頁

2025-08-05 01:42本頁面
  

【正文】 。 要實(shí)現(xiàn)把內(nèi)存地址0x1000和Ox2000處的數(shù)據(jù)分別拷貝到0x8000和0x9000處。 Oxl000處的內(nèi)容:1,2,3,4,5,6,7,8,9,10 Ox2000處的內(nèi)容:H,e,l,l,o,W,o,r,l,d 實(shí)現(xiàn)第一個拷貝過程的程序代碼及指令的執(zhí)行時空圖如圖7所示。 全部拷貝過程由兩個結(jié)構(gòu)相同的循環(huán)各自獨(dú)立完成,分別實(shí)現(xiàn)兩塊數(shù)據(jù)的拷貝,并且兩個拷貝過程極為類似,分析其中一個即可。 T1~T3是3個單獨(dú)的時鐘周期;T4~T11是一個循環(huán),在時空圖中描述了第一次循環(huán)的執(zhí)行情況。在T12的時候?qū)慙R的同時,開始對循環(huán)的第一條語句 進(jìn)行取指,所以總的流水線周期數(shù)為3+1010+29=121。整個拷貝過程需要1212+2=244個時鐘周期完成。 考慮到通過減少流水線的沖突可以提高流水線的執(zhí)行效率,而流水線的沖突主要來自寄存器沖突和分支指令,因此對代碼作如下兩方面調(diào)整: ①將兩個循環(huán)合并成一個循環(huán)能夠充分減少循環(huán)跳轉(zhuǎn)的次數(shù),減少跳轉(zhuǎn)帶來的流水線停滯; ②調(diào)整代碼的順序,將帶有與臨近指令不相關(guān)的寄存器插到帶有相關(guān)寄存器的指令之間,能夠充分地避免寄存器沖突導(dǎo)致的流水線阻塞。 對代碼調(diào)整和流水線的時空圖如圖8所示。 調(diào)整之后,T1~T5是5個單獨(dú)的時鐘周期,T6~T13是一個循環(huán),同樣在T14的時候BNE指令在寫LR的同時,循環(huán)的第一條指令開始取指,所以總的指令周期數(shù)為5+1010+29+2=125。 通過兩段代碼的比較可看出:調(diào)整之前整個拷貝過程總共使用了244個時鐘周期,調(diào)整了循環(huán)內(nèi)指令的順序后,總共使用了125個時鐘周期就完成了同樣的工作,時鐘周期減少了119個,縮短了119/244=48.8%,效率提升十分明顯。 代碼優(yōu)化前后執(zhí)行周期數(shù)對比的情況如表1所列。 因此流水線的優(yōu)化問題主要應(yīng)從兩方面考慮: ①通過合并循環(huán)等方式減少分支指令的個數(shù),從而減少流水線的浪費(fèi); ②通過交換指令的順序,避免寄存器沖突造成的流水線停滯。4 結(jié) 論 流水線技術(shù)提高了處理器的并行性,與串行CPU相比大大提高了處理器性能。通過調(diào)節(jié)指令序列的方法又能夠 有效地避免流水線沖突的發(fā)生,從而提高了流水線的執(zhí)行效率。因此如何采用智能算法進(jìn)行指令序列的自動調(diào)節(jié)以提高流水線的效率和進(jìn)一步提高處理器的并行性將 是以后研究的主要方向。
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1