freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計(jì)算機(jī)組成原理第十章(編輯修改稿)

2025-06-17 16:36 本頁面
 

【文章內(nèi)容簡介】 等待,使系統(tǒng)性能明顯下降。 ? 分支預(yù)測并不能充分利用處理機(jī)流水線的功能部件 安騰的推斷技術(shù)原理 ? 推斷技術(shù)處理分支的方法是利用多個功能部件并行執(zhí)行各個分支,然后根據(jù)判定結(jié)果選取某一分支的運(yùn)行結(jié)果,因而可消除大部分的轉(zhuǎn)移,使得整個系統(tǒng)的運(yùn)行速度得到提高。 ? 采用顯式并行指令計(jì)算技術(shù)的安騰處理機(jī)將處理機(jī)的多個功能部件的并行處理能力與編譯器的強(qiáng)大功能相結(jié)合,允許在編譯時讓編譯器對程序進(jìn)行優(yōu)化,消除轉(zhuǎn)移,提高效率。 ? 安騰處理機(jī)的指令系統(tǒng)允許在每條指令中都指定一個推斷寄存器。 推斷執(zhí)行的實(shí)現(xiàn) 例 2考察下面的一個典型的 ifthenelse結(jié)構(gòu): If ( x=0) then m=m+1 else m=m1 在傳統(tǒng)的超標(biāo)量流水線體系結(jié)構(gòu)中,完成上述判斷通常要首先安排一條比較語句,將 x與 0進(jìn)行比較。得到比較結(jié)果后,再選擇執(zhí)行then分支或 else分支。 cmp x, 0。比較 x和 0 je L1。若相等則轉(zhuǎn)移至標(biāo)號 L1 sub m,1; m=m1 jmp L2;無條件轉(zhuǎn)移至標(biāo)號 L2 L1: add m, 1; m=m+l L2: 例 2續(xù) 而安騰處理機(jī)可以通過編譯優(yōu)化消除條件語句中的分支指 ① cmp eq P1, P2=0, x; //無條件執(zhí)行:將 r4寄存器的值與 0比較,若相等則置推斷寄存器 P1為 1, P2為 0,否則置推斷寄存器 P1為 0, P2為 1 ② (P1)add m=1, m //若 P1為 1,則 m+1送 m ③ (P2)add m=1, m //若 P2為 1,則 m1送 m 從判定流程上,似乎上面的三條語句并沒有從邏輯上改變ifthenelse結(jié)構(gòu)的執(zhí)行過程。但如果我們能夠把這個例子和安騰體系結(jié)構(gòu)結(jié)合起來,還是可以從這個簡單的例子中體會到安騰處理機(jī)的設(shè)計(jì)思想。 安騰處理機(jī)設(shè)計(jì)思想 ? 首先,安騰指令系統(tǒng)中的每條指令都能夠支持推斷執(zhí)行,所以第二條指令和第三條指令中的條件判斷并不需要使用專門的判斷指令。雖然后面兩條指令是條件執(zhí)行的,但整體條件判斷結(jié)構(gòu)不再需要分支指令。 ? 其次,指令中的推斷操作的安排是由編譯器在編譯過程中完成的,不需要處理機(jī)在執(zhí)行指令的非常短的時間內(nèi)動態(tài)安排各條指令的條件執(zhí)行。 ? 最后,每條指令中雖然可以指定推斷寄存器,但取指令、指令譯碼和執(zhí)行操作并不需要等到推斷寄存器的取值確定后再進(jìn)行。 下面可以看一下傳統(tǒng)流水線與安騰處理機(jī)比較。 傳統(tǒng)流水線與安騰處理機(jī)比較 二、推測技術(shù) 存儲器訪問延遲與指令級并行 ? 在現(xiàn)代計(jì)算機(jī)體系結(jié)構(gòu)中,多級存儲體系能夠有效提高存儲系統(tǒng)的性能價格比。但是,在多個功能單元實(shí)現(xiàn)并行處理的處理機(jī)中,執(zhí)行指令的速度仍然受到存儲器訪問速度的制約。 ? 現(xiàn)代 RISC處理機(jī)用專用指令訪問內(nèi)存,取數(shù)指令往往成為影響處理機(jī)性能的瓶頸。見下圖看一下取數(shù)指令對處理機(jī)并行執(zhí)行指令的影響。 取數(shù)指令對處理機(jī)并行執(zhí)行指令的影響 給出的實(shí)例顯示了取數(shù)指令對處理機(jī)并行執(zhí)行指令的影響。現(xiàn)利用具有四 ① load(a)//從內(nèi)存單元取數(shù)至寄存器 a ② k=k+1 ③ i=i1 ④ n=n+3 ⑤ q=q+a 假設(shè)所有的算術(shù)運(yùn)算指令可以在一個時鐘周期中完成,而訪存指令需要三個時鐘周期。前四條指令可以分別安排在四個執(zhí)行單元中并行執(zhí)行。如果load指令所要訪問的內(nèi)存單元并沒有被調(diào)入 cache,那么 load指令直接訪問內(nèi)存需要三個時鐘周期才能執(zhí)行完畢。而第五條指令依賴于 load指令取得的操作數(shù),所以在執(zhí)行第五條指令之前需要等待兩個時鐘周期,從而所有的執(zhí)行單元都必須閑置兩個時鐘周期,這就大大降低了執(zhí)行效率。 控制推測 ? 解決處理機(jī)訪存延遲的辦法就是將訪存操作盡可能提前執(zhí)行。 ? 在安騰處理機(jī)中,控制推測技術(shù)用于解決上述與取數(shù)指令有關(guān)的控制相關(guān)問題。 數(shù)據(jù)推測 ? 控制推測技術(shù)能夠解決分支和取數(shù)操作中的控制相關(guān),但在指令優(yōu)化過程中還可能存在數(shù)據(jù)相關(guān)。 【 例 3】 考察下面包含分支與取數(shù)指令的程序段: if(r3=0) then r2=r2+1 else r1=[ r3 其功能是判斷指針寄存器 r3的值是否為零:若是則將寄存器 r2加 1;否則將 r3指向的內(nèi)存單元的內(nèi)容加載到寄存器 r1中。其原始匯編代 ① cmp. eq P1, P2=0, r3; //無條件執(zhí)行:將 r3寄存器的值與 0比較,若相等則置推斷寄存器 P1為 1, P2為 0,否則置推斷寄存器 P1
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1