freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多指令流出技術(shù)(編輯修改稿)

2025-08-14 19:50 本頁面
 

【文章內(nèi)容簡介】 浮點指令 時鐘周期 11/ 25 超標(biāo)量流水線上展開的代碼每次循環(huán)需 12個 時鐘周期,即每個迭代是 時鐘周期。而在普通的 DLX流水線上,沒有調(diào)度的迭代 1次 為 9個 時鐘周期,性能提高了 ;調(diào)度后為 6個 時鐘周期,性能提高了;展開 4次 并調(diào)度后每個迭代為 ,性能提高了 。 多指令流出技術(shù) 12/ 25 優(yōu)點: ( 1)超標(biāo)量結(jié)構(gòu)對程序員是透明的,因為處理 器能自己檢測下一條指令能否流出,從而 不需要排列指令來滿足指令流出; ( 2)即使是沒有經(jīng)過編譯器對超標(biāo)量結(jié)構(gòu)進行 調(diào)度優(yōu)化的代碼或是舊的編譯器生成的代 碼也可以運行,當(dāng)然運行的效果不會很好。 要想達到很好的效果,方法之一 : 使用 動態(tài)超標(biāo)量調(diào)度技術(shù) 。 多指令流出技術(shù) 13/ 25 動態(tài)多指令流出技術(shù) 擴展 Tomasulo算法: 支持兩路超標(biāo)量。 即每個時鐘周期流出兩條指令。 (一條是整數(shù)指令,另一條是浮點指令) ? 指令按順序流向保留站 , 否則信息記錄機制 會太復(fù)雜 。 ? 將整數(shù)寄存器和浮點寄存器分開 , 只要不使 用相同的寄存器就可同時將一條整數(shù)指令和 一條浮點指令送到它們的保留站中去 。 ? 限制相關(guān)指令的并行執(zhí)行 。 多指令流出技術(shù) 14/ 25 兩種方式 可以實現(xiàn)兩路超標(biāo)量 。 (1) 將指令流出段進一步流水化,使指令流出的 速度是基本機器周期的 兩倍 。 (2) 對流出的指令組合進行限制 .只有浮點的取 操作指令或是從整數(shù)寄存器將數(shù)據(jù)送入浮點寄 存器的傳送操作,才會產(chǎn)生相關(guān)而導(dǎo)致兩條指 令不能同時執(zhí)行。如果對流出的指令組合限制 減少,指令組合的復(fù)雜度增加,可能出現(xiàn)的相 關(guān)情況會更多,對硬件相關(guān)檢測的要求就會大 提高。 多指令流出技術(shù) 15/ 25 操作對保留站的需求量 , 可以使等待操作數(shù)的存操 作指令提早流出 。 ,而靜態(tài)調(diào)度對 寄存器 寄存器操作的代碼序列最有效。 通過隊列實現(xiàn)存儲器操作和數(shù)據(jù)傳送操作,而 脫離對其他功能部件的保留站依賴的結(jié)構(gòu),稱為 解 耦( decoupled, 也可稱為退耦)結(jié)構(gòu)。 多指令流出技術(shù) 16/ 25 例 下面的代碼運行于采用 Tomasulo算法的兩路動態(tài)超標(biāo)量 DLX流水線上 。 現(xiàn)做以下假設(shè): ( 1) 無論是否相關(guān) , 每個時鐘周期能流出一條整 數(shù)指令和一條浮點指令; ( 2) 有 1個 整數(shù)部件 , 用于整數(shù)運算和地址計算; 有 1個 獨立的浮點功能部件; ( 3) 指令流出和寫結(jié)果各占用 1個 時鐘周期; ( 4) 有 1個 具有獨立分支預(yù)測能力的分支預(yù)測部件 , 分支指令只能單獨流出 , 沒有分支延遲; ( 5)因為寫結(jié)果占用 1個 周期,所以產(chǎn)生結(jié)果的延
點擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1