freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

浙江工商大學(xué)計算機體系結(jié)構(gòu)第2章指令級并行及其開發(fā)-在線瀏覽

2025-07-13 10:51本頁面
  

【正文】 發(fā)射處理器中,由于要重疊執(zhí)行更多的獨立指令序列,寄存器不足帶來的挑戰(zhàn)更為嚴(yán)峻 循環(huán)展開對 簡單流水線、超標(biāo)量多發(fā)射結(jié)構(gòu)、 VLIW均適用 采用預(yù)測技術(shù)減小轉(zhuǎn)移開銷 ? 可以通過 轉(zhuǎn)移預(yù)測技術(shù) 來 減小 轉(zhuǎn)移引起的 性能損耗 ,轉(zhuǎn)移預(yù)測既可以在編譯階段 靜態(tài) 完成,也可以由硬件在執(zhí)行階段 動態(tài) 完成,有些處理器,轉(zhuǎn)移行為在編譯階段是 高度可預(yù)測 的,靜態(tài)轉(zhuǎn)移預(yù)測既可以應(yīng)用于此類處理器,也可以用來 輔助動態(tài)轉(zhuǎn)移預(yù)測 采用預(yù)測技術(shù)減小轉(zhuǎn)移開銷 ? 靜態(tài)轉(zhuǎn)移預(yù)測 為了重組轉(zhuǎn)移周圍的代碼以獲得更高的性能,需要在程序編譯階段靜態(tài)預(yù)測轉(zhuǎn)移行為,最簡單的方法是預(yù)測轉(zhuǎn)移總是被選中,這種方法的錯誤率等于轉(zhuǎn)移不被選中的比率;另一種技術(shù)是 通過分析轉(zhuǎn)移的歷史表現(xiàn)來進行轉(zhuǎn)移預(yù)測 ,這種技術(shù)擁有更高的準(zhǔn)確率,它的依據(jù)在于轉(zhuǎn)移的表現(xiàn)通常遵循雙峰分布,圖 種策略進行轉(zhuǎn)移預(yù)測是成功的。 采用預(yù)測技術(shù)減小轉(zhuǎn)移開銷 ? 動態(tài)轉(zhuǎn)移預(yù)測 1bit預(yù)測 在性能上有 不足之處 ,假設(shè)一個轉(zhuǎn)移幾乎總是被選中,而當(dāng)他偶爾未被選中時,錯誤預(yù)測會使預(yù)測位空翻,從而使 預(yù)測錯誤兩次而不是一次 。 采用預(yù)測技術(shù)減小轉(zhuǎn)移開銷 ? 動態(tài)轉(zhuǎn)移預(yù)測 轉(zhuǎn)移預(yù)測緩存可以作為一個在 IF流水階段通過指令地址訪問的專用 Cache來實現(xiàn),也可以附屬于指令 Cache中的每一塊隨指令一起讀取。 n bit 計數(shù)器當(dāng)計數(shù)器值大于或等于 2^n1的一半時,預(yù)測轉(zhuǎn)移被選中,反之不被選中。 Tournament預(yù)測器以 中等大小 ( 8K32K)的預(yù)測位獲得更高的準(zhǔn)確率,同時可以有效地利用大量預(yù)測位。 動態(tài)調(diào)度優(yōu)勢: 可以處理一些在 編譯階段無法預(yù)見的相關(guān)情況,如存儲器引用等,同時它 簡化了編譯器的設(shè)計 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?動態(tài)調(diào)度 動態(tài)調(diào)度 雖然 不能改變數(shù)據(jù)流 ,但它會在相關(guān)性出現(xiàn)時盡力 避免停頓 ,而由編譯器執(zhí)行的 靜態(tài)流水線調(diào)度 則是 將相關(guān)指令分離 ,使它們不再引起冒險,從而將停頓減至最小。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?動態(tài)調(diào)度 亂序執(zhí)行 :指令的發(fā)射仍采用按序的方式,但指令在它的 操作數(shù)可用時馬上開始執(zhí)行 ,流水線采用亂序執(zhí)行使得指令的結(jié)束也是亂序的,亂序執(zhí)行會產(chǎn)生 WAR和 WAW冒險。 即使異常行為被保護,動態(tài)調(diào)度也會產(chǎn)生一些不精確的異常 。 重點討論 Tomasulo算法 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?用 Tomasulo方法進行動態(tài)調(diào)度 算法由 Robert Tomasulo 提出,通過對操作數(shù)何時可用進行跟蹤以 減少 RAW冒險 ,通過引入寄存器 重命名 減少 WAW和 WAR冒險 。 寄存器重命名 是指通過重命名所有的目標(biāo)寄存器,包括指令序列中 位置靠前 的指令 將要讀和寫的寄存器 ?;舅枷胧牵? 當(dāng) 操作數(shù)可用時 , 保留站 馬上 取操作數(shù) 并將其 緩存,從而 避免從寄存器中讀操作數(shù) ; 即將執(zhí)行的指令 指定保留站為其提供數(shù)據(jù)輸入 ; 當(dāng)對寄存器的后續(xù)寫操作在執(zhí)行過程中發(fā)生重疊時,只允許 最后一個 實際 更新寄存器 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ? Tomasulo算法處理器結(jié)構(gòu) 該處理器基本結(jié)構(gòu)見圖 ,包括浮點單元和 loadstore單元。 loadstore緩存 保存從存儲器中讀出或即將要保存到存儲器中去的 數(shù)據(jù)或數(shù)據(jù)地址 。從功能單元和存儲器中得到的 結(jié)果被送往公共數(shù)據(jù)總線 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?指令運行的三個階段 發(fā)射 :從指令隊列中 取到下一條指令 ,指令隊列按 FIFO順序維護,以保證正確的數(shù)據(jù)流。如果 沒有空閑 的保留站,則說明發(fā)生 結(jié)構(gòu)冒險 ,指令會被 停頓 ,直至 出現(xiàn)可用的保留站 或緩存。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?指令運行的三個階段 執(zhí)行 :如果有一個或多個操作數(shù)處于不可用狀態(tài),則監(jiān)視公共數(shù)據(jù)總線,等待這些操作數(shù)被計算出來。當(dāng)指令所需的所有操作數(shù)都已 就緒 時,該指令將 在相應(yīng)的功能單元中執(zhí)行 。如果多條指令在同一個時鐘周期內(nèi)就緒,則功能單元將被迫在就緒指令間 做出選擇 。這個約束可以確保在執(zhí)行過程中引起異常的指令會被執(zhí)行。 當(dāng)指令已經(jīng)被發(fā)射且正在等待源操作數(shù)時, 標(biāo)簽字段 將 指向 包含將產(chǎn)生源操作數(shù)指令的 保留站號,比如 0則表明操作數(shù)已經(jīng)在寄存器中就緒。 每個保留站有七個字段,見 P66. 基于硬件的推測 當(dāng)我們試圖進一步開發(fā)指令級并行時, 維護控制相關(guān)性便成為一個嚴(yán)重的負(fù)擔(dān) 。為了保持最高性能,一個寬發(fā)射處理器可能需要 每個時鐘周期都執(zhí)行一條轉(zhuǎn)移指令 ,因此,要想進一步開發(fā)并行度,就必須克服控制相關(guān)帶來的問題。 基于硬件的推測 ? 基于硬件的推測綜合以下三種思想 通過動態(tài)轉(zhuǎn)移預(yù)測 選擇 要執(zhí)行的指令,通過推測技術(shù) 允許指令在控制相關(guān)消除之前開始執(zhí)行(能夠消除錯誤推測序列的影響),通過 動態(tài)調(diào)度 處理幾個不同的 基本塊之間的調(diào)度 (作為比較,沒有推測的動態(tài)調(diào)度只能在基本塊之間實現(xiàn)部分重疊) 基于硬件的推測 ? 基于硬件的推測 為了擴展 Tomasulo算法并使其支持推測技術(shù),必須 將指令結(jié)果的旁路操作 (推測執(zhí)行指令需要指令結(jié)果的旁路操作) 從實際的指令完成中分離出來 。 基于硬件的推測 ? 基于硬件的推測 實現(xiàn)推測技術(shù)的 關(guān)鍵思想 是允許 指令亂序執(zhí)行,但是要求指令 必須按序提交 ,并且在指令提交之前 阻止所有不可恢復(fù)的動作 (比如更新狀態(tài)或產(chǎn)生異常)。在指令執(zhí)行過程中需要一組 硬件緩存 的支持,使用這些緩存 保存已經(jīng)執(zhí)行完 但 還沒有提交 的指令執(zhí)行結(jié)果,這些硬件緩存稱為 重排序緩存 。 在指令運算完成到提交這段時間內(nèi),重排序緩存為指令保存結(jié)果 。 基于硬件的推測 ? 重
點擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1