freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

浙江工商大學計算機體系結構第2章指令級并行及其開發(fā)(編輯修改稿)

2025-06-15 10:51 本頁面
 

【文章內(nèi)容簡介】 ?用 Tomasulo方法進行動態(tài)調(diào)度 算法由 Robert Tomasulo 提出,通過對操作數(shù)何時可用進行跟蹤以 減少 RAW冒險 ,通過引入寄存器 重命名 減少 WAW和 WAR冒險 。該方法的 改進版本 的共同特點是通過跟蹤指令的相關性使指令在操作數(shù)可用時立即開始執(zhí)行,通過寄存器重命名減少數(shù)據(jù)冒險。 寄存器重命名 是指通過重命名所有的目標寄存器,包括指令序列中 位置靠前 的指令 將要讀和寫的寄存器 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ? 保留站 : 在 Tomasulo算法中,寄存器重命名是通過 保留站 實現(xiàn)的,保留站為等待發(fā)射的指令保存操作數(shù)?;舅枷胧牵? 當 操作數(shù)可用時 , 保留站 馬上 取操作數(shù) 并將其 緩存,從而 避免從寄存器中讀操作數(shù) ; 即將執(zhí)行的指令 指定保留站為其提供數(shù)據(jù)輸入 ; 當對寄存器的后續(xù)寫操作在執(zhí)行過程中發(fā)生重疊時,只允許 最后一個 實際 更新寄存器 。 在指令被發(fā)射后,它所需要的操作數(shù)所對應的 寄存器被重命名為保留站的名字 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?保留站 保留站與寄存器堆相比有兩個重要特點,首先,冒險檢測和執(zhí)行控制是分布的,一個單元中的指令何時可以開始執(zhí)行是由該單元 保留站所掌握的信息決定的 ;其次,結果將從緩存它們的 保留站中直接傳送給功能單元 ,而 不是通過寄存器傳送 ,這是通過一條公共結果總線 /公共數(shù)據(jù)總線 實現(xiàn)的,它使得等待操作數(shù)的所有單元可以同時取到操作數(shù)。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ? Tomasulo算法處理器結構 該處理器基本結構見圖 ,包括浮點單元和 loadstore單元。每個 保留站保存一條 已經(jīng) 被發(fā)射并等待執(zhí)行的指令 ,如果指令所需要的操作數(shù)已經(jīng)被計算出來,那么保留站 需要保存該操作數(shù) ,否則要保存將要提供該操作數(shù)的 保留站的名字 。 loadstore緩存 保存從存儲器中讀出或即將要保存到存儲器中去的 數(shù)據(jù)或數(shù)據(jù)地址 。 浮點寄存器 通過 一對總線 和 功能單元相連 ,通過一條 單獨的總線和 store緩存相連 。從功能單元和存儲器中得到的 結果被送往公共數(shù)據(jù)總線 。 保留站均設置 標簽域 ,用于 流水線控制 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?指令運行的三個階段 發(fā)射 :從指令隊列中 取到下一條指令 ,指令隊列按 FIFO順序維護,以保證正確的數(shù)據(jù)流。如果有匹配的 空閑保留站 ,并且指令的 操作數(shù)的值也保存 在寄存器中 ,則將指令和操作數(shù)的值 一起發(fā)射到該保留站中 。如果 沒有空閑 的保留站,則說明發(fā)生 結構冒險 ,指令會被 停頓 ,直至 出現(xiàn)可用的保留站 或緩存。如果 操作數(shù)不在寄存器中 ,則需要 跟蹤 將要產(chǎn)生該操作數(shù)的功能單元 ,寄存器重命名在這一步進行。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?指令運行的三個階段 執(zhí)行 :如果有一個或多個操作數(shù)處于不可用狀態(tài),則監(jiān)視公共數(shù)據(jù)總線,等待這些操作數(shù)被計算出來。當一個 操作數(shù)可用時 ,該操作數(shù)將被放 入等待它的保留站中 。當指令所需的所有操作數(shù)都已 就緒 時,該指令將 在相應的功能單元中執(zhí)行 。通過在操作數(shù)可用之前 延遲指令的執(zhí)行,避免了 RAW冒險 。如果多條指令在同一個時鐘周期內(nèi)就緒,則功能單元將被迫在就緒指令間 做出選擇 。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ?指令運行的三個階段 執(zhí)行 :為了保護異常行為,在程序順序中的所有前序轉移完成之前,任何指令都不能開始執(zhí)行。這個約束可以確保在執(zhí)行過程中引起異常的指令會被執(zhí)行。 寫結果 :當結果就緒時,將其寫到公共數(shù)據(jù)總線上,并由此送往等待它的寄存器和保留站。 當指令已經(jīng)被發(fā)射且正在等待源操作數(shù)時, 標簽字段 將 指向 包含將產(chǎn)生源操作數(shù)指令的 保留站號,比如 0則表明操作數(shù)已經(jīng)在寄存器中就緒。 采用動態(tài)調(diào)度克服數(shù)據(jù)冒險 ? Tomasulo算法 Tomasulo方法采用 總線廣播結果 的方式,由保留站監(jiān)聽,這種方法實現(xiàn)了靜態(tài)流水線調(diào)度中直接通路和旁路技術的功能,而在動態(tài)調(diào)度方法中,為了達到同樣的目標, 需要在源和結果之間增加一個時鐘周期的時延 ,與功能單元產(chǎn)生結果相比,動態(tài)調(diào)度流水線中生產(chǎn)指令和消費指令之間的有效時延至少要 多花一個時鐘周期 。 每個保留站有七個字段,見 P66. 基于硬件的推測 當我們試圖進一步開發(fā)指令級并行時, 維護控制相關性便成為一個嚴重的負擔 。轉移預測技術減少了直接由轉移引起的停頓,但是要想使處理器在一個時鐘周期內(nèi)執(zhí)行多條指令, 僅靠轉移預測恐怕無法使我們獲得期望的指令級并行度 。為了保持最高性能,一個寬發(fā)射處理器可能需要 每個時鐘周期都執(zhí)行一條轉移指令 ,因此,要想進一步開發(fā)并行度,就必須克服控制相關帶來的問題??梢?通過推測轉移的結果 , 并按照推測正確的情況執(zhí)行指令 ,以達到克服控制相關的目的。 基于硬件的推測 ? 基于硬件的推測綜合以下三種思想 通過動態(tài)轉移預測 選擇 要執(zhí)行的指令,通過推測技術 允許指令在控制相關消除之前開始執(zhí)行(能夠消除錯誤推測序列的影響),通過 動態(tài)調(diào)度 處理幾個不同的 基本塊之間的調(diào)度 (作為比較,沒有推測的動態(tài)調(diào)度只能在基本塊之間實現(xiàn)部分重疊) 基于硬件的推測 ? 基于硬件的推測 為了擴展 Tomasulo算法并使其支持推測技術,必須 將指令結果的旁路操作 (推測執(zhí)行指令需要指令結果的旁路操作) 從實際的指令完成中分離出來 。通過這種分離,可以允許指令將它的執(zhí)行結果旁路給其他指令,而在確定而不是推測指令的 執(zhí)行之前 , 不允許做任何更新 。 基于硬件的推測 ? 基于硬件的推測 實現(xiàn)推測技術的 關鍵思想 是允許 指令亂序執(zhí)行,但是要求指令 必須按序提交 ,并且在指令提交之前 阻止所有不可恢復的動作
點擊復制文檔內(nèi)容
試題試卷相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1