freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計算機體系結(jié)構(gòu)之流水線技術(shù)-資料下載頁

2025-01-16 12:56本頁面
  

【正文】 VLIW處理機主要由很規(guī)則的寄存器、存儲器、運算部件和數(shù)據(jù)通路等組成,不規(guī)則的控制器很簡單,而且,不需要復(fù)雜的指令并行調(diào)度窗口及多發(fā)射機制等。 ? 4. 編譯器的實現(xiàn)難度大 ? VLIW并行編譯器主要依靠指令級并行算法、數(shù)據(jù)相關(guān)性分析算法、寄存器分配算法及并行編譯技術(shù)等來顯式開發(fā)程序中的指令級并行性,從而提高處理機的運行速度。要研制指令級并行度高的編譯器難度很大。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) VLIW處理機 ? 1. 安騰 (Intanium)處理機 ? Intel公司與 HP公司聯(lián)合研制 ? 在 Intel公司稱為 IA64處理機 ? 安騰 (Intanium)處理機有自己獨立的系統(tǒng)軟件和應(yīng)用軟件 ? 2. DAISY (Dynamically Architected Instruction Set from Yorktown) 處理機 ? 由 IBM公司研制 ? 采用動態(tài)二進制轉(zhuǎn)換技術(shù)實現(xiàn)與 X86處理機兼容 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 3. Crusoe處理機 ? 由 Transmeta公司研制 ? 已經(jīng)大量應(yīng)用于筆記本計算機中,一個重要特點是功耗很低。 ? 采用動態(tài)二進制轉(zhuǎn)換技術(shù)把 X86通用處理機的程序直接映射到 Crusoe處理機的 VLIW結(jié)構(gòu)中執(zhí)行。 ? 4. 嵌入式、 DSP、 JAVA虛擬機 ? 很多專用處理機采用 VLIW體系結(jié)構(gòu) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 多指令流出 — CPI1 — 高級流水線 多指令流出技術(shù) 基于靜態(tài)調(diào)度的多流出技術(shù)( *) 基于動態(tài)調(diào)度的多流出技術(shù) 超長指令字技術(shù)( VLIW)( *) 多流出處理器受到的限制 超流水線處理機( *) 循環(huán)展開和指令調(diào)度 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 一個時鐘周期內(nèi)流出多條指令, CPI< 1。 ? 單流出和多流出處理機執(zhí)行指令的時空圖對比 多指令流出技術(shù) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) IF 1 2 3 4 5 6 7 時鐘周期 指令 I1 I2 I3 ID EX ME M WBB IF ID EX ME M WBB IF ID EX ME M WBB 1 2 3 4 5 6 7 時鐘周期 指令 I1 I2 I3 IF ID EX ME M WBB IF IF ID ID EX EX ME M ME M WBB WBB IF ID EX ME M WBB IF ID EX ME M WBB IF ID EX ME M WBB IF ID EX ME M WBB IF ID EX ME M WBB IF ID EX ME M WBB 單流出時空圖 多流出時空圖 單流出和多流出處理機執(zhí)行指令的時空圖 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 多流出處理機有兩種基本風格: ? 超標量 ( Superscalar) ? 在每個時鐘周期流出的指令條數(shù) 不固定 ,依代碼的具體情況而定。(有上限) ? 設(shè)這個上限為 n,就稱該處理機為 n流出。 ? 可以通過編譯器進行靜態(tài)調(diào)度,也可以基于Tomasulo算法進行動態(tài)調(diào)度。 ? 超長指令字 VLIW( Very Long Instruction Word) ? 在每個時鐘周期流出的指令條數(shù)是 固定的 ,這些指令構(gòu)成一條長指令或者一個指令包。 ? 指令包中,指令之間的并行性是通過指令顯式地表示出來的。 ? 指令調(diào)度是由編譯器靜態(tài)完成的。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 2. 超標量處理機與 VLIW處理機相比有 兩個優(yōu)點: ? 超標量結(jié)構(gòu)對程序員是透明的,因為處理機能自己檢測下一條指令能否流出,從而不需要重新排列指令來滿足指令的流出。 ? 即使是沒有經(jīng)過編譯器針對超標量結(jié)構(gòu)進行調(diào)度優(yōu)化的代碼或是舊的編譯器生成的代碼也可以運行,當然運行的效果不會很好。 ? 要想達到很好的效果,方法之一: 使用動態(tài)超標量調(diào)度技術(shù)。 3. 下表列出了一些基本的多流出技術(shù)、這些技術(shù)的特點以及采用這些技術(shù)的處理機例子。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 技 術(shù) 流出 結(jié)構(gòu) 沖突 檢測 調(diào) 度 主要特點 處理機實例 超標量 (靜態(tài)) 動態(tài) 硬件 靜態(tài) 順序執(zhí)行 Sun UltraSPARCⅡ /Ⅲ 超標量 (動態(tài)) 動態(tài) 硬件 動態(tài) 部分亂序執(zhí)行 IBM Power2 超標量 (猜測) 動態(tài) 硬件 帶有猜 測的動 態(tài)執(zhí)行 帶有猜測的 亂序執(zhí)行 Pentium Ⅲ /4, MIPS R10K, Alpha 21264, HP PA 8500, IBM RS64Ⅲ VLIW /LIW 靜態(tài) 軟件 靜態(tài) 流出包之間 沒有沖突 Trimedia, i860 EPIC 主要是 靜態(tài) 主要是 軟件 主要是 靜態(tài) 相關(guān)性被編譯 器顯式地標記出來 Itanium 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 在典型的超標量處理器中,每個時鐘周期可流出 1到 8條 指令。 ? 指令按序流出,在流出時進行沖突檢測。 在當前流出的指令序列中,不存在數(shù)據(jù)沖突或者相關(guān)沖突。 舉例:一個 4流出 的靜態(tài)調(diào)度超標量處理機 ? 在取指令階段,流水線將從取指令部件收到 1~ 4條指令(稱為流出包)。 ? 在一個時鐘周期內(nèi),這些指令有可能是全部都能流出,也可能是只有一部分能流出。 基于靜態(tài)調(diào)度的多流出技術(shù) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 流出部件檢測結(jié)構(gòu)沖突或者數(shù)據(jù)沖突。 一般分兩階段實現(xiàn): ? 第一階段: 進行流出包內(nèi)的沖突檢測,選出初步判定可以流出的指令。 ? 第二階段: 檢測所選出的指令與正在執(zhí)行的指令是否有沖突。 MIPS處理機是怎樣實現(xiàn)超標量的呢? 假設(shè):每個時鐘周期流出兩條指令: 1條整數(shù)型指令 + 1條浮點操作指令 ? 其中,把 load指令、 store指令、分支指令歸類為整數(shù)型指令。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 要求: 同時取兩條指令( 64位 ),譯碼兩條指令( 64位 )。 ? 對指令的處理包括以下步驟: ? 從 Cache中取兩條指令。 ? 確定那幾條指令可以流出( 0~ 2條指令 )。 ? 把它們發(fā)送到相應(yīng)的功能部件。 ? 雙流出超標量流水線中指令的執(zhí)行過程 ? 假設(shè):所有的浮點指令都是加法指令,其執(zhí)行時間為兩個時鐘周期。 ? 為簡單起見,下圖中總是把整數(shù)指令放在浮點指令的前面。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 指令類型 流水線工作情況 整數(shù)指令 IF ID EX MEM WB 浮點指令 IF ID EX EX MEM WB 整數(shù)指令 IF ID EX MEM WB 浮點指令 IF ID EX EX MEM WB 整數(shù)指令 IF ID EX MEM WB 浮點指令 IF ID EX EX MEM WB 整數(shù)指令 IF ID EX MEM WB 浮點指令 IF ID EX EX MEM 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 4. 采用 “ 1條整數(shù)型指令 + 1條浮點指令 ” 并行流出的方式,需要增加的硬件很少。 5. 浮點 load或浮點 store指令將使用整數(shù)部件,會增加對浮點寄存器的訪問沖突。 增設(shè)一個浮點寄存器的讀 /寫端口。 6. 由于流水線中的指令多了一倍,定向路徑也要增加。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 7. 限制超標量流水線的性能發(fā)揮的障礙。 ? load指令 ? load后續(xù) 3條 指令都不能使用其結(jié)果,否則就會引起停頓。 ? 分支延遲 ? 如果分支指令是流出包中的第一條指令,則其延遲是 3個 時鐘周期; ? 否則就是流出包中的第二條指令,其延遲就是 兩個時鐘周期。 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 擴展 Tomasulo算法: 支持兩路超標量 ? 每個時鐘周期流出兩條指令; ? 一條是整數(shù)指令,另一條是浮點指令。 ? 采用一種比較簡單的方法: ? 指令按順序流向保留站,否則會破壞程序語義。 ? 將整數(shù)所用的表結(jié)構(gòu)與浮點用的表結(jié)構(gòu)分離開,分別進行處理,這樣就可以同時地流出一條浮點指令和一條整數(shù)指令到各自的保留站。 基于動態(tài)調(diào)度的多流出技術(shù) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 把能并行執(zhí)行的多條指令組裝成一條很長的指令。 ( 100多位到幾百位) ? 設(shè)置多個功能部件。 ? 指令字被分割成一些字段,每個字段稱為一個 操作槽,直接獨立地控制一個功能部件。 ? 在 VLIW處理機中,所有的處理和指令安排都是由編譯器完成的。 超長指令字技術(shù)( VLIW) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 5. VLIW存在的一些問題 ? 程序代碼長度增加了 ? 提高并行性而進行的大量的循環(huán)展開。 ? 指令字中的操作槽并非總能填滿。 解決: 采用指令共享立即數(shù)字段的方法,或者采用指 令壓縮存儲、調(diào)入 Cache或譯碼時展開的方法。 ? 采用了鎖步機制 任何一個操作部件出現(xiàn)停頓時,整個處理機都要停頓。 ? 機器代碼的不兼容性 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 指令多流出處理器受哪些因素的限制呢? 主要受以下三個方面的影響: ? 程序所固有的指令級并行性。 ? 硬件實現(xiàn)上的困難。 ? 超標量和超長指令字處理器固有的技術(shù)限制。 多流出處理器受到的限制 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 將每個流水段進一步細分,這樣在一個時鐘周期內(nèi)能夠分時流出多條指令。這種處理機稱為 超流水線處理機。 ? 對于一臺每個時鐘周期能流出 n條 指令的超流水線計算機來說,這 n條 指令不是同時流出的,而是每隔 1/n個時鐘周期流出一條指令。 ? 實際上該超流水線計算機的流水線周期為 1/n個時鐘周期。 ? 一臺每個時鐘周期分時流出兩條指令的超流水線計算機的時空圖。 超流水線處理機 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) IF IF IF IF WBB ME M ID EX IF 1 2 3 4 5 6 7 時鐘周期 指令 I1 I2 I3 ID EX ME M WBB I6 I5 I4 I7 ID EX ME M WBB IF ID EX ME M WBB ID EX ME M WBB IF ID EX ME M WBB ID EX ME M WBB 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 4. 在有的資料上,把指令流水線級數(shù)為 8或 8以上的流水線處理機稱為 超流水線處理機 。 5. 典型的超流水線處理器: SGI公司的 MIPS系列 R4000 ? R4000微處理器芯片內(nèi)有 2個 Cache: ? 指令 Cache和數(shù)據(jù) Cache ? 容量都是 8 KB ? 每個 Cache的數(shù)據(jù)寬度為 64 b ? R4000的核心處理部件: 整數(shù)部件 ? 一個 32 32位的通用寄存器組 ? 一個算術(shù)邏輯部件 ( ALU) ? 一個專用的乘法 /除法部件 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 浮點部件 ? 一個執(zhí)行部件 ? 浮點乘法部件 ? 浮點除法部件 ? 浮點加法 /轉(zhuǎn)換 /求平方根部件 (它們可以并行工作) ? 一個 16 64位的浮點通用寄存器組。浮點通用寄存器組也可以設(shè)置成 32個 32位的浮點寄存器。 ? R4000的指令流水線有 8級 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) 計算機體系結(jié)構(gòu) 北京信息科技大學(xué) ? 各級的功能 ? IF: 取指令的前半步,根據(jù) PC值去啟動對指令 Cache的訪問。 ? IS: 取指令的后半步,在這一級完成對指令 Cache的訪問。 ? RF: 指令譯碼,訪問寄存器組讀取操作數(shù),沖突檢測,并判斷指令 Cache是否命中。 ? E
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1