freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計算機系統(tǒng)結(jié)構(gòu)第四章-展示頁

2025-01-21 15:52本頁面
  

【正文】 令到其消費者指令的實際流動。 ? IPC: Instructions Per Cycle (每個時鐘周期完成的指令條數(shù)) 指令級并行的概念 1. 循環(huán)級并行: ? 使一個循環(huán)中的不同循環(huán)體并行執(zhí)行。 指令級并行的概念 ? 流水線處理機的實際 CPI ? 理想流水線的 CPI加上各類停頓的時鐘周期數(shù): CPI流水線 = CPI理想 + 停頓 結(jié)構(gòu)沖突 + 停頓 數(shù)據(jù)沖突 + 停頓 控制沖突 ? 理想 CPI是衡量流水線最高性能的一個指標(biāo)。 ( ILP: InstructionLevel Parallelism) ? 本章研究: 如何通過各種可能的技術(shù),獲得更多的指令級并行性。第四章 指令級并行 指令級并行的概念 指令的動態(tài)調(diào)度 動態(tài)分支預(yù)測技術(shù) 多指令流出技術(shù) 循環(huán)展開和指令調(diào)度 指令級并行的概念 ? 幾乎所有的處理機都利用流水線來使指令重疊并行執(zhí)行,以達到提高性能的目的。這種指令之間存在的潛在并行性稱為 指令級并行。 硬件+軟件技術(shù) 必須要硬件技術(shù)和軟件技術(shù)互相配合,才能夠最大限度地挖掘出程序中存在的指令級并行。通過減少右邊各項,就能減小總的 CPI,從而提高 IPC。 ? 開發(fā)循環(huán)體中存在的并行性是指令級并行研究的重點之一 ? 最基本的開發(fā)循環(huán)級并行的技術(shù) – 循環(huán)展開( loop unrolling)技術(shù) – 采用向量指令和向量數(shù)據(jù)表示 2. 相關(guān)與流水線沖突 ? 靜態(tài)指令調(diào)度 ? 動態(tài)指令調(diào)度 指令級并行的概念 3. 對于正確地執(zhí)行程序來說,必須保持的最關(guān)鍵的兩個屬性是: 數(shù)據(jù)流 和 異常行為 。 ? 保持異常行為 是指:無論怎么改變指令的執(zhí)行順序,都不能改變程序中異常的發(fā)生情況。 ? 弱化為:指令執(zhí)行順序的改變不能導(dǎo)致程序中發(fā)生新的異常。 ? 相關(guān)包括:名相關(guān),數(shù)據(jù)相關(guān),控制相關(guān)。 ? 具體一次相關(guān)是否會導(dǎo)致實際沖突的發(fā)生以及該沖突會帶來多長的停頓,則是流水線的屬性。 指令的動態(tài)調(diào)度 3. 沖突的解決 1)結(jié)構(gòu)沖突: 停頓(流水線氣泡) 2)數(shù)據(jù)沖突: ? 定向傳送技術(shù) ? 定向傳送與停頓相結(jié)合 ? 指令調(diào)度(依靠編譯器): 前提:在亂序流動的流水線中。 3)控制沖突 : ? 預(yù)測分支失敗 ? 預(yù)測分支成功 ? 延遲轉(zhuǎn)移技術(shù) 都是通過編譯器來實現(xiàn) 靜態(tài)調(diào)度 指令的動態(tài)調(diào)度 ? 靜態(tài)調(diào)度 ? 依靠編譯器對代碼進行靜態(tài)調(diào)度,以減少相關(guān)和沖突。 ? 通過把相關(guān)的指令拉開距離來減少可能產(chǎn)生的停頓。 指令的動態(tài)調(diào)度 一、動態(tài)調(diào)度的基本思想 考慮下面一段代碼: F4, F0, F2 F10, F4, F6 F12, F6, F14 ? F4相關(guān),導(dǎo)致流水線停頓。 指令的動態(tài)調(diào)度 ? 在前面的基本流水線中: ID 檢測 結(jié)構(gòu) 沖突 檢測 數(shù)據(jù) 沖突 ? 一旦一條指令受阻,其后的指令都將停頓。 ( inorder issue) – 讀操作數(shù) ( Read Operands, RO):等待數(shù)據(jù)沖突消失,然后讀操作數(shù)。 ? 例如,考慮下面的代碼 F4, F0, F2 F10, F4, F6 F6, F8, F14 F10, F1, F3 存在反相關(guān) 存在輸出相關(guān) 存在數(shù)據(jù)相關(guān) F10, F4, F6 WAR沖突 WAW沖突 Tomasulo算法 可以通過使用寄存器重命名來消除。 指令的動態(tài)調(diào)度 ? IBM 360/91首先采用了 Tomasulo算法 。 需要更多地依賴于硬件。 – 360/91的訪存時間和浮點計算時間都很長。 考慮之前的代碼: F4, F0, F2 F10, F4, F6 F6, F8, F14 F10, F1, F3 存在反相關(guān) F6 存在輸出相關(guān) F10 存在數(shù)據(jù)相關(guān) F4 消除名相關(guān): 引入兩個臨時寄存器 S和 T,分別將第一個 F10換成 S,將后一個 F6換成 T。 包括: 操作碼、操作數(shù)以及用于檢測和解決沖突的信息。 – 如果操作數(shù)還沒有計算出來,則在該保留站中記錄將產(chǎn)生這個操作數(shù)的保留站的標(biāo)識。 2) 公共數(shù)據(jù)總線 CDB 所有功能部件的計算結(jié)果都是送到 CDB上,由它把這些結(jié)果直接送到(播送到)各個需要該結(jié)果的地方。 ? 它們通過一對總線連接到功能部件,并通過 CDB連接到 store緩沖器 。 – 當(dāng)指令流出時,如果其操作數(shù)還沒有計算出來,則將該指令中相應(yīng)的寄存器號 換名為將產(chǎn)生這個操作數(shù)的保留站的標(biāo)識 。 MUL FO,F2,F4 ADD F2,F0,F6 SUB F6,F8,F4 從指令部件來 浮點寄存器 FP sto r e 緩沖器 l o a d 緩沖器 地址部件 l o a d / sto r e 操作 浮點操作 操作數(shù)總線 操作總線 數(shù)據(jù) 1 1 存儲部件 浮點加法器 浮點乘法器 指令隊列 地址 2 3 2 3 4 5 6 公共數(shù)據(jù)總線( CD B ) 1 2 保留站 標(biāo)識 標(biāo)識 F8 F6 F4 F2 C B A ADD1 MUL1 MUL2 ADD2 ADD3 ADD F2,F0,F6 MUL FO,F2,F4 Qi F0 D SUB F6,F8,F4 從指令部件來 浮點寄存器 FP sto r e 緩沖器 l o a d 緩沖器 地址部件 l o a d / sto r e 操作 浮點操作 操作數(shù)總線 操作總線 數(shù)據(jù) 1 1 存儲部件 浮點加法器 浮點乘法器 指令隊列 地址 2 3 2 3 4 5 6 公共數(shù)據(jù)總線( CD B ) 1 2 保留站 標(biāo)識 標(biāo)識 MUL FO,F2,F4 ADD F2,F0,F6 SUB F6,F8,F4 從指令部件來浮點寄存器地址部件浮點操作操作數(shù)總線操作總線存儲部件 浮點加法器 浮點乘法器指令隊列 公共數(shù)據(jù)總線( )保留站 MUL A, B ADD F2,F0,F6 F8 F6 F4 F2 D C B ADD1 MUL1
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1