freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中國(guó)科學(xué)技術(shù)大學(xué)(文件)

 

【正文】 ad or store instruction 187。 EX/ ← ID/ + ( ID/ 2) 187。 中國(guó)科學(xué)技術(shù)大學(xué) – Load or store instruction 187。 187。 ID/ ← IF/。 EX/) {EX/} else {PC+4})。 流水段所需時(shí)間不均衡將降低加速比 187。流水線的性?xún)r(jià)比可以定義為 PCR = Throughput/(c+k*h), 其中 Throughput = 1/t, t為 t_{latch}+T/k, t_{latch}為鎖存器的延遲時(shí)間, T為在非流水線的機(jī)器上采用順序執(zhí)行方式完成一個(gè)任務(wù)所花費(fèi)的總時(shí)間。 Repeat Interval – 問(wèn)題:結(jié)構(gòu)相關(guān)(增多);數(shù)據(jù)相關(guān)、控制相關(guān)引起的 stall增多;有新的沖突源產(chǎn)生;定向路徑增多; 異常處理復(fù)雜 – MIPS R4000 8級(jí)流水線 187。 Instruction 2, instruction 3, ….instruction n 1 未執(zhí)行完的指令 187。 盡快確認(rèn) 187。 中國(guó)科學(xué)技術(shù)大學(xué) 精確中斷與長(zhǎng)流水線 ? 例如 DIVF F0,F2,F4 ADDF F10,F10,F8 SUBF F12,F12,F14 ? ADDF 和 SUBF都在 DIVF前完成 ? 如果 DIVF導(dǎo)致異常,會(huì)如何? – 非精確中斷 ? Ideas??? 中國(guó)科學(xué)技術(shù)大學(xué) 處理中斷 4種可能的辦法 ? 方法 1:忽略這種問(wèn)題,當(dāng)非精確處理 – 原來(lái)的 superputer的方法 – 但現(xiàn)代計(jì)算機(jī)對(duì) IEEE 浮點(diǎn)標(biāo)準(zhǔn)的異常處理,虛擬存儲(chǔ)的異常處理要求必須是精確中斷。 列表所有待寫(xiě)的目的寄存器 187。 ? 精確中斷對(duì)整數(shù)流水線而言,不是太難實(shí)現(xiàn) – 指令執(zhí)行的中途改變機(jī)器的狀態(tài) – 例如 IA32 的自動(dòng)增量尋址模式 中國(guó)科學(xué)技術(shù)大學(xué) DLX (MIPS)中的異常 ? IF – page fault, misaligned address, memory protection violation ? ID – undefined or illegal opcode ? EX – arithmetic exception ? MEM – page fault, misaligned address, memory protection violation ? WB – none 中國(guó)科學(xué)技術(shù)大學(xué) DLX (MIPS)中多周期操作的處理 ? 問(wèn)題 – 浮點(diǎn)操作在 1~ 2個(gè) cycles完成是不現(xiàn)實(shí)的,一般要花費(fèi)較長(zhǎng)時(shí)間 – 在 DLX(MIPS)中如何處理 ? 在 1到 2個(gè) cycles時(shí)間內(nèi)完成的處理方法 – 采用較慢的時(shí)鐘源,或 – 在 FP部件中延遲其 EX段 ? 現(xiàn)假設(shè) FP指令與整數(shù)指令采用相同的流水線,那么 – EX 段需要循環(huán)多次來(lái)完成 FP操作,循環(huán)次數(shù)取決于操作類(lèi)型 – 有多個(gè) FP功能部件,如果發(fā)射出的指令導(dǎo)致結(jié)構(gòu)或數(shù)據(jù)相關(guān),需暫停 中國(guó)科學(xué)技術(shù)大學(xué) 對(duì) DLX(MIPS)的擴(kuò)充 四個(gè)功能部件 ? Integer 部件處理: Loads, Store, Integer ALU操作和Branch ? FP/Integer 乘法部件:處理浮點(diǎn)數(shù)和整數(shù)乘法 ? FP加法器:處理 FP加,減和類(lèi)型轉(zhuǎn)換 ? FP/Integer除法部件:處理浮點(diǎn)數(shù)和整數(shù)除法 ? 這些功能部件未流水化 中國(guó)科學(xué)技術(shù)大學(xué) 擴(kuò)展的 DLX(MIPS)流水線 中國(guó)科學(xué)技術(shù)大學(xué) Latency amp。預(yù)測(cè)分支失敗 187。 硬件:定向技術(shù)( forwarding) 187。 –編譯器預(yù)測(cè)分支轉(zhuǎn)移方向的能力。把延遲分支看成是由原來(lái)的分支指令和若干個(gè)延遲槽構(gòu)成,不管分支是否成功,都要按順序執(zhí)行延遲槽中的指令。 . BNEZ, BEQZ on DLX 使得 CC可以在 ID段確定 ? 軟件(通過(guò)編譯器)的方法: – 調(diào)度一些指令放入分支的延遲槽中 – 預(yù)測(cè)的方法:統(tǒng)計(jì)分支成功和失敗的情況,提高預(yù)測(cè)精度 中國(guó)科學(xué)技術(shù)大學(xué) 新的 DLX (MIPS)數(shù)據(jù)通路 中國(guó)科學(xué)技術(shù)大學(xué) 改進(jìn)后流水線的分支操作 中國(guó)科學(xué)技術(shù)大學(xué) 四種可能的解決控制相關(guān)的方法 1: Stall 直到分支方向確定 2: 預(yù)測(cè)分支失敗 – 直接執(zhí)行后繼指令 – 如果分支實(shí)際情況為分支成功,則撤銷(xiāo)流水線中的指令對(duì)流水線狀態(tài)的更新 – DLX( MIPS)分支指令平均 47%為分支失敗 要保證: 分支結(jié)果出來(lái)之前不會(huì)改變處理機(jī)的狀態(tài),以便一旦猜錯(cuò)時(shí),處理機(jī)能夠回退到原先的狀態(tài)。 中國(guó)科學(xué)技術(shù)大學(xué) 中國(guó)科學(xué)技術(shù)大學(xué) 回顧 DLX (MIPS)數(shù)據(jù)通路 分支指令 IF ID EX MEM WB 分支目標(biāo)指令 IF stall stall IF ID EX MEM WB 分支目標(biāo)指令 +1 IF ID EX MEM WB 分支目標(biāo)指令 +2 IF ID EX MEM 分支目標(biāo)指令 +3 IF ID EX 分支指令 IF ID EX MEM WB 分支后繼指令 IF stall stall IF ID EX MEM WB 分支后繼指令 +1 IF ID EX MEM WB 分支后繼指令 +2 IF ID EX MEM 分支后繼指令 +3 IF ID EX 簡(jiǎn)單處理分支指令:分支成功的情況 簡(jiǎn)單處理分支指令:分支失敗的情況 中國(guó)科學(xué)技術(shù)大學(xué) 中國(guó)科學(xué)技術(shù)大學(xué) 減少分支延時(shí)的方法 ? 硬件的方法 – 修改數(shù)據(jù)通路:使得目標(biāo)地址和分支條件盡早確定,其中之一盡早確定是沒(méi)有用的 187。 在條件判定和轉(zhuǎn)移地址計(jì)算都完成后,才改變 PC值。 當(dāng)前指令的執(zhí)行需要上一條指令的結(jié)果 ? 使用等待策略總是可以解決相關(guān) – 流水線控制必須能檢測(cè)相關(guān),否則由軟件設(shè)計(jì)來(lái)避免 – 采用相應(yīng)操作解決相關(guān) (or 等待 ) 中國(guó)科學(xué)技術(shù)大學(xué) Mem 單個(gè)存儲(chǔ)器引起的結(jié)構(gòu)相關(guān) I n s t r. O r d e r Time (clock cycles) Load Instr 1 Instr 2 Instr 3 Instr 4 ALU Mem Reg Mem Reg ALU Mem Reg Mem Reg ALU Mem Reg Mem Reg ALU Reg Mem Reg ALU Mem Reg Mem Reg Detection is easy in this case! (right half highlight means read, left half write) 中國(guó)科學(xué)技術(shù)大學(xué) 消除結(jié)構(gòu)相關(guān) I n s t r. O r d e r Time (clock cycles) Load Instr 1 Instr 2 Stall Instr 3 Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg Cycle 1 Cycle 2 Cycle 3 Cycle 4 Cycle 6 Cycle 7 Cycle 5 Reg ALU DMem Ifetch Reg Bubble Bubble Bubble Bubble Bubble 中國(guó)科學(xué)技術(shù)大學(xué) 結(jié)構(gòu)相關(guān)對(duì)性能的影響 ? 例如 : 如果每條指令平均訪存 次,而每個(gè)時(shí)鐘周期只能訪存一次,那么 – 在其他資源 100%利用的前提下,平均 CPI ? 中國(guó)科學(xué)技術(shù)大學(xué) 流水線的加速比計(jì)算 p ip el in eddu n p ip el in e T i m eC ycle T i m eC ycle C P I s tall P i p e lin e C P I I d e a ld e p th P i p e lin e C P I I d e a l S p e e d u p ????p ip el in eddu n p ip el in e T i m eC ycle T i m eC ycle C P I s tall P i p e lin e 1d e p th P i p e lin e S p e e d u p ???I n s tp e r cy cl e s S t al l A v e r ag e C P I I d e al C P I p ip el in ed ??For simple RISC pipeline, CPI = 1: 中國(guó)科學(xué)技術(shù)大學(xué) 例如: Dualport vs. Singleport ? 機(jī)器 A: Dual ported memory (―Harvard Architecture‖) ? 機(jī)器 B: Single ported memory ? 存在結(jié)構(gòu)相關(guān)的機(jī)器 B的時(shí)鐘頻率是機(jī)器 A的時(shí)鐘頻率的 ? Ideal CPI = 1 ? 在機(jī)器 B中 load指令會(huì)引起結(jié)構(gòu)相關(guān),所執(zhí)行的指令中 Loads指令占 40% Average instruction time = CPI * Clock cycle time 無(wú)結(jié)構(gòu)相關(guān)的機(jī)器 A: Average Instruction time = Clock cycle time 存在結(jié)構(gòu)相關(guān)的機(jī)器 B: Average Instruction time = (1+*1) * clock cycle time / = * clock cycle time 中國(guó)科學(xué)技術(shù)大學(xué) I n s t r. O r d e r add r1,r2,r3 sub r4,r1,r3 and r6,r1,r7 or r8,r1,r9 xor r10,r1,r11 Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg Reg ALU DMem Ifetch Reg 數(shù)據(jù)相關(guān)問(wèn)題 Time (clock cycles) IF ID/RF EX MEM WB 中國(guó)科學(xué)技術(shù)大學(xué) ? 寫(xiě)后讀相關(guān) (Read After Write (RAW)) InstrJ tries to read operand before InstrI writes it ? 由于實(shí)際的數(shù)據(jù)交換需求而引起的 三種基本的數(shù)據(jù)相關(guān) I: add r1,r2,r3 J: sub r4,r1,r3 中國(guó)科學(xué)技術(shù)大學(xué) ? 讀后寫(xiě)相關(guān) Write After Read (WAR) InstrJ writes operand before InstrI reads it ? 編譯器編寫(xiě)者稱(chēng)之為 ―antidependence‖( 反相關(guān)),是由于重復(fù)使用寄存器名 ―r1‖引起的 . ? DLX(MIPS) 5 段基本流水線不會(huì)有此類(lèi)相關(guān)因?yàn)?: – 所有的指令都是 5段 , 并且 – 讀操作總是在第 2段,而 –寫(xiě)操作在第 5段 I: sub r4,r1,r3 J: add r1,r2,r3 K: mul r6,r1,r7 中國(guó)科學(xué)技術(shù)大學(xué) ? 寫(xiě)后寫(xiě)相關(guān)( Write After Write
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1