freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

精確斷點(diǎn)與不精確斷點(diǎn)-文庫(kù)吧資料

2024-08-14 13:42本頁(yè)面
  

【正文】 超標(biāo)量處理機(jī),操作部件不采用流水線的時(shí)空?qǐng)D1 2 3 4 5 6 7 8 9 10 11流水線 1 I1 I F 1 I D 1 F A D D W R 1 時(shí)鐘周期流水線 2 I2 I F 2 I D 2 F M U L W R 2流水線 1 I3I F 1 I D 1 F A D D W R 1流水線 2 I4I F 2 I D 2 F M U L W R 2 指令I(lǐng)F :取指令, ID :指令譯碼, FADD :浮點(diǎn)加法, FMUL :浮點(diǎn)乘法, WR :寫回結(jié)果? 操作部件不采用流水線: 做完 4條指令總共用了 11個(gè)周期, 有 5個(gè)空閑周期 。 總的執(zhí)行時(shí)間為 8個(gè)周期 , 節(jié)省 2個(gè)周期。 少了 5個(gè)空閑時(shí)鐘周期 。 超標(biāo)量處理機(jī)的指令級(jí)并行度: 1< ILP< m 有先行指令窗口的超標(biāo)量處理機(jī)的流水線結(jié)構(gòu) 取指令 指令譯碼 執(zhí)行指令 寫回結(jié)果 F A 1 F A 2 F A 3 浮點(diǎn)加法部件 指令 Cac he IF 1 ID 1 M D 1 M D 2 M D 3 WR1 通用寄存器 后行寫數(shù)棧 乘除法部件 指令 Cac he IF 2 ID 2 AL WR2 通用寄存器 后行寫數(shù)棧 定點(diǎn)算術(shù)邏輯部件 IF 3 ID 3 LS 先行指令窗口 取數(shù)存數(shù)部件 FA :浮點(diǎn)加減法運(yùn)算, MD :乘除法運(yùn)算, AL :定點(diǎn)算術(shù)邏輯運(yùn)算, LS 取數(shù)存數(shù) 多流水線調(diào)度 順序發(fā)射 (inorder issue)與亂序發(fā)射 (outorder issue):指令發(fā)射順序是按照程序中指令排列順序進(jìn)行的稱為順序發(fā)射 順序完成 (inorder pletion)與亂序完成 (outorder pletion): 指令完成順序是按照程序中指令排列順序進(jìn)行的稱為順序完成 多流水線的調(diào)度主要有三種方法: 順序發(fā)射順序完成 順序發(fā)射亂序完成 亂序發(fā)射亂序完成 以如下 6條指令組成的程序?yàn)槔?,說(shuō)明這三種調(diào)度方法 I1: LOAD R1, A ; R1←(A) I2: FADD R2, R1 ; R2←(R2) + (R1) I3: FMUL R3, R4 ; R3←(R3) (R4) I4: FADD R4, R5 ; R4←(R4) + (R5) I5: DEC R6 ; R6←(R6) - 1 I6: FMUL R6, R7 ; R6←(R6) + (R7) 6條指令中有 4個(gè)數(shù)據(jù)相關(guān),包括 2個(gè)寫讀相關(guān), 1個(gè)讀寫相關(guān)和 1個(gè)寫寫相關(guān)。 例如: Intel公司的 i860、 i960、 Pentium, Motolora公司的 MC88110, IBM公司的 Power 6000,TI公司生產(chǎn)SuperSPARC等 操作部件的個(gè)數(shù)一般多于每個(gè)周期發(fā)射的指令條數(shù)。 目標(biāo)是每個(gè)時(shí)鐘周期平均執(zhí)行多條指令, ILP的期望值大于 1。 多個(gè)取指令部件,多個(gè)指令譯碼部件和多個(gè)寫結(jié)果部件。 目標(biāo)是每個(gè)時(shí)鐘周期平均執(zhí)行一條指令, ILP的期望值為 1。 整數(shù) 部件 整數(shù) 部件 位操作 部件 浮點(diǎn)加 部件 乘法 部件 除法 部件 圖形 部件 圖形 部件 內(nèi)部總線 讀數(shù)/存數(shù) 部件 通用寄 存器堆 擴(kuò)展 寄存器堆 目標(biāo) 指令 Cache 指令分配/ 轉(zhuǎn)移部件 數(shù)據(jù) Cache ( 8K B ) 指令 Cache ( 8K B ) 32 位地址總線 64 位數(shù)據(jù)總線 系統(tǒng)總線 超標(biāo)量處理機(jī) MC88110 的結(jié)構(gòu) Motorola公司的 MC88110 有 10個(gè)操作部件 兩個(gè)寄存器堆: 整數(shù)部件通用寄存器堆, 32個(gè) 32位寄存器 浮點(diǎn)部件擴(kuò)展寄存器堆, 32個(gè) 80位寄存器 緩沖深度為 4的先行讀數(shù)棧 緩沖深度為 3的后行寫數(shù)棧 兩個(gè)獨(dú)立的高速 Cache中,各為 8KB,采用兩路組相聯(lián)方式 轉(zhuǎn)移目標(biāo)指令 Cache,用于存放另一條分支上的指令 單發(fā)射與多發(fā)射 : 每個(gè)周期只取一條指令、只譯碼一條指令,只執(zhí)行一條指令,只寫回一個(gè)運(yùn)算結(jié)果。 多操作部件標(biāo)量處理機(jī): 一條指令流水線 , 多個(gè)獨(dú)立的操作部件, 指令級(jí)并行度小于 1。最早在大型機(jī) IBM 360/91的浮點(diǎn)處理部件中被采用。 Tomasulo動(dòng)態(tài)調(diào)度算法 P310 實(shí)用的動(dòng)態(tài)調(diào)度算法主要有兩種 : (1)集中控制: CDC計(jì)分牌 (scorebord)算法, 最先在 CDC 6600大型機(jī)中采用。 一個(gè)實(shí)際例子: Loop: LD F0, 0(R1) ADD F0, F2 SD 0(R1), F0 LD F0, 8(R1) ADD F0, F2 SD 8(R1), F0 LD F0, 16(R1) ADD F0, F2 SD 16(R1), F0 LD F0, 24(R1) ADD F0, F2 SD 24(R1), F0 SUBI R1, R1, 32 BNEZ R1, Loop Loop: LD F0, 0(R1) LD F4, 8(R1) LD F6, 16(R1) LD F8, 24(R1) ADD F0, F2 ADD F4, F2 ADD F6, F2 ADD F8, F2 SD 0(R1), F0 SD 8(R1), F4 SUBI R1, R1, 32 SD 16(R1), F6 BNEZ R1, Loop SD 24(R1), F8 : k: LOAD F1, A k+1: FADD F1, F2 k+2: FMUL F1, F3 k+3: STORE F1, B A k+1 FADD k + 1 F2 k k + 1 F1 k + 3 k + 2 B k+2 FMUL k + 2 F3 A K , k+1 FADD k + 1 F2F1k+1k+2 k + 2Bk+2,k+3FMUL k + 2F3專門設(shè)置: A→FADD 、 FMUL→B 、 FADD→FMUL 三條專用路徑。
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1