freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機體系結構第五章-wenkub.com

2025-04-29 03:34 本頁面
   

【正文】 1815108(4)處理器有乘、加兩條流水線,可同時工作時的時空圖 15108(3)處理器有一個乘、加雙功能靜態(tài)流水線時的時空圖 201510 B= a1*b1+a2*b2+a3*b3+a4*b4 共需做 4乘法和 3加法: c1=a1*b1, c2=a2*b2, c3=a3*b3, c4=a4*b4 d1=c1+c2, d2=c3+c4, d3=d1+d2= A[解答 ]設處理器中每個部件的輸出均可直接送到任何部件的輸入端或存入緩沖器,其間的傳送延時不計,指令和源操作數(shù)均能連續(xù)提供。3210 圖 4 超流水線處理機的時空圖4 8 123 7 112 6 101 5 94 8 123 7 112 6 101 5 94 8 123 7 112 6 101 5 94202103 7 112 6 101 5 91 2 3 4 5 6 7 8 9 10 11 121 2 3 4 5 6 7 8 9 10 11 121 2 3 4 5 6 7 8 9 10 11 12譯碼取指10870運行時,直接控制機器中多個相互獨立的功能部件并行操作,來實現(xiàn)同時執(zhí)行多條指令。讓單處理機在每個時鐘周期里可同時解釋 m( m1) 條指令,稱處理機并行的度為 m。 由上圖的預約表可以得到相應非線性流水線的延遲禁止表 F為 (1, 5, 6, 8)。S4 S5 再看下圖所給出的預約表 :1 2 3 4 5 6 7 8 9 10 11 12 13 14 15S4 1 2 1 2 3 3S3 1 2 3S2 1 2 1 2 3 3S1 1 2 1 2 1 2 3 3 31 2 3 4 5 6 7 8 9 10 11 12 13 14 15S4 1 1 2 2 3 3S3 1 2 3S2 1 1 2 2 3 3S1 1 2 1 1 2 3 2 3 3( 1, 7)調度方案( 3, 5)調度方案 則: 五、加速比的概念V5←V3+V4 ( 4) V0← 存儲器 。 V3← 存儲器 。 本例推遲時間為: 6431=33( τ )4)完成運算用時計算: 順利連接時間 +推遲時間1+6+1+1+7+1+1+6+1+1+4+1+1+14+1+1+7+1+( 641) +33=152(τ)5)性能:6*64/( 152*108S) ≈ 253MFLOPS 三、向量流水處理 向量的處理方式 向量指令的執(zhí)行過程及性能計算四、向量的鏈接特性 沖突 :鄰近向量指令使用了同一個部件 沖突又分為 表面沖突 與 實際沖突 向量鏈接特性圖的繪制 完成運算用時計算: 順利連接時間 +推遲時間 有關時間 、 推遲時間 的計算P192 13題 :在 CRAY1機上,在下列指令組中,組內哪些指令可以鏈接?哪些不可以鏈接?不能鏈接的原因是什么?完成各指令所需的拍數(shù)(設向量長度均為 64,打入寄存器及啟動功能部件各需 1τ )。1)不能順利鏈接時,對畫向量鏈接特性圖的影響 ① 源沖突: 第一次送出畫實線,第二次送出畫虛線 ② 目沖突: 第一次接收畫實線,第二次接收畫虛線 ③ 功能部件沖突: 第一次出現(xiàn)畫實線,第二次出現(xiàn)畫虛線向量長度 64,上述向量指令條條相關,有沖突:2) 為了計算是否需要推遲時間,以及推遲多少時間,先計算沖突部件的 有關時間。 V4←V2+V3。 V7← 1/V5 向量長度 64 相關: 上一條向量指令的結果作下一條指令的一個源操作數(shù)( “寫后讀 ”相關) 。 有如下向量指令: V0← 存儲器 。 如 :V0← 存儲器 V3← V2V1V5← 1/V4 由于除法用時最長,以它為準。6)獨立總線結構 每個向量寄存器組到每個功能部件之間都有單獨總線連接,在不沖突條件下,可實現(xiàn)功能部件之間并行運行。 2) CRAY1向量指令類型 CRAY1有標量類和向量類指令 128條,其中有 4種 向量類指令: ◆ Vk ← Vi op Vj ◆ Vk ← Si op Vj ◆ Vk ← 主存 ◆ 主存 ← Vi4) R9ST:,R0,:如第 1組: 取向量 缺點: 在向量數(shù)據(jù)較多時,所用的寄存器數(shù)目多。R0STR,B0ADD,B99 第 3大步: 向量加MUL:A0優(yōu)點: 作為工作單元的通用寄存器少(本例僅用一個 R) 缺點: 條條指令發(fā)生相關?!钡降?100步計算 f99,STRA0LD 2. 向量的處理方式 計算: fi=ai*bi+ci ( i=0~99) 設各向量元素分別放在大寫字母單元中 :1)橫向(水平)處理 運算速度 常用每秒取得多少個 浮點運算結果 表示機器速度 ,以MFLOPS (Million of Floating Point Per Second)作為測量單位。27Δt251① ② ③ ④ ⑤ ⑥ ⑦① ① ① ② ② ② ③ ③ ③ ④ ④ ④ ⑤ ⑤ ⑤ ⑥ ⑥ ⑥ ⑦ ⑦ ⑦① ② ③ ④ ⑤ ⑥ ⑦① ② ③ ④ ⑤ ⑥ ⑦0MM3M02) 畫出時空圖過程段 (個 TP=(輸出結果數(shù) )/(完成算式總用時) =8/12=2/3(條 /Δt )而無流水時: TP=1/5 (條 /Δt )2)相關算式計算: S=a0+a1+a2+a3+a4+a5+a6+a7對相關算式要合理分解算式 —— 盡量分解為少相關算式:① S0=a0+a1 ⑤S4=S0+S1② S1=a2+a3 ⑥S5=S2+S3 ③ S2=a4+a5 ⑦S6=S4+S5 ④ S3=a6+a7TP=7/18 (條 /Δt )效率( η ): 即流水線上部件的利用率η= (作用區(qū)域面積) /(完成運算所需時間矩形面積) =( 7*5 Δt ) /( 18Δt*5 ) =7/18結論:相關發(fā)生時,對單條流水線而言會降低流水線性能。 S5 S3 時-空圖   時-空圖 從時間和空間兩個方面描述了流水線的工作過程。 動畫演示 動態(tài)流水線:各過程段之間可重新連接,不同時刻可重構成多種流水線。規(guī)模最?、?指令流水線:以指令為單位進行處理,用于多進程、多任務。 Ⅱ )時間不匹配的非均勻流水線。3 流水線上對各過程段進行時間匹配的辦法。 適用范圍寬,但不利于速度的提高。3)盡可能作成短轉移,短循環(huán):使轉去的指令都在指令站中。2)用分支程序代替被修改的指令4 解決條件轉移的全局相關1)猜測法① 按成功支路猜測:凡是條件轉移指令都將成功支路指令提前取到指令站中,此時將不成功支路指令取到后援寄存器組。如條件轉移指令,當條件具備時,就轉到其他地方去執(zhí)行程序,而轉移指令之后的幾條語句已先后被解釋了部分功能,但此時全部廢棄。ABabcs② 后行數(shù)站,存放運行的結果,并且,這些結果需送存 儲器。先行:在重疊操作中,當前一條指令在執(zhí)行過程中就需要提前取出后面的指令進行相應處理,這種提前取出后繼指令進行相應處理,稱為 先行 。2)分別列出上述三種執(zhí)行方式所需時間表達式順序執(zhí)行 k*( t取 +t譯 +t執(zhí) )兩條重疊 t取 + k* t譯 +(k1) *( t取 ,t執(zhí) )max+ t執(zhí)三條重疊 t取 +(t譯 ,t取 )max+(k2)*(t取 ,t譯 ,t執(zhí) )i+2 條 取 譯 執(zhí) 若指令的過程段劃分更多時,重疊組合方式更多。i條 取 譯 執(zhí)+1條 i條 譯 執(zhí) 重疊方式重疊方式一、重疊解釋方式 1)取指令:根據(jù) PC(指令計數(shù)器)從 M(存儲器)取出指令送到 IR(指令寄存器) 2)譯碼分析:譯出指令的操作性質,準備好所需數(shù)據(jù) 3)執(zhí)行:將準備好的數(shù)按譯出性質進行處理,主要涉及 ALU(算術邏輯運算部件) 第五章1)順序執(zhí)行 (傳統(tǒng)
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1