freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機體系--重疊、流水和向量處理機講義(編輯修改稿)

2025-02-03 12:56 本頁面
 

【文章內容簡介】 0。:LDR99,A99第二大步:向量乘MULR0,B0:MULR99,B99第三大步:向量加ADDR0,C0:ADDR99,C99第四大步:送結果STR0,F0:STR99,F99優(yōu)點:解決了相關問題,將原來條條發(fā)生相關改為條條不相關 。缺點:在向量數(shù)據(jù)較多時,所用的寄存器數(shù)目多。如本例共用了一百個寄存器( R0~R99),因而在向量數(shù)據(jù)不多時,可用縱向處理,而向量數(shù)據(jù)較多時,可用縱橫處理。3)縱橫處理基本思想:將所有算式分為若干組進行如 f0~f99可分為 10組:第一組:,第二組, …… 第十組。 組內采用縱向處理,組間采用橫向處理。 如第一組:取向量 LDR0,A0:LDR9,A9 向量乘 MULR0,B0:MULR9,B9 向量加ADDR0,C0:ADDR9,C9 送結果STR0,F0:STR9,F9 其余各組與第一組類似,因而總共用了 10個寄存器( R0~R9) 2. CRAY1機有關問題 1) 向量指令類型 ① 取向量: Vi← 存儲器 ② 存向量: 存儲器 ← Vi ③ 向量與向量運算: Vi← Vj OP Vk ④ 向量與數(shù)據(jù)運算: Vi← Vj OP B 2) 向量寄存器組結構 共有 8個向量寄存器組( V0~ V7),每個組可存放 64個長度為 64位的二進制數(shù)的向量數(shù)據(jù)。 3) 多功能部件 每個部件都以 1τ(=10ns=10 8S)為單位的流水線結構。 ① 邏輯運算: ② 定點加: ③ 移位 : ④ 浮點加: ⑤ 訪存 儲器 : ⑥ 浮點乘: ⑦ 除法 : 此外,在功能部件和向量寄存器組之間相互傳送也用1τ 。4) 獨立總線結構 每個向量寄存器組到每個功能部件之間都有單獨總線連接,在不沖突條件下,可實現(xiàn)功能部件之間并行運行。 3. 向量指令的執(zhí)行過程及性能計算 已知向量指令: V2← V1 + V0 (浮點加) 向量長度為 64,實際上是 64組向量數(shù)據(jù)求和。1) 寫出 64組算式 ① ← + ② ← + … 64 ← + 2) 畫出向量指令結構圖(如右上圖所示)3) 畫出各算式執(zhí)行過程示意圖送數(shù) 1τ ,加法 6τ , 輸出結果 1τ ,共 8τ 。4) 完成運算時間第一個結果時間 +(長度 1) τ=(1+6+1) τ+(641) τ=71τ5) 向量數(shù)據(jù)處理速度計算 (向量指令條數(shù) *長度) /(完成運算用時) =( 1*64) /( 71*108S) =90MFLOPS (每秒 處 理的浮點數(shù)個數(shù) ) 若有多條向量指令,且可并行執(zhí)行時,完成運算用時,可選用時最多的那條向量指令。如 :V0← 存儲器 可并行執(zhí)行, V3← V2V1 向量長度為 64V6← V5247。V4 由于除法用時最長,以它為準。 1+14+1+(641)=79(τ) 3*64/(79*108S)≈244MFLOPS四、 向量的鏈接特性1. 鏈接:將多條相關的向量指令鏈接起來組成更大規(guī)模的流水線,從而進一步提高向量數(shù)據(jù)處理速度,這種鏈接稱為向量鏈接。2. 向量指令之間的幾種情況1) 既不相關,又無沖突 不能鏈接,但可并行執(zhí)行(執(zhí)行時間以最長向量指令時間為準)2) 條條指令相關,且無沖突 可順利鏈接3) 條條指令相關,但有沖突不能順利鏈接,執(zhí)行時間往往需要推遲。 有如下向量指令: V0← 存儲器 。 V2←V0+V1。 V3←V2 位移 。 V5← V3V4。 V7← V5247。V6 向量長度 64 相關:上一條向量指令的結果作下一條指令的一個源操作數(shù)。1)畫出向量鏈接特性圖2) 完成運算有時 6+2+6+2+4+2+7+2+14+2+( 641) =110(τ)3) 計算向量數(shù)據(jù)處理速度: 5*64/(110*108S)≈291MFLOPS此處結論:相關在向量鏈接中有利于向量據(jù)處理速度的提高。 有如下向量指令: V0← 存儲器 。 V2←V0 V1 。 V4←V2+V3。 V5←V4 位移 。 V7←V5247。V6。 V0←V7 V1 故不能順利鏈接1) 不能順利鏈接時,對畫向量鏈接特性圖的影響 。 ① 源沖突:第一次送出畫實線,第二次送出畫虛線 ② 目沖突:第一次接收畫實線,第二次接收畫虛線 ③ 功能部件沖突:第一次出現(xiàn)畫實線,第二次出現(xiàn)畫虛線向量長度 64,上述向量指令條條相關,有沖突:2) 為了計算是否需要推遲時間,以及推遲多少時間,先計算沖突部件的有關時間。① 源沖突:從第一次送出到第二次送出之前 1τ② 目沖突:從第一次接收到第二次接收之前 1τ③ 功能塊:從第一次送出到第二次送入之前 1τ源沖突( V1) 1+7+1+1+6+1+1+4+1+1+14+1=39(τ)目沖突( V0)1+1+7+1+1+6+1+1+4+1+1+14+1+1+7=48(τ)功能塊( ) 1+1+6+1+1+4+1+1+14+1=31(τ)說明:乘法功能部件沖突最嚴重,上述三個時間以最短時間為準(僅適用本例)。3) 推遲時間計算: ① 當長度大于最短 有關時間 時,實際需要推遲時間為: 向量時間 – 有關時間 ② 當長度小于等于有關時間時,實際不用推遲,可視為 表面沖突 。 本例推遲時間為: 6431=33( τ )4) 完成運算用時計算: 順利連接時間 +推遲時間1+6+1+1+7+1+1+6+1+1+4+1+1+14+1+1+7+1+( 641) +33=152(τ)5) 性能:6*64/( 152*108S) ≈ 253MFLOPS P224 17題 :在 CRAY1機上,在下列指令 組 中, 組 內哪些指令可以 鏈 接?哪些不可以 鏈 接?不能 鏈 接的原因是什么?完成各指令所需的拍數(shù)( 設 向量 長 度均 為 64,打入寄存器及啟 動 功能部件各需 1τ )。 ( 1) V0← 存儲器(6τ) 。V1←V2+V3 (6τ) 。V4←V5V6 (7τ) ( 2) V2←V0V1。 V3← 存儲器 。 V4←V2+V3 ( 3) V0← 存儲器 。V2←V0V1。V3←V2+V0。V6←V3+V4 ( 4) V0← 存儲器 。V1←1/V0 (14τ) 。V3←V1V2。V5←V3+V4解:( 1)即不相關又不沖突 —— 并行執(zhí)行(不可鏈接)1+7+1+( 641) =72(τ)3*64/( 72*108S) ≈ 267MFLOPS( 2)有相關,不沖突 —— 可鏈接1+7+1+1+6+1+( 641) =80(τ) 3*64/( 80*108S) = 240 MFLOPS( 3) 條條指令相關,但有沖突 —— 不能順利鏈接源沖突( V1) :1+7+1=9(τ) → 推遲 649=55τ 功能塊沖突(加) :1τ→ 推遲 641=63τ總推遲: 55+63=118(τ)1+6+2+7+2+6+2+6+1+( 641) +118=214(τ) 4*64/( 214*10 8S ) ≈ 120MFLOPS( 4)條條相關,且無沖突 —— 可順利鏈接1+6+2+14+2+7+2+6+1+( 641) =104(τ) 4*64/( 104*10 8S ) ≈ 246MFLOPS三、向量流水處理向量的處理方式 向量指令的執(zhí)行過程及性能計算四、向量的鏈接特性 沖突 :鄰近向量指令使用了同一個部件 沖突又分為表面沖突與實際沖突 向量鏈接特性圖的繪制 完成運算用時計算:順利連接時間 +推遲時間 有關時間、推遲時間的計算五.加速比的概念流水線方式相對于非流水線順序串行方式速度提高的比值稱加速比( Sp)。設 :流水線段數(shù) m,指令有 n條,各段經過的時間 均為 Δt則: 此外,還有某種流水處理機相對于另一種流水處理機的加
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1