freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機體系結構第五章(參考版)

2025-05-05 03:34本頁面
  

【正文】 5d1 d2 d3d1 d2 d3d1 d2 d3d1 d2 d3d1 d2 d3c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4加乘部件05d1 d2 d3d1 d2 d3d1 d2 d3d1 d2 d3d1 d2 d3c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4c1 c2 c3 c4加乘部件0拍2510B(2)乘法部件和加法部件可并行的時空圖 拍20155部件0c4d1 d2 d3c1 c2 c3加乘 由向量點積 A乘法部件和加法部件不能同時工作,部件內也只能順序方式工作如下圖所示。B長度為 4向量 A和 B的點積為 AB= a1*b1+a2*b2+a3*b3+a4*b4 (1)處理器有 一個乘法部件 和 一個加法部件 ,不能同時工作,部件內也只能順序方式工作,完成一次加法或乘法均只需 5拍; (2)與 (1)基本相同,只是 乘法部件 和 加法部件可并行; (3)處理器有一個乘、 加雙功能靜態(tài)流水線 ,乘、加均由 5個流水段構成,各段經過時間要 1拍; (4)處理器有 乘 、 加兩條流水線 ,可同時工作,各由 5段構成,每段經過時間為 1拍。B的時空圖,并求完成全部結果的最少時鐘拍數。4Sp=14Δt/≈執(zhí)行譯碼取指過程[習題 3] (Δt)5時間 ( Δt) 51執(zhí)行(m=4)取指譯碼 圖 3 超長指令字處理機的時空圖Sp=14Δt/5Δt=圖 2 超標量處理機的時空圖取指譯碼執(zhí)行Sp=14Δt/5Δt=過程時間 ( Δt )53 4 8 123 7 112 6 101 5 94 8 12 過程 請分別畫出在 常規(guī)標量流水處理機 及度 m均為 4的 超標量處理機 、 超長指令字處理機 、 超流水線處理機 上工作的時空圖,分別計算出它們相對常規(guī)標量流水處理機的 加速比 Sp。圖 1 常規(guī)標量流水處理機的時空圖[例 ] 指令由 取指 、 譯碼 和 執(zhí)行 三個過程組成。1312119621VLIW中的操作字段: 存 /取 浮點加 浮點乘 轉移: 一臺度為 m的超流水線處理機的時鐘只是基本機器周期的 1/m。在編譯時,將 多個能并行執(zhí)行 的不相關或無關的操作組合在一起,形成一條有 多個操作碼字段 的超長指令字。 是采用設置 m條指令流水線同時并行處理,以實現度 m(同時執(zhí)行 m條指令 )。3 指令級高級并行超級處理機 超標量處理機、超長指令字處理機 和 超流水線處理機 是指令級高度并行的三種不同的超級處理機。調度方案 平均延遲( 2, 7) ( 3, 4) ( 4, 3) ( 2,2,7) ( 3, 7) 5( 7) 7( 4,7) 延遲禁止表為: F={1, 5, 6, 8}初始沖突向量為: C=( 10110001)狀態(tài)轉移圖及調度方案: (3,4,7) (4,3,7) 即要想不出現爭用流水線功能段的現象,相鄰兩個任務送入流水線的間隔拍數就不能為 8拍,這些間隔拍數應當禁止使用。l段相隔 8拍,那么兩個任務相隔 8拍流入流水線必將會爭用 1段; 2段相隔 6拍,則相隔 5或 6拍流入流水線必將會爭用 2段; 4段相隔 1拍,兩個任務相隔 1拍流入流水線必將會爭用 4段; 5段相隔 1拍,兩個任務相隔 1拍流入流水線必將會爭用 5段。 1 2 3 4 5 6 7 8 9S1 S2 S3 時鐘段號 按此方案進行任務調度,必然無沖突 。時間流水線 S4 1 2 3 4 5 6 7S1 線性流水線中各個段之間串行地鏈接,既無反饋也無跳躍,每個任務流經流水線中各個段均只有一次,反之就是 非線性流水線 。設 : 流水線段數 m,指令有 n條,各段經過的時間均為 Δt 概念延伸 :某種流水處理機相對于另一種流水處理機的加速比。流水線方式相對于非流水線順序串行方式速度提高的比值稱加速比( Sp)。V5←V3+V4解:( 1)即不相關又無沖突 —— 并行執(zhí)行(不可鏈接)1+7+1+( 641) =72(τ)3*64/( 72*108S) ≈ 267MFLOPS( 2)有相關,無沖突 —— 可鏈接 1+7+1+1+6+1+( 641) =80(τ) 3*64/( 80*108S) = 240 MFLOPS( 3)條條指令相關,但有沖突 —— 不能順利鏈接源沖突( V1) :1+7+1=9(τ) → 推遲 649=55τ 功能塊沖突(加) :1τ→ 推遲 641=63τ 總推遲: 55+63=118(τ) 1+6+2+7+2+6+2+6+1+( 641) +118=214(τ) 4*64/( 214*10 8S ) ≈ 120MFLOPS ( 4)條條相關,且無沖突 —— 可順利鏈接 1+6+2+14+2+7+2+6+1+( 641) =104(τ) 4*64/( 104*10 8S ) ≈ 246MFLOPSV1←1/V0(14τ)。V3←V2+V0。 V4←V2+V3 ( 3) V0← 存儲器 。V4←V5V6(7τ) ( 2) V2←V0V1。 ( 1) V0← 存儲器 (6τ)。3)推遲時間計算: ① 當長度大于最短有關時間時,實際需要推遲時間為: 向量時間 – 有關時間 ② 當長度小于等于有關時間時,實際不用推遲,可視為表面沖突。① 源沖突: 從第一次送出到第二次送出之間的時間② 目沖突: 從第一次接收到第二次接收之間的時間③ 功能塊: 從第一次送出到第二次送入之間的時間源沖突( V1) 1+7+1+1+6+1+1+4+1+1+14+1=39(τ)目沖突( V0) 1+7+1+1+6+1+1+4+1+1+14+1+1+7+1=48(τ)功能部件( ) 1+1+6+1+1+4+1+1+14+1=31(τ)V0沖突又分為 表面沖突 與 實際沖突 ,如上例中,向量長度為 30時,僅 表面沖突 。 V0←V7V1 故不能順利鏈接。 V5←V4 位移 。 V2←V0V1。1)畫出向量鏈接特性圖2)完成運算用時 6+2+6+2+4+2+7+2+14+2+( 641) =110(τ)3)計算向量數據處理速度: 5*64/(110*108S)≈291MFLOPS此處結論: 相關在向量鏈接中有利于向量據處理速度的提高。 V5← V3V4。 V2←V0+V1。2. 向量指令之間的幾種 鏈接 情況1)既不相關,又無沖突 不能鏈接,但可并行執(zhí)行(執(zhí)行時間以最長向量指令時間為準)2)條條指令相關,且無沖突 可順利鏈接3)條條指令相關,但有沖突不能順利鏈接 執(zhí)時間往往需要推遲。1+14+1+(641)=79(τ) 3*64/(79*108S)≈244MFLOPS可并行執(zhí)行向量長度為 64四、向量的 鏈接 特性1. 鏈接: 當兩條指令出現 “寫后讀 ”相關時,若它們不存在沖突(源、目、功能部件),就可以通過向量寄存器組 把所用的功能部件頭尾相接。 若有多條向量指令,且可并行執(zhí)行時,完成運算用時,可選用時最多 的那條向量指令。4)完成運算時間第一個結果時間 +(長度 1) τ=(1+6+1) τ+(641) τ=71τ5)向量數據處理速度計算 (向量指令條數 *長度) /(完成運算用時) =( 1*64) /( 71*108S) =90MFLOPS (每秒處理的浮點數個數 ) 4. 向量指令的執(zhí)行過程及性能計算 已知向量指令: V2← V1 + V0 (浮點加) 向量長度為 64,實際上是 64組向量數據求和。 ① 邏輯運算: ② 定點加: ③ 移位 : ④ 浮點加: ⑤ 訪存儲器: ⑥ 浮點乘:
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1