freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

計算機系統(tǒng)結構電子教案(1)-wenkub.com

2025-05-06 16:33 本頁面
   

【正文】 此題如果不先作規(guī)范化,則結論是 “ 存在循環(huán)攜帶相關 ” 。 進行規(guī)范化后的修改循環(huán)代碼為 for (i=1。 GCD判則失敗的例子 計算機系統(tǒng)結構 26 在使用 GCD測試之前,必須先對這段代碼進行 “ 規(guī)范化 ” —— 修改下標從 1開始 (不必要?) ,而且每次循環(huán)后增加 1( Hennessy教材 3版第 4章)。將 b和 d互換后也一樣(這時 (db) = +12) 6j+1 = 1, 7, 13, 19, 25, 31, 37, 43, 49, … 9k+13 = 13, 22, 31, 40, 49, 58, 67, 76, 85, … GCD判則成功的例子 計算機系統(tǒng)結構 24 例: 4j+1與 2k+4是否滿足 GCD判則? 解: GCD(c,a) = 2 , (db) = 3,不能整除,不存在存儲別名 驗證: 對取值 j = 0, 1, 2, … 和 k = 0, 1, 2, … ,有 4j+1 = 1, 5, 9, 13, 17, 21, 25, 29, 33, … 2k+4 = 4, 6, 8, 10, 12, 14, 16, 18, 20, … 未發(fā)現(xiàn) 存儲別名。k+d ?判則 ?如果 GCD(c,a)可以整除 (db),可能存在存儲別名(疑似相關) ?如果 GCD測試的結果為假(不能整除),一定不存在存儲別名 判則 之所以說 “ 可能存在 ” ,是因為目標程序在運行中, j、 k的實際取值范圍也可能到不了滿足 aj+c] ? 非仿射數(shù)組:例如 A[B[i]] 2. 存儲別名導致的隱式相關( GCD判則) 計算機系統(tǒng)結構 22 ?GCD判則(最大公因數(shù), Greatest Common Divisor) ?問題 ?給定一維數(shù)組 A[m:n]和任意整數(shù) j、 k( m≤j , k≤n ),地址表達式 A[a B[101]=C[100]+D[100]。 B[100]=C[99]+D[99]。 A[4]=A[4]+B[4]。 A[3]=A[3]+B[3]。 A[2]=A[2]+B[2]。 (循環(huán)外) A[1]=A[1]+B[1]。 /*原來的 S1*/ } B[101]=C[100]+D[100]。 for(i=1。i=100。實際上無語句可調(diào)。 /*S1, 來自第 1個迭代 */ B[i+1]=B[i]+A[i+1]。 /*S2*/ B[i+2]=B[i+1]+A[i+2]。 /*S2*/ } 假設數(shù)組 A、 B和 C中所有元素的存儲地址都互不相同,請問語句 S1與 S2之間存在哪些數(shù)據(jù)相關? 解: (1) 循環(huán)迭代內(nèi)相關: 藍色箭頭 ; (2) 循環(huán)攜帶相關: 紅色箭頭 。 開發(fā)更多的指令級并行 計算機系統(tǒng)結構 17 for(i=1。對編譯之前的 源代碼 進行識別、優(yōu)化更容易。若 R1≠R2 , 循環(huán) F16, 8(R1) 。x[i] ← F4 ( 存結果) F8, 8(R1) 。F4 ← F0 + F2 F8, F6, F2 。F0 ← x[i] ( 取數(shù)) F6, 8(R1) 。R1 ← R1 4 8( 指針前移 4個數(shù)) BNE R1, R2, Loop 。x[i2] ← F12 ( 存結果) F14, 24(R1) 。F8 ← F6 + F2 F8, 8(R1) 。F0 ← x[i] ( 取數(shù)) F4, F0, F2 。假設原循環(huán)次數(shù)是 4的整倍數(shù)。 基本指令調(diào)度及循環(huán)展開 計算機系統(tǒng)結構 7 (2) 調(diào)度、延遲分支后的相關鏈分析 (注意 offset值 ): 代碼性能:每輪循環(huán)完成 1個浮點元素運算,需 6拍,其中 1拍是空轉。i0。 (2) 相關浮點指令之間的停頓:浮點數(shù)在 “ 執(zhí)行 ” 段需 4拍,其它段為 1拍。 計算機系統(tǒng)結構 1 第 6章 指令級并行軟件方法 ( 指令級,多發(fā)射或亂序執(zhí)行,靜態(tài)調(diào)度) 本章學習由軟件(即編譯程序)實現(xiàn)的指令級并行方法,主要內(nèi)容是如何修改、優(yōu)化已編譯完的目標程序,以減少指令間沖突造成的停頓,縮短程序執(zhí)行時間。兩條相關的浮點指令之間的最少停頓周期數(shù)如下表(即教材 P153表 ) ? 第 6章采用的流水線模型 產(chǎn)生結果的指令 使用結果的指令 停頓(周期數(shù)) 浮點計算 另一個浮點計算 3
點擊復制文檔內(nèi)容
試題試卷相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1