freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機系統(tǒng)結構教程課后答案(編輯修改稿)

2025-07-20 19:51 本頁面
 

【文章內容簡介】 是多少拍?如果向量長度為64,則需多少拍才能得到全部結果?V0←存儲器(從存儲器中取數(shù):7拍)V2←V0+V1(向量加:3拍)V3←V2A3(按(A3)左移:4拍)V5←V3∧V4(向量邏輯乘:2拍)解:通過時間就是每條向量指令的第一個操作數(shù)執(zhí)行完畢需要的時間,也就是各功能流水線由空到滿的時間,在流水線充滿之后,向量中后繼操作數(shù)繼續(xù)以流水方式執(zhí)行,直到整組向量執(zhí)行完畢。T通過=(1+7+1)+(1+3+1)+(1+4+1)+(1+2+1)=24(拍) T總共=T通過+(641)=24+63=87拍 T通過=(1+7+1)+(1+3+1)+(1+5+1)+(1+2+1)+(1+7+1)=34(拍) T總共=T通過+(641)=63+34=97拍= 某機有16個向量寄存器,其中V0~V5中分別放有向量A、B、C、D、E、F,向量長度均為8,向量各元素均為浮點數(shù);處理部件采用二個單功能流水線,加法功能部件時間為2拍,乘法功能部件時間為3拍。用類似Cray1的鏈接技術,先計算(A+B)*C,在流水線不停流的情況下,接著計算(D+E)*F。 = D 解答:(1)(A+B)*C可用以下2條指令完成:V0←A+BV1←V0*C流水線流過時間為(1+2+1)+(1+3+1)=9拍(2)實際吞吐率為=分段開采LV V1, Rb 。取向量BMULTVS V2,V1,F(xiàn)s 。向量和標量相乘SV Ra,V2 。存向量三條指令三個編隊T200=4x(15+Tstart)+200x3=660+(4xTstart)Tstart=12+7+12=31T200=660+4x31=784解:Cray YMP/8的峰值性能為: R∞ = (1+1)8/(6x103 )= 16 = 2667MFLOPS. 假設有一條長流水線,僅僅對條件轉移指令使用分支目標緩沖。假設分支預測錯誤的開銷為4個時鐘周期,緩沖不命中的開銷為3個時鐘周期。假設:命中率為90%,預測精度為90%,分支頻率為15%,沒有分支的基本CPI為1。①求程序執(zhí)行的CPI。②相對于采用固定的2個時鐘周期延遲的分支處理,哪種方法程序執(zhí)行速度更快?解:(1)程序執(zhí)行的CPI = 沒有分支的基本CPI(1) + 分支帶來的額外開銷分支帶來的額外開銷是指在分支指令中,緩沖命中但預測錯誤帶來的開銷與緩沖沒有命中帶來的開銷之和。分支帶來的額外開銷= 15% * (90%命中10%預測錯誤4 + 10%不命中3)= 所以,程序執(zhí)行的CPI = 1 + = (2)采用固定的2 個時鐘周期延遲的分支處理CPI = 1 + 15%2 = 由(1)(2)可知分支目標緩沖方法執(zhí)行速度快。. 假設分支目標緩沖的命中率為90%,程序中無條件轉移指令的比例為5%,沒有無條件轉移指令的程序CPI值為1。假設分支目標緩沖中包含分支目標指令,允許無條件轉移指令進入分支目標緩沖,則程序的CPI值為多少?假設原來的CPI= 參考答案: 解:設每條無條件轉移指令的延遲為x,則有:1+5%x= x=2當分支目標緩沖命中時,無條件轉移指令的延遲為0。所以 程序的CPI = 1 + 2 5% (1 -90%) =. 假設對指令Cache的訪問占全部訪問的75%;而對數(shù)據(jù)Cache的訪問占全部訪問的25%。Cache的命中時間為1個時鐘周期,不命中開銷為50 個時鐘周期,在混合Cache中一次load或store操作訪問Cache的命中時間都要增加一個時鐘周期,%,%,%。又假設采用寫直達策略,且有一個寫緩沖器,并且忽略寫緩沖器引起的等待。試問指令Cache和數(shù)據(jù)Cache容量均為32KB的分離Cache和容量為64KB的混合Cache相比,哪種Cache的不命中率更低?兩種情況下平均訪存時間各是多少?參考答案:解:(1)根據(jù)題意,約75%的訪存為取指令,25%的訪存為數(shù)據(jù)。因此,分離Cache的總體不命中率為:(75%%)+(25%%)=%; 容量為64KB的混合Cache的不命中率略低一些,%。 (2)平均訪存時間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分: 平均訪存時間=指令所占的百分比(讀命中時間+讀不命中率不命中開銷)+ 數(shù)據(jù)所占的百分比(數(shù)據(jù)命中時間+數(shù)據(jù)不命中率不命中開銷) 所以,兩種結構的平均訪存時間分別為: 分離Cache的平均訪存時間=75%(1+%50)+25%(1+%50)=(75%)+(25%)= 因為混合Cache讀數(shù)據(jù)的都要增加1個時鐘周期所以混合Cache的平均訪存時間=75%(1+%50)+25%(1+1+%50)=(75%)+(25%)=因此,盡管分離Cache的實際不命中率比混合Cache的高,但其平均訪存時間反而較低。分離Cache提供了兩個端口,消除了結構相關。 假設在3000次訪存中,第一級Cache不命中110次,第二級Cache不命中55次。試問:在這種情況下,該Cache系統(tǒng)的局部不命中率和全局不命中率各是多少? 解:局部不命中率 = 該級Cache的不命中次數(shù)/到達該級Cache的訪存次數(shù)。 局部不命中率L1 = 110/3000 = ,不命中率L2 = 55/
點擊復制文檔內容
數(shù)學相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1