freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

深入理解計(jì)算機(jī)系統(tǒng)第二版資料家庭作業(yè)答案-資料下載頁

2025-06-20 02:20本頁面
  

【正文】 執(zhí)行次數(shù)比版本1要少,因?yàn)榭梢约僭O(shè)預(yù)測(cè)錯(cuò)誤的概率是50%。深入理解計(jì)算機(jī)系統(tǒng)(第二版) 家庭作業(yè) 第五章 A.關(guān)鍵路徑是%xmm1更新路徑上的加法。B. CPE下界是浮點(diǎn)加法的延遲。C. 兩個(gè)load操作的吞吐量界限。()D. 因?yàn)槌朔ú辉陉P(guān)鍵路徑上,乘法也是流水線執(zhí)行的,其限制因素為吞吐量界限。整個(gè)程序的限制因素為最后的浮點(diǎn)數(shù)加法的延遲。書上之前說關(guān)鍵路徑,現(xiàn)在其實(shí)可以再仔細(xì)分析一下(以下屬于個(gè)人分析):把執(zhí)行指令寫出了就明了了。以整數(shù)為例:相同底色表示這些指令在一個(gè)循環(huán)內(nèi)執(zhí)行,以及同一個(gè)循環(huán)內(nèi)的初始值:,?浮點(diǎn)數(shù)的話。時(shí)間線xmm1_add單元xmm1mul單元發(fā)射load單元發(fā)射rdx_add單元rdx的值10load1add+020load2+13load1add+14load2+25load1add+26mul(load延遲4)load2...7...80mul9add整數(shù)mul延遲為3010added整數(shù)加法延遲為1mul11add12addedvoidinner4(vec_ptr u,vec_ptr v,data_t*dest){longinti。intlength =vec_length(u)。data_t*udata =get_vec_start(u)。data_t*vdata =get_vec_start(v)。data_t sum =(data_t)0。intlimit = length2。for(i =0。ilimit。i++){sum = sum+udata[i]*vdata[i]。sum = sum+udata[i+1]*vdata[i+1]。sum = sum+udata[i+2]*vdata[i+2]。}for(。ilength。++i)sum = sum+udata[i]*vdata[i]。*dest = sum。}A. ,每計(jì)算一個(gè)值需要兩次load。B. 關(guān)鍵路徑上仍然有N個(gè)浮點(diǎn)加法,所以循環(huán)展開并沒有改變A. load執(zhí)行單元的吞吐量B. IA32可用寄存器實(shí)際只有6個(gè),而三路展開需要i, limit, udata, vdata,以及存儲(chǔ)udata[i], vdata[i]的寄存器,所以肯定有些循環(huán)變量會(huì)溢出到寄存器,這會(huì)影響效率。(,還不是很清楚)。voidinner4(vec_ptr u,vec_ptr v,data_t*dest){longinti。intlength =vec_length(u)。data_t*udata =get_vec_start(u)。data_t*vdata =get_vec_start(v)。data_t sum =(data_t)0。intlimit = length2。for(i =0。ilimit。i++){intx1 = udata[i]*vdata[i]。intx2 = udata[i+1]*vdata[i+1]。intx3 = udata[i+2]*vdata[i+2]。sum = sum+(x1+x2+x3)。}for(。ilength。++i)sum = sum+udata[i]*vdata[i]。*dest = sum。}void*optimized_memset(void*s,intc,size_t n){unsignedintK =sizeof(unsignedlong)。unsignedchar*schar =(unsignedchar*)s。unsignedlong*lchar。unsignedlongfill =0。inti =0。for(i =0。iK。i++)fill+=(camp。0xff)(i3)。// n如果是個(gè)負(fù)數(shù),會(huì)變成一個(gè)很大的正數(shù),這應(yīng)該不需要處理吧?// size_t應(yīng)該是unsigned int,n應(yīng)該不可能是//一般K都是2的整數(shù)次冪,也可以用scharamp。(K1)來求schar%Kwhile((unsigned)schar%Kamp。amp。n){*schar++=(unsignedchar)c。n。}lchar =(unsignedlong*)schar。while(n= K){*lchar++= fill。n= K。//不知道這里如果用++和會(huì)不會(huì)影響整體的效率}schar =(unsignedchar*)lchar。while(n)//剩余的n{*schar++=(unsignedchar)c。n。}returns。}doublepoly_optimized(doublea[],doublex,intdegree){longinti。doubleresult =0。doubles =0,powx4 =1。doublex2 = x*x。doublex4 = x2*x2。longintlimit = degree3。for(i =0。i= limit。i+=4){doublev1 = a[i]+a[i+1]*x。doublev2 = a[i+2]+a[i+3]*x。v1 = v1+v2*x2。s = s+v1*powx4。powx4*= x4。}for(。i= degree。++i){s+= a[i]*powx4。powx4*= x。}returns。}關(guān)鍵路徑就是一個(gè)浮點(diǎn)數(shù)乘法,因此CPE是浮點(diǎn)乘法延遲的1/4,然而每次計(jì)算都需要load 4個(gè)值。voidpsum(floata[],floatp[],longintn){longinti。intv = 0。for(i=0。in1。i+=2){intv1 = a[i]。intv2 = a[i+1]。v2 = v1+v2。p[i]= v + v1。p[i+1]= v + v2。 v = v+v2。}for(。in。i++){v = v+a[i]。p[i]= v。}}假設(shè)最開始需要100T的時(shí)間,那么A需要20T,B需要30T,C需要50T。將B提到3倍,也就是B需要10T,那么總時(shí)間為80T。所以提高B會(huì)使得性能更優(yōu)。深入理解計(jì)算機(jī)系統(tǒng)(第二版) 家庭作業(yè) 第六章 我們可以認(rèn)為,磁道沿半徑方向是均勻分布的。假設(shè)半徑為r的磁盤總的磁道是K,那么除掉內(nèi)部的x*r(磁道數(shù)為x*K),剩下的磁道數(shù)為 (1x)*K。那么總?cè)萘繛?2*pi*x*r*(1x)*K,其中pi,r和K都是常數(shù),那么只剩下x*(1x)。這個(gè)函數(shù)在x = 。T_seek =3 msT_maxrotate = 60*1000/12000 ms = 5 msT_avgrotate = *T_maxrotate = msT_transfer = T_maxrotate/500 = msT = T_seek + T_avgrotate + T_transfer = ms3MB文件,我們假設(shè)1MB = 1000KB,而1KB = 1024B(這個(gè)好算一些)。那么3MB文件就有3000個(gè)邏輯塊(扇區(qū)),需要讀6個(gè)磁道。T_maxrotate = 5 msT_transfer = ms,只需要尋一次道,而且文件是順序存儲(chǔ)。T = T_seek + *T_maxrotate + 6*T_maxrotate = B. 最差的情況 3000*(T_seek + *T_maxroate + T_transfer) = 16530ms高速緩存mCBEStsb132204844128237223220484512130023322048812562183432204881282281353220483216421656322048324162345高速緩存mCBEStsb13281921615121994232409644256228233240964812823724322048324162245感覺最后一行答案有錯(cuò)誤,C應(yīng)該是4096,或者t是23,或者E為2。Address_start = (tag5) | (set2)。Address_end = (tag5) | (set2) | 3。 行1行2組00x01200x0123組10x08A40x08A70x07040x0707組2組30x064C0x064F組40x18F00x18F30x00B00x00B3組50x0E340x0E37組60x12380x123B組70x1BDC0x1BDFb = 2, s = 2, t = 12 b s = 8。A.11109876543210CTCTCTCTCTCTCTCTCICICOCOB.操作地址命中?讀出的值讀0x409No寫0x40AYes讀0x833Yes0xD0A. C = E*B*S = 128 字節(jié)B. b = 2, s = 3, t = 13bs = 8。1211109876543210CTCTCTCTCTCTCTCTCICICICOCO12111098765432100011100011000B.參數(shù)值塊偏移CO0x00索引CI0x6標(biāo)記CT0x38命中?Yes返回值0xFA12111098765432101011011101100B.參數(shù)值塊偏移CO0x00索引CI0x3標(biāo)記CT0xB7命中?No返回值0x13140x13170x17940x1797對(duì)于寫分配的高速緩存,每次寫不命中時(shí),需要讀取數(shù)據(jù)到高速緩存中。該高速緩存只有2個(gè)組,對(duì)于相同的i,j,src[i][j]和dst[i][j]對(duì)應(yīng)相同的組。src[0] src[2] 對(duì)應(yīng)組0;src[1] src[3] 對(duì)于組1。dst同src。dst數(shù)組 列0列1列2列3行0mh
點(diǎn)擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1