freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章向量處理機(jī)-資料下載頁

2025-08-01 13:20本頁面
  

【正文】 V1 ;向量和標(biāo)量相乘 LV V3, Ry ;取向量 Y ADDV V4, V2, V3 ;加法 SV Ry, V4 ;存結(jié)果 解:第一條指令 LV為第一個編隊。 MULTSV指令和第二條 LV指令為第二個編隊。 ADDV指令為第三個編隊。 SV指令為第四個編隊。 如果采用向量鏈接技術(shù)(不考慮訪問存儲器的沖突),需要: 12 + 7 + 6 + 12 + n – 1= 36 + n個周期。 如果考慮向量長度大于向量寄存器長度時,則需要分段開采。 向量長度為 n的一組向量操作的整個執(zhí)行時間為: 其中: Tloop為執(zhí)行標(biāo)量代碼的開銷, Tstart為每個編隊的向量啟動開銷, MVL是向量寄存器的長度。 Tloop可以看作是一個常數(shù), Cray 1機(jī)的 Tloop 約等于 15。 ? ? c h i m es t a r tl o o pn TnTTM V LnT ???????????例 2:在一臺向量處理機(jī)上實現(xiàn) A= B s操作,其中 A和 B是長度為 200的向量, s是一個標(biāo)量。向量寄存器長度為 64。各功能部件的啟動時間與上例相同。求總的執(zhí)行時間。 解: 因為向量長度超過了向量寄存器的長度,所以要采取分段開采方法。每次循環(huán)主要由下面三條向量指令組成: LV V1, Rb ;取向量 B MULTVS V2, V1, Fs ;向量和標(biāo)量相乘 SV Ra, V2 ;存向量 假設(shè) A和 B的分別放在 Ra和 Rb之中, s在 Fs中。 三條指令之間存在有寫讀數(shù)據(jù)相關(guān),因此必須把它們分成 3個編隊, Tchime= 3。 T200= 4 (15 + Tstart) + 200 3 = 60+( 4 Tstart) + 600 = 660+( 4 Tstart) 其中: Tstart=12 + 7 + 12 = 31, 因此, T200= 660 + 4 31= 784 每個結(jié)果元素的平均這些時間為: 768/200 = 。 例 3:在某臺向量處理機(jī)上執(zhí)行代碼代碼如下: 1: LV V1, Rx ;取向量 x 2: MULTSV V2, F0, V1 ;向量和標(biāo)量相乘 3: LV V3, Ry ;取向量 Y 4: ADDV V4, V2, V3 ;加法 5: SV Ry, V4 ;存結(jié)果 考慮訪問存儲器沖突,向量寄存器長度為 n、各功能部件的啟動時間與上例相同。求總的執(zhí)行時間。 解: 指令 2,指令 4和指令 5分成三個編隊,前兩個編隊中兩條指令采用向鏈接技術(shù)執(zhí)行。 Tchime=3, Tloop=15, Tstart=12+7+12+6+12=49, VL=64。 ? ?? ? ? ?64+4n= 3n64+n=3n 491564n= TnTTM V LnT ch i m es t ar tl o o pn?????????????????????最大性能 R? ?R?表示當(dāng)向量長度為無窮大時的向量流水線的最大性能。 ?常在評價峰值性能時使用,單位為 MFLOPS。 最大性能 R? 表示為: 其中: n為向量長度; Tn為一組向量操作的整個執(zhí)行時間。 ?對于例 3,假設(shè)時鐘頻率為 200MHZ。每個循環(huán)有 2個浮點操作: R Tnnnn? ? ? ???????? ?? ?limlim浮點運(yùn)算次數(shù)時鐘頻 率循環(huán)所花費(fèi)的時鐘周期 數(shù)浮點運(yùn)算次數(shù) 時鐘頻率 R M H ZnnM H Z M F L O P Sn? ? ????????? ? ?? ?2 2004 642 2004 100lim半性能向量長度 n1/2 ?為達(dá)到一半 R?值所需的向量長度稱為 半性能向量長度 n1/2。 ?主要評價向量流水線建立時間對性能的影響。 CRAY1的 n1/2= 10~ 20, CYBER 205的 n1/2= 100。 由 MFLOPS定義可知: 對于例 3,如果向量處理機(jī)的時鐘頻率為 200MHz。 因為: R?=100MFLOPS,因此有: 100/ 2 = 2 n1/2/ Tn1/2 200 假設(shè): n1/2 ? 64,因此: Tn1/2 = 64 + 3 n1/2 解得: 100/ 2 = 2 n1/2/ (64 + 3 n1/2) 200 n1/2= 所以: n1/2= 13 M F L O P S = n n 1 / 21 / 2執(zhí)行 循環(huán)時的浮點運(yùn)算次數(shù)執(zhí)行 循環(huán)的時鐘周期數(shù)時鐘周期秒-? ? 10 6向量和標(biāo)量的平衡點 nv 向量和標(biāo)量的平衡點 nv表示向量流水方式的工作速度優(yōu)于標(biāo)量串行方式時所需的向量長度臨界值。若向量的長度 nnv,則表示向量流水方式的工作速度優(yōu)于標(biāo)量串行方式;反之,則表示采用標(biāo)量串行方式處理各元素時,速度優(yōu)于向量流水方式。 例:某向量處理機(jī)其向量流水方式的執(zhí)行速率 RV=10MFLOPS,標(biāo)量方式執(zhí)行速率 RS=1MFLOPS,設(shè) a是程序中可向量化的百分比。要求: 1) 推導(dǎo)該向量機(jī)的平均執(zhí)行速率 Ra的公式 2) 為使平均執(zhí)行速率 Ra=,則 a的值應(yīng)取何值? 解: 1) aRvaRsaRa 901 1111 1 ./*/)( —— =+=a901157.. —=a≈ 2)
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1