freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章向量處理機(jī)(參考版)

2024-08-12 13:20本頁(yè)面
  

【正文】 例:某向量處理機(jī)其向量流水方式的執(zhí)行速率 RV=10MFLOPS,標(biāo)量方式執(zhí)行速率 RS=1MFLOPS,設(shè) a是程序中可向量化的百分比。 因?yàn)椋?R?=100MFLOPS,因此有: 100/ 2 = 2 n1/2/ Tn1/2 200 假設(shè): n1/2 ? 64,因此: Tn1/2 = 64 + 3 n1/2 解得: 100/ 2 = 2 n1/2/ (64 + 3 n1/2) 200 n1/2= 所以: n1/2= 13 M F L O P S = n n 1 / 21 / 2執(zhí)行 循環(huán)時(shí)的浮點(diǎn)運(yùn)算次數(shù)執(zhí)行 循環(huán)的時(shí)鐘周期數(shù)時(shí)鐘周期秒-? ? 10 6向量和標(biāo)量的平衡點(diǎn) nv 向量和標(biāo)量的平衡點(diǎn) nv表示向量流水方式的工作速度優(yōu)于標(biāo)量串行方式時(shí)所需的向量長(zhǎng)度臨界值。 CRAY1的 n1/2= 10~ 20, CYBER 205的 n1/2= 100。每個(gè)循環(huán)有 2個(gè)浮點(diǎn)操作: R Tnnnn? ? ? ???????? ?? ?limlim浮點(diǎn)運(yùn)算次數(shù)時(shí)鐘頻 率循環(huán)所花費(fèi)的時(shí)鐘周期 數(shù)浮點(diǎn)運(yùn)算次數(shù) 時(shí)鐘頻率 R M H ZnnM H Z M F L O P Sn? ? ????????? ? ?? ?2 2004 642 2004 100lim半性能向量長(zhǎng)度 n1/2 ?為達(dá)到一半 R?值所需的向量長(zhǎng)度稱為 半性能向量長(zhǎng)度 n1/2。 最大性能 R? 表示為: 其中: n為向量長(zhǎng)度; Tn為一組向量操作的整個(gè)執(zhí)行時(shí)間。 ? ?? ? ? ?64+4n= 3n64+n=3n 491564n= TnTTM V LnT ch i m es t ar tl o o pn?????????????????????最大性能 R? ?R?表示當(dāng)向量長(zhǎng)度為無窮大時(shí)的向量流水線的最大性能。 解: 指令 2,指令 4和指令 5分成三個(gè)編隊(duì),前兩個(gè)編隊(duì)中兩條指令采用向鏈接技術(shù)執(zhí)行。 例 3:在某臺(tái)向量處理機(jī)上執(zhí)行代碼代碼如下: 1: LV V1, Rx ;取向量 x 2: MULTSV V2, F0, V1 ;向量和標(biāo)量相乘 3: LV V3, Ry ;取向量 Y 4: ADDV V4, V2, V3 ;加法 5: SV Ry, V4 ;存結(jié)果 考慮訪問存儲(chǔ)器沖突,向量寄存器長(zhǎng)度為 n、各功能部件的啟動(dòng)時(shí)間與上例相同。 三條指令之間存在有寫讀數(shù)據(jù)相關(guān),因此必須把它們分成 3個(gè)編隊(duì), Tchime= 3。 解: 因?yàn)橄蛄块L(zhǎng)度超過了向量寄存器的長(zhǎng)度,所以要采取分段開采方法。各功能部件的啟動(dòng)時(shí)間與上例相同。 ? ? c h i m es t a r tl o o pn TnTTM V LnT ???????????例 2:在一臺(tái)向量處理機(jī)上實(shí)現(xiàn) A= B s操作,其中 A和 B是長(zhǎng)度為 200的向量, s是一個(gè)標(biāo)量。 向量長(zhǎng)度為 n的一組向量操作的整個(gè)執(zhí)行時(shí)間為: 其中: Tloop為執(zhí)行標(biāo)量代碼的開銷, Tstart為每個(gè)編隊(duì)的向量啟動(dòng)開銷, MVL是向量寄存器的長(zhǎng)度。 如果采用向量鏈接技術(shù)(不考慮訪問存儲(chǔ)器的沖突),需要: 12 + 7 + 6 + 12 + n – 1= 36 + n個(gè)周期。 ADDV指令為第三個(gè)編隊(duì)。 LV V1, Rx ;取向量 x MULTSV V2, F0, V1 ;向量和標(biāo)量相乘 LV V3, Ry ;取向量 Y ADDV V4, V2, V3 ;加法 SV Ry, V4 ;存結(jié)果 解:第一條指令 LV為第一個(gè)編隊(duì)。 例 1:假設(shè)一臺(tái)向量處理機(jī)中功能部件的啟動(dòng)開銷為:取數(shù)和存數(shù)部件為12個(gè)時(shí)鐘周期、乘法部件為 7個(gè)時(shí)鐘周期、加法部件為 6個(gè)時(shí)鐘周期。 e為完成第一對(duì)向量元素操作所需的子操作數(shù)。 當(dāng) N為當(dāng) N為 64或更小時(shí),產(chǎn)生 A數(shù)組的 7條指令序列是: 1: S1172。 iN。 例如: A和 B為長(zhǎng)度 N的向量。 解決辦法:稀疏向量 程序段 DO 10 I=1, N A( K( I)) =A( K( I)) B( K( I)) 完成對(duì)稀疏向量 A和 B求和,其中 K、 M為指標(biāo)向量,指明 A、 B中的非 0元素。 1 6 1 1 7 1 641 1 6 1 641 = 151拍 啟動(dòng)訪存 訪存 存V0 送浮乘部件 送浮乘部件 浮乘 存V2 送浮加部件 送浮加部件 浮加 存V3 注意: 1)在分析向量指令的處理時(shí),特別關(guān)注 無關(guān)向量指令的并行執(zhí)行 ,源目向量相關(guān)的向量指令的鏈接執(zhí)行, 除源目向量相關(guān)外其它發(fā)生 向量寄存器沖突的向量指令的串行執(zhí)行,功能部件沖突的向量指令的串行執(zhí)行 以及向量?jī)?nèi)部各分量流水處理之間的區(qū)別。 1 6 1 1 7 1 641 = 79拍 啟動(dòng)訪存 訪存 存 V3 送浮加部件 浮加 存 V4第一分量 存 V4其它分量 送浮乘部件 浮乘 浮乘 存 V2送浮加部件 (2)三條向量指令都無關(guān),所以,三條向量指令可以并行執(zhí)行。問下列各指令組中,組內(nèi)哪些指令可以鏈接?哪些指令不可以鏈接?不能鏈接的原因是什么?并分別計(jì)算出下列各指令組全部完成所需要的拍數(shù)。 (4) 兩條向量指令的向量長(zhǎng)度必須相等。 (2) 只有第一個(gè)結(jié)果送入向量寄存器的那一個(gè)周期可以鏈接。 V3 ? A /訪存取 A向量 /
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1