freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章向量處理機(文件)

2025-08-19 13:20 上一頁面

下一頁面
 

【正文】 ruction) :將兩個向量寄存器(分別存放數(shù)據(jù)和變址值)聚集分布在存儲器中的向量元素,或者把向量元素散射到存儲器中。 提高向量處理機性能的辦法 向量處理機系統(tǒng)結構的設計目標 ? 較好地維持向量 /標量性能平衡 向量平衡點( vector balance point)定義為:為了使向量硬件設備和標量硬件設備的利用率相等,一個程序中向量代碼所占的百分比。包括源向量沖突、結果向量沖突、先讀后寫的向量沖突和源目向量相關。 V3 ? V1+ V2 V6 ? V4 +V5 向量鏈接技術 (chaining) 指在不出現(xiàn)向量寄存器沖突和功能部件沖突時,通過鏈接機構將有源目向量相關的前后兩條或多條向量指令進行鏈接而實現(xiàn)并行處理的技術。 例如:求向量運算 D=A*( B+C),若向量的長度 N《 =64,向量的分量為浮點熟,且向量 B、 C已取到 V0、 V1中。 (2) 只有第一個結果送入向量寄存器的那一個周期可以鏈接。問下列各指令組中,組內(nèi)哪些指令可以鏈接?哪些指令不可以鏈接?不能鏈接的原因是什么?并分別計算出下列各指令組全部完成所需要的拍數(shù)。 1 6 1 1 7 1 641 1 6 1 641 = 151拍 啟動訪存 訪存 存V0 送浮乘部件 送浮乘部件 浮乘 存V2 送浮加部件 送浮加部件 浮加 存V3 注意: 1)在分析向量指令的處理時,特別關注 無關向量指令的并行執(zhí)行 ,源目向量相關的向量指令的鏈接執(zhí)行, 除源目向量相關外其它發(fā)生 向量寄存器沖突的向量指令的串行執(zhí)行,功能部件沖突的向量指令的串行執(zhí)行 以及向量內(nèi)部各分量流水處理之間的區(qū)別。 例如: A和 B為長度 N的向量。 當 N為當 N為 64或更小時,產(chǎn)生 A數(shù)組的 7條指令序列是: 1: S1172。 例 1:假設一臺向量處理機中功能部件的啟動開銷為:取數(shù)和存數(shù)部件為12個時鐘周期、乘法部件為 7個時鐘周期、加法部件為 6個時鐘周期。 ADDV指令為第三個編隊。 向量長度為 n的一組向量操作的整個執(zhí)行時間為: 其中: Tloop為執(zhí)行標量代碼的開銷, Tstart為每個編隊的向量啟動開銷, MVL是向量寄存器的長度。各功能部件的啟動時間與上例相同。 三條指令之間存在有寫讀數(shù)據(jù)相關,因此必須把它們分成 3個編隊, Tchime= 3。 解: 指令 2,指令 4和指令 5分成三個編隊,前兩個編隊中兩條指令采用向鏈接技術執(zhí)行。 最大性能 R? 表示為: 其中: n為向量長度; Tn為一組向量操作的整個執(zhí)行時間。 CRAY1的 n1/2= 10~ 20, CYBER 205的 n1/2= 100。 例:某向量處理機其向量流水方式的執(zhí)行速率 RV=10MFLOPS,標量方式執(zhí)行速率 RS=1MFLOPS,設 a是程序中可向量化的百分比。 因為: R?=100MFLOPS,因此有: 100/ 2 = 2 n1/2/ Tn1/2 200 假設: n1/2 ? 64,因此: Tn1/2 = 64 + 3 n1/2 解得: 100/ 2 = 2 n1/2/ (64 + 3 n1/2) 200 n1/2= 所以: n1/2= 13 M F L O P S = n n 1 / 21 / 2執(zhí)行 循環(huán)時的浮點運算次數(shù)執(zhí)行 循環(huán)的時鐘周期數(shù)時鐘周期秒-? ? 10 6向量和標量的平衡點 nv 向量和標量的平衡點 nv表示向量流水方式的工作速度優(yōu)于標量串行方式時所需的向量長度臨界值。每個循環(huán)有 2個浮點操作: R Tnnnn? ? ? ???????? ?? ?limlim浮點運算次數(shù)時鐘頻 率循環(huán)所花費的時鐘周期 數(shù)浮點運算次數(shù) 時鐘頻率 R M H ZnnM H Z M F L O P Sn? ? ????????? ? ?? ?2 2004 642 2004 100lim半性能向量長度 n1/2 ?為達到一半 R?值所需的向量長度稱為 半性能向量長度 n1/2。 ? ?? ? ? ?64+4n= 3n64+n=3n 491564n= TnTTM V LnT ch i m es t ar tl o o pn?????????????????????最大性能 R? ?R?表示當向量長度為無窮大時的向量流水線的最大性能。 例 3:在某臺向量處理機上執(zhí)行代碼代碼如下: 1: LV V1, Rx ;取向量 x 2: MULTSV V2, F0, V1 ;向量和標量相乘 3: LV V3, Ry ;取向量 Y 4: ADDV V4, V2, V3 ;加法 5: SV Ry, V4 ;存結果 考慮訪問存儲器沖突,向量寄存器長度為 n、各功能部件的啟動時間與上例相同。 解: 因為向量長度超過了向量寄存器的長度,所以要采取分段開采方法。 ? ? c h i m es t a r tl o o pn TnTTM V LnT ???????????例 2:在一臺向量處理機上實現(xiàn) A= B s操作,其中 A和 B是長度為 200的向量, s是一個標量。 如果采用向量鏈接技術(不考慮訪問存儲器的沖突),需要: 12 + 7 + 6 + 12 + n – 1= 36 + n個周期。 LV V1, Rx ;取向量 x MULTSV V2, F0, V1 ;向量和標量相乘 L
點擊復制文檔內(nèi)容
范文總結相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1