freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章向量處理機(jī)-wenkub.com

2025-07-29 13:20 本頁(yè)面
   

【正文】 若向量的長(zhǎng)度 nnv,則表示向量流水方式的工作速度優(yōu)于標(biāo)量串行方式;反之,則表示采用標(biāo)量串行方式處理各元素時(shí),速度優(yōu)于向量流水方式。 ?主要評(píng)價(jià)向量流水線建立時(shí)間對(duì)性能的影響。 ?常在評(píng)價(jià)峰值性能時(shí)使用,單位為 MFLOPS。求總的執(zhí)行時(shí)間。每次循環(huán)主要由下面三條向量指令組成: LV V1, Rb ;取向量 B MULTVS V2, V1, Fs ;向量和標(biāo)量相乘 SV Ra, V2 ;存向量 假設(shè) A和 B的分別放在 Ra和 Rb之中, s在 Fs中。向量寄存器長(zhǎng)度為 64。 如果考慮向量長(zhǎng)度大于向量寄存器長(zhǎng)度時(shí),則需要分段開(kāi)采。 MULTSV指令和第二條 LV指令為第二個(gè)編隊(duì)。 把幾條能在一個(gè)時(shí)鐘周期內(nèi)同時(shí)開(kāi)始執(zhí)行的向量指令稱為一個(gè)編隊(duì),同一個(gè)編隊(duì)中的指令一定不存在功能部件沖突和數(shù)據(jù)相關(guān)。 i++) a[i]=5*b(i)+c。 4 100 4 2 5 1 600 400 250 200 0 200 400 0 600 250 0 100 101 102 103 104 105 106 1 2 3 4 1 2 3 4 I= I= 存儲(chǔ)器地址 稠密向量寄存器 A( K( I)) 稀疏向量 A( I) 指標(biāo)向量寄存器 K( I) VL寄存器 基址寄存器 聚合操作 4 100 4 2 5 1 600 400 250 200 0 200 400 0 600 250 0 100 101 102 103 104 105 106 1 2 3 4 1 2 3 4 I= I= 存儲(chǔ)器地址 稠密向量寄存器 A( K( I)) 稀疏向量 A( I) 指標(biāo)向量寄存器 K( I) VL寄存器 基址寄存器 散射操作 當(dāng)向量的長(zhǎng)度大于向量寄存器的長(zhǎng)度時(shí),必須把長(zhǎng)向量分成長(zhǎng)度固定的段,采用循環(huán)結(jié)構(gòu)處理這個(gè)長(zhǎng)向量,這種技術(shù)稱為向量循環(huán)開(kāi)采技術(shù),也稱為 向量分段開(kāi)采技術(shù) 。 1 6 1 1 641 = 72拍 啟動(dòng)訪存 送浮加部件 送浮加部件 送浮乘部件 送浮乘部件 訪存 浮加 浮乘 存 V0 存 V1 浮乘 存 V4第一分量 存 V4其它分量 (3)第二條向量指令與第一條向量指令有源目向量相關(guān),可以鏈接執(zhí)行;第三條向量指令與第二條向量指令有源向量沖突,故只能等到第二條向量指令執(zhí)行完畢后,才能執(zhí)行第三條向量指令。 例: 在 CRAY1機(jī)上,設(shè)向量的長(zhǎng)度均為 64;所用浮點(diǎn)功能部件的執(zhí)行時(shí)間分別為:相加需 6拍,相乘需 7拍,從存儲(chǔ)器讀數(shù)需 6拍,存入寄存器及啟動(dòng)功能部件各需 1拍。 如下頁(yè)圖所示,訪存與浮點(diǎn)加并行執(zhí)行,再與浮點(diǎn)乘鏈接執(zhí)行,執(zhí)行上述三條指令,獲得第一個(gè)結(jié)果分量并存入 V4,所需要的拍數(shù)(也稱為鏈接流水線的流水時(shí)間)為: 1 6 1 1 7 1 = 17拍 啟動(dòng)訪存 訪存 存 V3 送浮乘部件 浮乘 存 V4 由于每一拍可取得一個(gè)結(jié)果分量存入 V4,因此獲得全部結(jié)果分量所需拍數(shù)為 17+( N1) 送浮加部件 浮加 存 V2 送浮乘部件 . . . V0 . . . V1 1 2 . . . 6 . . . V2 存儲(chǔ)器 . . . V3 浮點(diǎn)加 訪存 1 2 . . . 6 并行與瀲接操作過(guò)程圖 1 2 . . . 7 . . . V4 浮點(diǎn)乘 實(shí)現(xiàn)鏈接的條件 : (1) 沒(méi)有向量寄存器沖突和運(yùn)算部件沖突。 CRAY1共有 8個(gè)向量寄存器組,一般可以有 25個(gè)功能部件鏈接在一起工作。如下面兩條指令由于都使用了向量加法部件,因此,存在向量加法部件使用沖突。 ? 提供高性能的 I/O和易訪問(wèn)的網(wǎng)絡(luò) 提高向量處理機(jī)性能的常用技術(shù) 多功能部件并行操作 提高相鄰的兩條或多條向量指令的執(zhí)行速度 鏈接技術(shù) 加快條件語(yǔ)句和稀疏矩陣的處理 使循環(huán)向量化,以提高向量處理的速度 加快向量的歸約操作 多功能部件的并行操作 1. 向量寄存器沖突( Vi沖突) 2. 功能部件沖突 向量寄存器沖突( Vi沖突) :并行工作的各向量指令的源向量或者結(jié)果向量使用相同的 Vi。 7. 屏蔽指令( masking instruction) :利用屏蔽向量將一個(gè)向量壓縮或者展開(kāi)成一個(gè)較短或較長(zhǎng)的索引向量。 ? STAR100的主存儲(chǔ)器流量:32 8W/=200MW/S CRAY1的主存儲(chǔ)器流量: 4W/50ns=80MW/S V7 V6 V5 CRAY1向量處理機(jī)結(jié)構(gòu) 存儲(chǔ)器 V4 3 2 1 0 V3 V2 V1 V0 S7 S6 S5 S4 S3 S2 S1 S0 A7 A6 A5 A4 A3 A2 A1 A0 標(biāo)量緩沖 寄存器 地址緩沖 寄存器 加 1記數(shù) 移位 邏輯運(yùn)算 整數(shù)加 標(biāo)量部件 整數(shù)乘 整數(shù)加 地址部件 移位 邏輯運(yùn)算 整數(shù)加 向量部件 迭代求倒 浮點(diǎn)乘
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1