freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第12章陣列處理機曹強計算機學院武漢光電國家實驗室信息-資料下載頁

2025-10-15 15:28本頁面

【導讀】采用資源重復的方法,設置較多的處理單元來提。數(shù)據(jù)進行相同的運算和操作。又稱為SIMD計算機。有時還被稱為并行處理機。CU對指令進行譯碼,并把指令播送到各處理單。所有處理單元均被動地接收并執(zhí)行從控制部件廣。令和程序流控制指令。每種屏蔽將所有PE劃分成允許操作和禁止操作兩種。說明互連網(wǎng)絡中PE間通信所需要的各種設置模式。MP-1是一種SIMD機器,其PE數(shù)N=1024~16384。時動態(tài)地使每個PE處于工作或禁止狀態(tài)。器,以實現(xiàn)CU-PE之間、X-Net的8個近鄰和全局尋徑器的通信。利用并行性中的同時性,而不是并發(fā)性。陣列機的研究必須與并行算法的研究密切結合,PE之間通過數(shù)據(jù)尋徑網(wǎng)絡以一定方式互相連接。美國寶來公司和伊利諾大學合作研制1972年。一個由3種類型處理機聯(lián)合組成的多機系統(tǒng)。又可以看作是一臺相對獨立的小型標量處理機。一臺標準的B6700計算機:擔負IlliacⅣ輸入輸出系

  

【正文】 環(huán),每重循環(huán)執(zhí)行 8次,共需 512次乘加的時間。 ? 在 SIMD陣列處理機上求解這個問題 44/50 ▲ 陣列處理機的并行算法舉例 執(zhí)行下列 FORTRAN程序: DO 10 I= 0, 7 C( I, J)= 0 DO 10 K= 0, 7 10 C(I, J) = C(I, J)+ A(I, K)*B(K, J) 速度提高到原來的 8倍,即每個處理單元的計算時間 縮短為 64次乘加時間。 程序流程圖 : 向量乘 : M U L B ( K , J) R G A ( J ) = R G A ( J ) B ( K , J) 開始 I = 0 L I M = 8 C ( I , J) = 0 0 ≤ J ≤ 7 K = 0 向量取 L O A D A ( I , J) R G A ( J ) = A ( I , J) 0 ≤ J ≤ 7 播送 : B C A S T A ( I , K) R G A ( J ) = R G A ( K ) 0 ≤ J ≤ 7 0 ≤ J ≤ 7 向量加 : A D D C ( I , J) R G A ( J ) = R G A ( J ) + C ( I , J ) 0 ≤ J ≤ 7 向量存 : S T O C ( I , J) R G A ( J ) 送 C ( I , J) 0 ≤ J ≤ 7 K = K + 1 K = L I M ? I = I + 1 I = L I M ? 是 是 結束 否 否 46/50 ▲ 陣列處理機的并行算法舉例 ? A、 B、 C向量在處理部件存儲器中的存放 A ( 1 , 0 ) PEM 0 B ( 0 , 0 ) C ( 0 , 0 ) … A ( 0 , 0 ) A ( 7 , 0 ) … B ( 1 , 0 ) B ( 7 , 0 ) C ( 1 , 0 ) C ( 7 , 0 ) … … … A ( 1 , 1 ) PEM 1 B ( 0 , 1 ) C ( 0 , 1 ) … A ( 0 , 1 ) A ( 7 , 1 ) … B ( 1 , 1 ) B ( 7 , 1 ) C ( 1 , 1 ) C ( 7 , 1 ) … … … A ( 1 , 7 ) PEM 7 B ( 0 , 7 ) C ( 0 , 7 ) … A ( 0 , 7 ) A ( 7 , 7 ) … B ( 1 , 7 ) B ( 7 , 7 ) C ( 1 , 7 ) C ( 7 , 7 ) … … … … 47/50 ▲ 陣列處理機的并行算法舉例 4. 累加和 一個將 N個數(shù)的 順序相加 轉變?yōu)?并行相加 的問題。 ? 只有處于活動狀態(tài)的處理單元才能執(zhí)行相應的操作。 ? 取 N= 8。即有 8個數(shù) A( I) 要順序累加( 0≤I≤7) ? 在 SIMD計算機上可寫成下列 FORTRAN程序: C= 0 DO 10 I= 0, 7 10 C= C+ A( I) 這是一個串行程序,共要進行 8次加法。 48/50 ▲ 陣列處理機的并行算法舉例 ? 在陣列處理機上采用 成對遞歸相加 的算法,則只需 log28= 3次加法 。 首先,把原始數(shù)據(jù) A( I), 0≤I≤7,分別存放 到 8個 PEM的 α單元中, 然后按照下面的步驟求累加和: ? 置全部 PEi為活動狀態(tài), 0≤i≤7; ? 全部 A( I), 0≤I≤7,從 PEMi的 α單元讀到相應 PEi的累加寄存器 RGAi中, 0≤i≤7; ? 令 K= 0; ? 將全部 PEi的( RGAi)傳送到 RGRi, 0≤i≤7; 49/50 ▲ 陣列處理機的并行算法舉例 ? 全部 PEi的( RGRi)經(jīng)過互連網(wǎng)絡向右傳送 2K步距,0≤i≤7; ? j= 2K- 1; ? 置 PE0至 PEj 為不活動狀態(tài); ? 處于活動狀態(tài)的所有 PEi執(zhí)行; ( RGAi)=( RGAi)+( RGRi) j< i≤7 ? K= K+1 ; ? 若 K< 3,則轉回第四步,否則繼續(xù)往下執(zhí)行; ? 置全部 PEi為活動狀態(tài), 0≤i≤7; ? 全部 PEi的( RGAi)存入相應的 PEMi的 α+ 1單元中,0≤i≤7。 50/50 ▲ 陣列處理機的并行算法舉例 計算過程示意圖: 循環(huán) PE 0 0 , 1 PE 1 PE 2 PE 3 PE 4 PE 5 PE 6 PE 7 0 1 , 2 2 , 3 3 , 4 4 , 5 5 , 6 6 , 7 0 , 1 0 0 ~ 2 0 ~ 3 1 ~ 4 2 ~ 5 3 ~ 6 4 ~ 7 0 , 1 0 0 ~ 2 0 ~ 3 0 ~ 4 0 ~ 5 0 ~ 6 0 ~ 7 K = 0 K = 1 K = 2 A ( 0 ) A ( 1 ) A ( 2 ) A ( 3 ) A ( 4 ) A ( 5 ) A ( 6 ) A ( 7 ) 51/50 ▲ 習題
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1