freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

并行計算機體系結(jié)構(gòu)-全文預(yù)覽

2024-10-18 19:14 上一頁面

下一頁面
  

【正文】 果將交換機替換成專用機群網(wǎng)絡(luò),例如GigaNet、Myrinet等,則它們的規(guī)??梢赃M一步擴大。 并行機舉例l SMP并行機:SGI Power Challenge XL R10000:n 多個(18)個SGI R10000微處理器、共享存儲模塊、I/O設(shè)備通過系統(tǒng)總線相互聯(lián)接。n Origin 2000可擴展到8個機柜,每個機柜含8個結(jié)點, 結(jié)點是構(gòu)成Origin 2000的基本單位,它包含:u 12個主頻為195MHz或250MHz的MIPS R10000 CPU,每個CPU含4MB的二級Cache;u 內(nèi)存512MB4GB,分主存和目錄內(nèi)存兩類,后者主要用于保持結(jié)點間的Cache數(shù)據(jù)一致性;u 集線器(HUB)含4個端口:CPU端口、內(nèi)存端口、XIO端口和CrayLink互聯(lián)網(wǎng)絡(luò)端口,采用交叉開關(guān)實現(xiàn)兩個CPU、內(nèi)存、輸入輸出和互聯(lián)網(wǎng)絡(luò)路由器(router)之間的全互聯(lián),分別提供780MB/Sec、780MB/Sec、。 SGI Origin 2000并行機體系結(jié)構(gòu)示意圖l SMPMPP:n ASCI White:u 512臺IBM SMP NH2結(jié)點通過SP交換機相互聯(lián)接;u 每個結(jié)點為SMP并行機,含16個IBM Power P3/375MHz 微處理器,共享16GB內(nèi)存;u 總計計算處理器8192個,內(nèi)存46TB,磁盤總?cè)萘?50TB(可擴展到160TB);u ,美國能源部向IBM租借,年租金為8500萬美元;u 重106噸,兩個籃球場大;u 結(jié)點間支持消息傳遞并行程序設(shè)計,結(jié)點內(nèi)部支持共享存儲、消息傳遞兩種并行編程模式,也支持消息傳遞和共享存儲混合編程模式。16。 MPI : 消息傳遞;216。每個路由器的兩個端口用于聯(lián)接結(jié)點,其余4個端口實現(xiàn)路由器間的互聯(lián),形成互聯(lián)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。n 單一操作系統(tǒng)影像。l 并行向量多處理并行機(PVP):體系結(jié)構(gòu)類似于DMMPP,但是每個CPU為向量多處理機。配置一臺或多臺文件服務(wù)器,一方面管理機群計算結(jié)點共享的所有軟件和用戶計算資源,另一方面充當(dāng)機群與外部網(wǎng)絡(luò)的聯(lián)接橋梁,外部科研網(wǎng)的用戶只有通過文件服務(wù)器才能使用機群的計算資源。盡管微機機群在通信性能、穩(wěn)定性和使用方便等方面有待大幅度提高,但是,它們以其他并行機無法比擬的性能價格比,近年來已經(jīng)成為了高性能并行計算中的一支不可忽視的重要力量。例如CRAY T3D、CRAY T3E、Intel Paragon、IBM SPYH3等。但是,MPP也允許用戶登錄到某個特定的結(jié)點,或在某些特定的結(jié)點上運行作業(yè)。u 每個結(jié)點相對獨立,并擁有一個或多個微處理器(P/C)。DSM典型代表:u SGI Origin 2000;u SGI Origin 3800。u DSM并行機可擴展到上百個結(jié)點,能提供每秒數(shù)千億次的浮點運算性能。u 基于Cache的數(shù)據(jù)一致性:通常采用基于目錄的Cache一致性協(xié)議來保證各結(jié)點的局部Cache數(shù)據(jù)與存儲器中數(shù)據(jù)的一致性。u 單一的內(nèi)存地址空間:盡管內(nèi)存模塊分布在各個結(jié)點,但是,所有這些內(nèi)存模塊都由硬件進行了統(tǒng)一的編址,并通過互聯(lián)網(wǎng)絡(luò)聯(lián)接形成了并行機的共享存儲器。u 可擴展性(scalability)較差:由于所有處理器共享總線帶寬,而總線帶寬每3年才增加2倍,跟不上處理器速度和內(nèi)存容量的增加步伐,因此,SMP并行機的處理器個數(shù)一般少于32個,且只能提供每秒數(shù)百億次的浮點運算性能。u 低通信延遲:各個進程通過讀/寫操作系統(tǒng)提供的共享數(shù)據(jù)緩存區(qū)來完成處理器間的通信,其延遲通常小于網(wǎng)絡(luò)通信的延遲。各個處理器之間的地位等價,不存在任何特權(quán)處理器。 Origin 2000 1 : 3 : 30 : 50: 500 l 一次消息傳遞延遲相當(dāng)于峰值浮點運算的次數(shù):216。n Cache一致性非均勻訪存模型(CCNUMA:CoherentCache Nonuniform Memory Access):存在專用硬件設(shè)備保證在任意時刻,各結(jié)點Cache中數(shù)據(jù)與全局內(nèi)存數(shù)據(jù)的一致性,具有特征:u 各CPU的局部Cache數(shù)據(jù)來源于全局內(nèi)存,并保證所有結(jié)點中數(shù)據(jù)的一致性(畫圖簡單說明);u 大多數(shù)訪存可以局部在本地高速Cache;u 基于目錄的Cache一致性協(xié)議(Cache原理參考下章)。 MPM0HUBRouter互 聯(lián) 網(wǎng) 絡(luò) l 并行機訪存模型n 均勻訪存模型(UMA:Uniform Memory Access):內(nèi)存模塊與結(jié)點分離,分別位于互聯(lián)網(wǎng)絡(luò)的兩側(cè)(),互聯(lián)網(wǎng)絡(luò)一般采用系統(tǒng)總線、交叉開關(guān)和多級網(wǎng)絡(luò),稱之為緊耦合系統(tǒng)(Tightly Coupled System)。l 作業(yè):n :假設(shè)網(wǎng)絡(luò)包含P=2N=M3個結(jié)點,請給出一維陣列(環(huán))、二維網(wǎng)格(Torus)、三維網(wǎng)格(Torus)、超立方體、二叉樹(葉結(jié)點個數(shù)為P)、蝶網(wǎng)、Benes網(wǎng)的結(jié)點度、點對點延遲(以跨越的邊的條數(shù)為單位)、折半寬度(以邊的條數(shù)為單位)、網(wǎng)絡(luò)直徑。216。216。l 互聯(lián)網(wǎng)絡(luò)的路由選擇算法:n 定義:216。 Qudrics: 專用機群互聯(lián)網(wǎng)絡(luò),帶寬可達400MB/秒,延遲小于6us。 Myrinet:專用機群互聯(lián)網(wǎng)絡(luò),帶寬可達200MB/秒,延遲小于10us。介質(zhì)無關(guān)的信息傳輸協(xié)議,采用53字節(jié)的定長短數(shù)據(jù)單元(cell)進行傳輸。Beowulf微機機群采用這種結(jié)構(gòu)互聯(lián)所有結(jié)點。216。 W網(wǎng):等價于蝶網(wǎng)。例如:178。178。交叉開關(guān)特征:178。 交叉開關(guān)(Crossbar Switcher):所有結(jié)點通過交叉開關(guān)陣列相互連接,每個交叉開關(guān)均為其中兩個結(jié)點之間提供一條專用聯(lián)接通路,同時,任意兩個結(jié)點之間也能找到一個交叉
點擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1