正文內(nèi)容

multicore20xx-資料下載頁

2025-08-04 09:59本頁面

　　

【正文】 ? 在多核體系中，必須將中斷請求分發(fā)給一組核處理。當(dāng)系統(tǒng)中有多個核在并行執(zhí)行時，必須有一個能夠?qū)⒔邮盏降闹袛嗾埱蠓职l(fā)給能夠提供服務(wù)（處理該請求）的核的機制。虛擬化技術(shù) ? 虛擬化技術(shù)：是指對計算機資源進行的抽象，是在系統(tǒng)、應(yīng)用或用戶與資源進行交互時，對計算機資源的物理特性進行隱藏的一種技術(shù)。 ? 分類：（ 1）平臺虛擬化：由指定硬件平臺上的宿主軟件來實行，為其他軟件提供一個模擬的計算機環(huán)境。其他軟件通常都是完整的操作系統(tǒng)，就像安裝在獨立的硬件平臺上一樣運行。（ 2）資源虛擬化：它是被擴展到具體系統(tǒng)資源的虛擬化，它涉及資源的合并、劃分以及簡化的模擬等作用。并行計算基礎(chǔ) 并行計算機體系結(jié)構(gòu) ? 組成并行計算機的各個部分： – 節(jié)點（ node） – 互聯(lián)網(wǎng)絡(luò)（ interconnect work） – 內(nèi)存（ memory）內(nèi)存模塊與節(jié)點分離內(nèi)存模塊位于節(jié)點內(nèi)部 ? cache的映射策略指的是內(nèi)存塊和 cache線之間如何建立相互映射關(guān)系。 ? 直接映射策略（ direct mapping strategy） – 每個內(nèi)存塊只能被唯一的映射到一條 cache線中 ? K－路組關(guān)聯(lián)映射策略（ Kway set association mapping strategy） – Cache被分解為 V個組，每個組由 K條 cache線組成，內(nèi)存塊按直接映射策略映射到某個組，但在該組中，內(nèi)存塊可以被映射到任意一條 cache線。 ? 全關(guān)聯(lián)映射策略（ full association mapping strategy） – 內(nèi)存塊可以被映射到 cache中的任意一條 cache線。并行計算機訪存模型 ? UMA（ Uniform Memory Access）模型 – 物理存儲器被所有節(jié)點共享； – 所有節(jié)點訪問任意存儲單元的時間相同； – 發(fā)生訪存競爭時，仲裁策略平等對待每個節(jié)點，即每個節(jié)點機會均等； – 各節(jié)點的 CPU可帶有局部私有高速緩存； – 外圍 I/O設(shè)備也可以共享，且每個節(jié)點有平等的訪問權(quán)利。 ? NUMA（ NonUniform Memory Access）模型 – 物理存儲器被所有節(jié)點共享，任意節(jié)點可以直接訪問任意內(nèi)存模塊； – 節(jié)點訪問內(nèi)存模塊的速度不同，訪問本地存儲模塊的速度一般是訪問其他節(jié)點內(nèi)存模塊的 3倍以上； – 發(fā)生訪存競爭時，仲裁策略對節(jié)點可能是不等價的； – 各節(jié)點的 CPU可帶有局部私有高速緩存（ cache）； – 外圍 I/O設(shè)備也可以共享，但對各節(jié)點是不等價的。并行計算機訪存模型 (續(xù) ) ? COMA（ CacheOnly Memory Access）模型 – 各處理器節(jié)點中沒有存儲層次結(jié)構(gòu)，全部高速緩存組成了全局地址空間； – 利用分布的高速緩存目錄 D進行遠(yuǎn)程高速緩存的訪問； – COMA中的高速緩存容量一般都大于 2級高速緩存容量； – 使用 COMA時，數(shù)據(jù)開始時可以任意分配，因為在運行時它最終會被遷移到要用到它的地方。 ? NORMA（ NoRemote Memory Access）模型 – 所有存儲器都是私有的； – 絕大多數(shù) NORMA都不支持遠(yuǎn)程存儲器的訪問； – 在 DSM中， NORMA就消失了。并行計算機訪存模型 (續(xù) ) ? 并行計算機系統(tǒng)的不同訪存模型分類并行計算模型 ? SIMD同步并行計算模型 – 共享存儲的 SIMD模型（ PRAM模型） – 分布存儲的 SIMD模型（ SIMD互聯(lián)網(wǎng)絡(luò)模型） ? MIMD異步并行計算模型 – 異步 PRAM模型 – BSP模型 – LogP模型 – C3模型 SIMD同步并行計算模型 ? SIMD共享存儲模型（ PRAM模型） – PRAMEREW （ ExclusiveRead and ExclusiveWrite），不允許同時讀和同時寫； – PRAMCREW （ ConcurrentRead and ExclusiveWrite），允許同時讀但不允許同時寫； – PRAMCRCW （ ConcurrentRead and ConcurrentWrite），允許同時讀和同時寫； ? 優(yōu)點： – 適合于并行算法的表達、分析和比較； – 使用簡單，很多諸如處理器間通信、存儲管理和進程同步等并行計算機的低級細(xì)節(jié)均隱含于模型中； – 易于設(shè)計算法和稍加修改便可運行在不同的并行計算機上； – 且有可能加入一些諸如同步和通信等需要考慮的方面。 SIMD分布存儲模型 ? 采用一維線性連接的 SIMD模型，簡記為 SIMDLC ? 采用網(wǎng)孔連接的 SIMD模型，簡記為 SIMDMC ? 采用樹形連接的 SIMD模型，簡記為 SIMDTC ? 采用樹網(wǎng)連接的 SIMD模型，簡記為 SIMDMT ? 采用立方連接的 SIMD模型，簡記為 SIMDCC ? 采用立方環(huán)連接的 SIMD模型，簡記為 SIMDCCC ? 采用洗牌交換連接的 SIMD模型，簡記為 SIMDSE ? 采用蝶形連接的 SIMD模型，簡介為 SIMDBF ? 采用多級互聯(lián)網(wǎng)絡(luò)連接的 SIMD模型，簡記為 SIMDMIN MIMD異步計算模型 —APRAM模型 ? APRAM特點 : – 每個處理器都有其本地存儲器、局部時鐘和局部程序； – 處理器間的通信經(jīng)過共享全局存儲器； – 無全局時鐘，各處理器異步地獨立執(zhí)行各自的指令； – 處理器任何時間依賴關(guān)系需明確地在各處理器的程序中加入同步（路）障（ Synchronization Barrier）； – 一條指令可在非確定但有限的時間內(nèi)完成。 ? APRAM模型中有四類指令 : – 全局讀，將全局存儲單元中的內(nèi)容讀入本地存儲器單元中； – 局部操作，對本地存儲器中的數(shù)執(zhí)行操作，其結(jié)果存入本地存儲器中； – 全局寫，將本地存儲器單元中的內(nèi)容寫入全本地存儲器單元中； – 同步，同步是計算中的一個邏輯點，在該點各處理器均需等待別的處理器到達后才能繼續(xù)執(zhí)行其局部程序。 MIMD異步計算模型 —BSP模型 ? 作為計算機語言和體系結(jié)構(gòu)之間的橋梁，由以下述三個參數(shù)描述分布存儲的并行計算機模型： – 處理器 /存儲器模塊（下文簡稱處理器）； – 處理器模塊之間點到點信息傳遞的路由器； – 執(zhí)行以時間間隔 L為周期的路障同步器。 ? 特點： – 將處理器和路由器分開，強調(diào)了計算任務(wù)和通信任務(wù)的分開，而路由器僅施行點到點的消息傳遞，不提供組合、復(fù)制或廣播等功能，這樣做既掩蓋了具體的互聯(lián)網(wǎng)絡(luò)拓?fù)?，又簡化了通信協(xié)議； – 采用路障方式的以硬件實現(xiàn)的全局同步是在可控的粗粒度級，從而提供了執(zhí)行緊耦合同步式并行算法的有效方式，而程序員并無過分的負(fù)擔(dān)； – 在分析 BSP模型的性能時，假定局部操作可在一個時間步內(nèi)完成，而在每一超級步中，一個處理器至多發(fā)送或接受 h條消息（ hrelation）。 MIMD異步計算模型 —LogP,C3模型 ? LogP模型是一種分布存儲的、點到點通信的多處理機模型，其中通信網(wǎng)絡(luò)由一組參數(shù)來描述，但它并不涉及到具體的網(wǎng)絡(luò)結(jié)構(gòu)，也不假定算法一定要用顯式的消息傳遞操作進行描述。 ? C3（ Computation, Communication, Congestion）模型是一個與體系結(jié)構(gòu)無關(guān)的粗粒度的并行計算模型，旨在能反映計算復(fù)雜度，通信模式和通信期間潛在的擁擠等因素對粗粒度網(wǎng)絡(luò)算法的影響。并行編程環(huán)境 ? 比較流行的并行編程環(huán)境主要有 3類：消息傳遞、共享存儲和數(shù)據(jù)并行特征消息傳遞共享存儲數(shù)據(jù)并行典型代表 MPI, PVM OpenMP HPF 可移植性所有主流并行計算機 SMP, DSM SMP, DSM, MPP 并行粒度進程級大粒度線程級細(xì)粒度進程級細(xì)粒度并行操作方式異步異步松散同步數(shù)據(jù)存儲模式分布式存儲共享存儲共享存儲數(shù)據(jù)分配方式顯式隱式半隱式學(xué)習(xí)入門難度較難容易偏易可擴展性好較差一般并行編程標(biāo)準(zhǔn) ? 數(shù)據(jù)并行語言標(biāo)準(zhǔn) – Fortran90, HPF(1992), Fortran95/2022:顯式數(shù)據(jù)分布描述,并行 DO循環(huán) . ? 線程庫標(biāo)準(zhǔn) (Thread Library) – Win32 API. – POSIX threads線程模型 . ? 編譯制導(dǎo) (Compiler Directives) – OpenMP : portable shared memory parallelism ? 消息傳遞庫標(biāo)準(zhǔn) (Message Passing Libraries) – MPI : Message Passing Interface – PVM : Parallel Virtual Machine 數(shù)據(jù)并行編程共享變量編程消息傳遞編程并行編程標(biāo)準(zhǔn)歸類 ? 所有并行編程標(biāo)準(zhǔn)可分為以下三類 : – 數(shù)據(jù)并行 ? HPF, Fortran90 ? 用于 SMP, DSM – 共享編程 ? OpenMP ? 用于 SMP, DSM – 消息傳遞 ? MPI, PVM ? 用于所有并行計算機 ? 三者可混合使用 : – 如對以 SMP為節(jié)點的 Cluster來說 , 可以在節(jié)點間進行消息傳遞 ,在節(jié)點內(nèi)進行共享變量編程 . 并行編程模型 ? 共享存儲模型 – 在共享存儲編程模型里，任務(wù)共享一個共用的地址空間，它們在這個共享空間進行異步的讀寫。 – 像“鎖 /信號量”這樣不同的機制將會用來控制對共享存儲的訪問。 – 從程序員的觀點，這種模式的好處是沒有數(shù)據(jù)所有權(quán)的概念，因此沒必要在任務(wù)之間明確地規(guī)定數(shù)據(jù)通信。程序開發(fā)通常會比較簡單。 – 一個重要的性能上的缺點是理解和管理局部的數(shù)據(jù)變得更加困難。 – 實現(xiàn)：在共享存儲平臺，本地編譯程序?qū)⒂脩舫绦蜃兞糠g成全局存儲空間中實際的存儲地址。并行編程模型 ? 消息傳遞模型 – 一組任務(wù)在計算的時候使用它們自己的局部存儲器。多個任務(wù)可以駐留在同一臺機器，或者跨任意數(shù)量的機器。 – 任務(wù)之間通過發(fā)送和接受消息的數(shù)據(jù)通信來交換數(shù)據(jù)。 – 數(shù)據(jù)傳送通常需要每個進程協(xié)同操作來完成。比如一個發(fā)送操作必須有一個對應(yīng)的接收操作。并行編程模型 – 實現(xiàn) : ? 1992年 , MPI（消息傳遞接口）論壇成行，其主要目標(biāo)是制定消息傳遞實現(xiàn)的標(biāo)準(zhǔn)接口 ? MPI現(xiàn)在是實際上的消息傳遞的工業(yè)標(biāo)準(zhǔn)，實際上替代了所有其它的用于生產(chǎn)工作的消息傳遞實現(xiàn)。大多數(shù)并行平臺會提供至少一個 MPI的實現(xiàn)。少數(shù)還提供完整的MPI2的實現(xiàn)。 ? 對于共享存儲結(jié)構(gòu)， MPI通常實現(xiàn)的時候不用網(wǎng)絡(luò)進行任務(wù)通信。它通常處于性能的考慮，用共享存儲（存儲器拷貝）來實現(xiàn)。并行編程模型 ? 數(shù)據(jù)并行模型 – 大多數(shù)并行工作都是在一個數(shù)據(jù)集中去完成。數(shù)據(jù)集通常組織成一個共同的結(jié)構(gòu)，比如數(shù)組或者多維數(shù)組。 – 一組任務(wù)共同地工作在相同的數(shù)據(jù)結(jié)構(gòu)，然而每個任務(wù)工作在這個數(shù)據(jù)結(jié)構(gòu)的不同部分。 – 任務(wù)用相同的操作執(zhí)行它那部分工作，比如“給每個數(shù)組元素加 4?！? 并行編程模型 – 在共享存儲結(jié)構(gòu)中，所有的任務(wù)可以通過全局存儲器來訪問數(shù)據(jù)結(jié)構(gòu)。 – 在分布式存儲結(jié)構(gòu)中，數(shù)據(jù)結(jié)構(gòu)是分散的，并以“組塊”的方式存在于每個任務(wù)的局部存儲器中。并行編程模型 – 實現(xiàn) ? 高性能 Fortran (HPF): 將 Fortran 90擴展，支持?jǐn)?shù)據(jù)并行的程序設(shè)計 –包含 Fortran 90中的一切 –增加了指導(dǎo)編譯器如何分布數(shù)據(jù)的功能 –增加了能夠改進生成代碼優(yōu)化的功能 –增加了數(shù)據(jù)并行的結(jié)構(gòu) (現(xiàn)在是 Fortran 95的一部分 ) ? 編譯器指導(dǎo)語句 : 允許程序員指定數(shù)據(jù)的分布和對齊。Fortran 實現(xiàn)是最常見的并行平臺。 ? 這種模式的分布式存儲實現(xiàn)通常由編譯器轉(zhuǎn)換程序到標(biāo)準(zhǔn)代碼來調(diào)用消息傳遞庫（通常是 MPI）去分布數(shù)據(jù)到所有處理器。所有的消息傳遞對程序員是透明的。并行編譯器 ? 并行編譯過程并行計算性能評測 ? 并行程序執(zhí)行時間 – 等于從并行程序開始執(zhí)行到所有進程執(zhí)行完畢，墻上時鐘走過的時間，也稱為墻上時間（ wall clock time）。對各個進程，墻上時間可進一步分解為計算 CPU時間、通信CPU時間、同步開銷時間、同步導(dǎo)致的進程空閑時間。 ? 并行程序性能評價方法 – 浮點峰值性能與實際浮點性能 – 數(shù)值效率和并行效率 ? 加速比性能定律 – Amdahl定律 – Gustafson定律 – Sun和 Ni定律 135 程序性能優(yōu)化方法 ? 串行程序性能優(yōu)化 – 調(diào)用高性能庫，比如優(yōu)化的 BLAS， FFTW等； – 選擇適當(dāng)?shù)木幾g器優(yōu)化選項； – 合理

點擊復(fù)制文檔內(nèi)容

環(huán)評公示相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

multicore20xx-資料下載頁

華盛頓-20xx-資料下載頁

理想20xx-資料下載頁

microsoftofficevisio20xx-資料下載頁

september20xx-資料下載頁

junio20xx-資料下載頁

enterprisemetadatainsharepoint20xx-資料下載頁

abc20xx-資料下載頁

高鈣血癥---20xx-資料下載頁

cnki20xx-資料下載頁

waps20xx-資料下載頁

20xx082213532987-資料下載頁

netapp20xx-資料下載頁

blackwellpublishingcopyright20xx-資料下載頁

february20xx-資料下載頁

abc20xx-資料下載頁

multicore20xx(更新版)

multicore20xx(專業(yè)版)

multicore20xx(留存版)

multicore20xx-文庫吧