正文內(nèi)容

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講-文庫吧

2025-07-17 14:46 本頁面

【正文】 – 分布式內(nèi)存機(jī)器兩類機(jī)器：非均勻內(nèi)存訪問的機(jī)器和消息傳遞的機(jī)器為獲得良好的性能，軟件都必須有很好局部性基本知識總線或其它互連二級緩存二級緩存二級緩存二級緩存一級緩存一級緩存一級緩存一級緩存處理器處理器處理器處理器局部內(nèi)存局部內(nèi)存局部內(nèi)存局部內(nèi)存在內(nèi)存分層中又引入一層處理器能迅速訪問自己的局部內(nèi)存 18 ? 并行計算的常見方式 – 任務(wù)并行：每個處理器執(zhí)行不同的任務(wù) – 數(shù)據(jù)并行：把大任務(wù)分別成若干個相同的子任務(wù) ? 并行應(yīng)用的性能衡量的兩種標(biāo)準(zhǔn) – 并行覆蓋：整個計算中并行執(zhí)行部分的百分比 – 并行粒度：處理器上無需和其它處理器同步或通信的計算量循環(huán)級并行 19 ? 循環(huán)級并行 – 耗時的應(yīng)用一般都使用大數(shù)組，導(dǎo)致程序中出現(xiàn)有許多次迭代的循環(huán) ，每次迭代用于計算數(shù)組中的一個元素。這些迭代經(jīng)常相互獨立，它們是并行計算的主要來源 – 可以把這類循環(huán)的大量迭代分到各處理器上循環(huán)級并行 20 ? 循環(huán)級并行 for (i = 0。 i n。 i++) { //計算向量 X和 Y Z[i] = X[i] ? Y[i]。 //對應(yīng)元素差的平方 Z[i] = Z[i] ? Z[i]。 } 該循環(huán)可并行執(zhí)行，把它變換成如下代碼。由各處理器都執(zhí)行這段代碼來完成計算 b = ceil (n/M)。 // M個處理器 , p = 0, 1, …, M ?1 for (i = b?p。 i min(n, b?(p+1))。 i++) { Z[i] = X[i] ? Y[i]。 Z[i] = Z[i] ? Z[i]。 } // 數(shù)據(jù)并行的例子循環(huán)級并行 21 ? 循環(huán)級并行 – 對并行化來說，任務(wù)級不像循環(huán)級那樣有吸引力 – 對一個程序而言，獨立的任務(wù)數(shù)是一個常數(shù) ，它不像典型的循環(huán)那樣，獨立的計算單元隨迭代次數(shù)增加而增加 – 任務(wù)通常不是等規(guī)模的，因此很難保證所有的處理器在所有時間都處于忙碌循環(huán)級并行 22 程序中的局部性 ? 局部性的表現(xiàn) 大多數(shù)程序的大部分時間在執(zhí)行一小部分代碼，并且僅涉及一小部分?jǐn)?shù)據(jù) 。傳統(tǒng) 的說法：程序 90％的時間消耗在執(zhí)行 10％的代碼上（代碼的局部性） – 程序經(jīng)常包含許多決不會執(zhí)行的代碼，如由組件和庫構(gòu)建的程序經(jīng)常僅用所提供功能的一小部分 – 程序運(yùn)行時，通常僅一部分代碼被真正執(zhí)行。如處理非法輸入和異常情況的代碼，雖對程序的正確性至關(guān)重要，但它們很少被執(zhí)行 – 程序的大部分時間消耗在程序中最內(nèi)層循環(huán)和深度遞歸的執(zhí)行上 23 程序中的局部性 ? 兩種局部性 – 時間局部性程序運(yùn)行過程中被訪問的內(nèi)存單元（存放代碼或數(shù)據(jù) ）在很短的時間內(nèi)可能再次被程序訪問 – 空間局部性毗鄰被訪問單元的內(nèi)存單元在很短的時間內(nèi)會被訪問 – 同一個緩存行上的元素一起被使用是空間局部性的一種重要形式。它能把緩存未命中次數(shù)降到最低，因而使得程序獲得明顯的加速 24 程序中的局部性 ? 局部性與內(nèi)存分層 – 通常，最快的緩存沒有大到足以把代碼和數(shù)據(jù) 同時放在其中 – 從程序難以看出哪部分代碼和數(shù)據(jù) 會被頻繁使用 – 動態(tài)調(diào)整最快緩存的內(nèi)容不可避免 – 把最近使用的指令保存在緩存是一種較好的最優(yōu)化利用內(nèi)存分層的策略 – 改變數(shù)據(jù)布局或計算次序也可以改進(jìn)程序數(shù)據(jù)訪問的時間和空間局部性 25 ? 數(shù)據(jù)局部性計算向量 X和 Y對應(yīng)元素差的平方 for (i = 0。 i n。 i++) { // 該程序段對向量機(jī)來 Z[i] = X[i] ? Y[i]。 // 說是一種優(yōu)化形式 } for (i = 0。 i n。 i++) { Z[i] = Z[i] ? Z[i]。 } for (i = 0。 i n。 i++) { // 有較好的數(shù)據(jù)局部性 Z[i] = X[i] ? Y[i]。 Z[i] = Z[i] ? Z[i]。 } 程序中的局部性 26 ? 數(shù)據(jù)局部性 – 對行為主的數(shù)組 Z，根據(jù)空間局部性，顯然更愿意逐行地給該數(shù)組元素置零 for (j = 0。 j n。 j++) for (i = 0。 i n。 i++) for (i = 0。 i n。 i++) for (j = 0。 j n。 j++) Z[i, j] = 0。 Z[i, j] = 0。 – 為了獲得最好的性能，應(yīng)該讓外循環(huán)并行執(zhí)行 b = ceil (n/M)。 for (i = b?p。 i min(n, b?(p+1))。 i++) for (j = 0。 j n。 j++) Z[i, j] = 0。程序中的局部性 27 程序中的局部性例：一個結(jié)構(gòu)體大數(shù)組分拆成若干個數(shù)組 struct student { int num[10000]。 int num。 char name[10000][20]。 char name[20]。 … … … … } struct student st[10000]。 //非矩陣運(yùn)算的例子 ? 若是順序處理每個結(jié)構(gòu)體的多個域，左邊方式的數(shù)據(jù)局部性較好 ? 若是先順序處理每個結(jié)構(gòu)的 num域，再處理每個結(jié)構(gòu)的 name域， … ，則右邊方式的數(shù)據(jù)局部性較好 ? 最好是按左邊方式編程，由編譯器決定是否需要把數(shù)據(jù)按右邊方式布局 28 ? 矩陣乘算法 – 計算 Z = X ? Y，它們都是 n?n的矩陣（數(shù)組） – 矩陣數(shù)據(jù)的布局是行為主根據(jù)下面公式，當(dāng)使用 X的一行時，需逐列訪問 Y的所有元素矩陣乘算法及其優(yōu)化 29 Zi,j = Xi,1*Y1,j + ... + Xi,n*Yn,j j = 0, 1, … , n ?1 i = 0 X Y i=n1 ? 矩陣乘算法 – 計算 Z = X ? Y，它們都是 n?n的矩陣（數(shù)組） – 矩陣數(shù)據(jù)的布局是行為主矩陣乘算法及其優(yōu)化 30 Zi,j = Xi,1*Y1,j + ... + Xi,n*Yn,j 根據(jù)下面公式，當(dāng)使用 X的一行時，需逐列訪問 Y的所有元素 j = 0, 1, … , n ?1 i = 0 X Y i=n1 ? 矩陣乘算法 – 計算 Z = X ? Y，它們都是 n?n的矩陣（數(shù)組） – 矩陣數(shù)據(jù)的布局是行為主矩陣乘算法及其優(yōu)化 31 Zi,j = Xi,1*Y1,j + ... + Xi,n*Yn,j 根據(jù)下面公式，當(dāng)使用 X的一行時，需逐列訪問 Y的所有元素

點擊復(fù)制文檔內(nèi)容

公司管理相關(guān)推薦

計算機(jī)體系結(jié)構(gòu)第四章-資料下載頁

【總結(jié)】第四章存貯體系復(fù)習(xí)指導(dǎo)劉宏偉本章內(nèi)容要點?存貯體系的概念和并行主存系統(tǒng)；?虛擬存儲器；?高速緩沖存貯器；?主存保護(hù)。存貯體系的概念和并行主存系統(tǒng)?存貯體系的基本要求?并行主存系統(tǒng)?存貯體系的概念?存貯體

2025-09-25 20:03

計算機(jī)體系結(jié)構(gòu)專題研究學(xué)習(xí)報告-資料下載頁

【總結(jié)】計算機(jī)體系結(jié)構(gòu)專題研究學(xué)習(xí)報告報告人：劉曉莉2022年6月26日超線程專題作者：劉曉莉033355張雪蓮033354研究背景?CPU生產(chǎn)商為了提高CPU性能，通常做法是提高CPU的時鐘頻率和增加緩存容量?目前CPU的頻率越來越快，若依然采用以上方法來提高性能

2025-08-01 14:01

世界上首次提出存儲程序計算機(jī)體系結(jié)構(gòu)的是(-資料下載頁

【總結(jié)】計算機(jī)文化基礎(chǔ)復(fù)習(xí)資料一、選擇題1.世界上首次提出存儲程序計算機(jī)體系結(jié)構(gòu)的是（）A、莫奇萊B、艾侖·圖靈C、喬治·布爾D、馮·諾依曼2.世界上第一臺電子計算機(jī)是在（）年誕生的。A、1927B、1946C、l943D、19523．以下關(guān)于“計算機(jī)的特點”的論述中錯誤的是（

2025-06-16 22:45

[精選]計算機(jī)體系結(jié)構(gòu)之流水線技術(shù)-資料下載頁

【總結(jié)】?1北京信息科技大學(xué)計算機(jī)體系結(jié)構(gòu)3流水線技術(shù)張偉計算機(jī)學(xué)院計算機(jī)體系結(jié)構(gòu)北京信息科技大學(xué)大綱?1概念定義?2流水線分類?3MIPS五級流水線?4性能分析?5流水線相關(guān)?6高級流水線技術(shù)計算機(jī)體系結(jié)構(gòu)北京信息科技大學(xué)1

2025-01-16 12:56

中國計算機(jī)學(xué)會推薦國際學(xué)術(shù)刊物與會議計算機(jī)體系結(jié)構(gòu)-資料下載頁

【總結(jié)】中國計算機(jī)學(xué)會推薦國際學(xué)術(shù)刊物（計算機(jī)體系結(jié)構(gòu)）一、A類序號刊物簡稱刊物全稱出版社網(wǎng)址1.IEEEMicroIEEE2.TOCSACMTransactionsonComputerSystemsACM3.TOPLASACMTransactionsonProgrammingLanguagesand

2025-06-28 02:59

[精選]現(xiàn)代計算機(jī)體系結(jié)構(gòu)--cpu英文版-資料下載頁

【總結(jié)】1本資料來源2CPU(1)3KEYPOINTS1.CISCRISC2.Instructionpipeline3.Instruction-levelparallelism4.Dynamicscheduling5.Scoreboard6.Loopunrolling7.Registerrenamin

2025-01-23 22:37

計算機(jī)體系結(jié)構(gòu)課程實驗教學(xué)大綱(ⅱ)-資料下載頁

【總結(jié)】《計算機(jī)體系結(jié)構(gòu)》課程實驗教學(xué)大綱(Ⅱ)[注：同一門實驗課程若對不同專業(yè)開設(shè)的實驗項目、實驗要求不同，則大綱應(yīng)不同，區(qū)分可采用題目后加（Ⅰ）、（Ⅱ）、（Ⅲ）……的辦法]編號：課程總學(xué)時：48實驗學(xué)時：8課程總學(xué)分：實驗學(xué)分：（非單獨設(shè)課的實驗不用填此項）先修課程：《計算機(jī)組成原理與體系結(jié)構(gòu)》《數(shù)字邏輯》適用專業(yè)：計算機(jī)科學(xué)與技術(shù)(嵌入式專升本)、網(wǎng)絡(luò)工

2025-04-17 12:08

第一章計算機(jī)體系結(jié)構(gòu)的基本概念-資料下載頁

【總結(jié)】第一章計算機(jī)體系結(jié)構(gòu)的基本概念ComputerArchitecture1.第一臺通用電子計算機(jī)誕生于1946年18000個電子真空管?33萬億個晶體管(18億倍)800字節(jié)存儲容量?4萬億字節(jié)(50億倍)運(yùn)算速度5000次/秒?/秒

2025-07-20 14:15

高性能計算機(jī)的體系結(jié)構(gòu)與程序優(yōu)化-資料下載頁

【總結(jié)】InstituteofComputingTechnology,CAS高性能計算機(jī)的體系結(jié)構(gòu)與程序優(yōu)化唐志敏中國科學(xué)院計算技術(shù)研究所提綱?應(yīng)用編程與體系結(jié)構(gòu)的關(guān)系?高性能計算機(jī)體系結(jié)構(gòu)概述?CPU內(nèi)的并行結(jié)構(gòu)（指令級并行）?存儲器的層次結(jié)構(gòu)?多體交叉的并行存儲系統(tǒng)?分布存儲系統(tǒng)中的通信優(yōu)化

2025-08-22 23:11

[農(nóng)學(xué)]計算機(jī)體系結(jié)構(gòu)李學(xué)干第二章課件-資料下載頁

【總結(jié)】第二章數(shù)據(jù)表示與指令系統(tǒng)內(nèi)容提要?數(shù)據(jù)表示?尋址方式?指令系統(tǒng)的設(shè)計和改進(jìn)數(shù)據(jù)數(shù)據(jù)：數(shù)據(jù)是描述客觀事物的一些相互無關(guān)的符號。數(shù)據(jù)元素：是數(shù)據(jù)的基本單位。數(shù)據(jù)類型：除了是一組值的集合外，還定義了可作用于這個集合上的操作集。目的：防止不同類型數(shù)據(jù)間的誤操作分類

2025-10-09 22:41

[精選]計算機(jī)體系結(jié)構(gòu)之流水線工作原理與分類-資料下載頁

【總結(jié)】ComputerArchitecture,Autumn2023北京郵電大學(xué)計算機(jī)系科學(xué)與技術(shù)系流水線基礎(chǔ)(PipeliningBasic)王春露（Prof.ChunluWang）ComputerArchitecture,Autumn2023流水線

2025-01-16 12:51

[計算機(jī)]oracle體系結(jié)構(gòu)-資料下載頁

【總結(jié)】Oracle體系結(jié)構(gòu)：物理結(jié)構(gòu)，邏輯結(jié)構(gòu)，內(nèi)存結(jié)構(gòu)，數(shù)據(jù)庫實例和進(jìn)程，數(shù)據(jù)字典物理結(jié)構(gòu)：數(shù)據(jù)文件，日志文件，控制文件，配置文件數(shù)據(jù)文件用來存儲數(shù)據(jù)庫中的全部數(shù)據(jù)，如數(shù)據(jù)庫表中的數(shù)據(jù)和索引數(shù)據(jù)。。日志文件（又稱重做日志文件），用于記錄數(shù)據(jù)庫所做的全部變更（如增加、刪除、修改），以便在系統(tǒng)發(fā)生故障時，用它對數(shù)據(jù)庫進(jìn)行恢復(fù)。名字通常為Log*.dbf格式控制文件每個Or

2025-08-21 17:17

北郵大三計算機(jī)體系結(jié)構(gòu)實驗三dlx處理器程序設(shè)計-資料下載頁

【總結(jié)】實驗三DLX處理器程序設(shè)計1.實驗?zāi)康膶W(xué)習(xí)簡單編譯優(yōu)化方法，觀察采用編譯優(yōu)化方法所帶來的性能的提高。2.實驗原理采用靜態(tài)調(diào)度方法重排指令序列，減少相關(guān)，優(yōu)化程序。3、實驗內(nèi)容和要求自編一段匯編代碼，完成一維向量加法運(yùn)算，并輸出結(jié)果。觀察程序中出現(xiàn)的數(shù)據(jù)/控制/結(jié)構(gòu)相關(guān)。（注：使用一維數(shù)組表示一維向量。）4．1向量加法代碼清單及注釋說明1、向量

2025-06-26 08:28

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講-文庫吧

計算機(jī)體系結(jié)構(gòu)第四章-資料下載頁

計算機(jī)體系結(jié)構(gòu)專題研究學(xué)習(xí)報告-資料下載頁

世界上首次提出存儲程序計算機(jī)體系結(jié)構(gòu)的是(-資料下載頁

[精選]計算機(jī)體系結(jié)構(gòu)之流水線技術(shù)-資料下載頁

中國計算機(jī)學(xué)會推薦國際學(xué)術(shù)刊物與會議計算機(jī)體系結(jié)構(gòu)-資料下載頁

[精選]現(xiàn)代計算機(jī)體系結(jié)構(gòu)--cpu英文版-資料下載頁

計算機(jī)體系結(jié)構(gòu)課程實驗教學(xué)大綱(ⅱ)-資料下載頁

第一章計算機(jī)體系結(jié)構(gòu)的基本概念-資料下載頁

高性能計算機(jī)的體系結(jié)構(gòu)與程序優(yōu)化-資料下載頁

[農(nóng)學(xué)]計算機(jī)體系結(jié)構(gòu)李學(xué)干第二章課件-資料下載頁

[精選]計算機(jī)體系結(jié)構(gòu)之流水線工作原理與分類-資料下載頁

[計算機(jī)]oracle體系結(jié)構(gòu)-資料下載頁

北郵大三計算機(jī)體系結(jié)構(gòu)實驗三dlx處理器程序設(shè)計-資料下載頁

多核體系結(jié)構(gòu)與并行編程模型計算機(jī)科學(xué)導(dǎo)論第八講-資料下載頁

最新北郵大三計算機(jī)體系結(jié)構(gòu)實驗三dlx處理器程序設(shè)計-資料下載頁

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講-wenkub

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講(已修改)

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講(編輯修改稿)

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講-wenkub.com

面向計算機(jī)體系結(jié)構(gòu)的程序優(yōu)化計算機(jī)科學(xué)導(dǎo)論第七講(已改無錯字)