freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

計算機體系結構復習(參考版)

2025-01-21 20:01本頁面
  

【正文】 它依靠的是資源重復,而不是時間重疊。 效率低 (與流水線處理機、向量處理機等比較)。 模塊性好 ,生產和維護方便。按照佛林分類法,它屬于 SIMD計算機。 從 CU看,指令是串行執(zhí)行的,從 PU看,數據是并行處理的。 指令執(zhí)行時序 超標量超流水線處理機在一個時鐘周期內分時發(fā)射指令 n次,每次同時發(fā)射指令 m條,每個時鐘周期總共發(fā)射指令 m ? n條。 在超標量處理機中,流水線的有些功能段還可以進一步細分。 超流水線處理機采用的是時間并行性(并發(fā)性)。 超流水線處理機則通過各硬件部件充分重疊工作來提高處理機性能。 指令流水線有 8個或更多功能段的流水線處理機稱為超流水線處理機。 必須有兩條或兩條以上能夠同時工作的指令流水線。 設計目標是每個時鐘周期平均執(zhí)行多條指令, ILP的期望值大于 1。 需要多個取指令部件,多個指令譯碼部件和多個寫結果部件。 設計目標是每個時鐘周期平均執(zhí)行一條指令, ILP的期望值 1。 可以只設置一個多功能操作部件,也可以設置多個獨立的操作部件。 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 單發(fā)射與多發(fā)射 單發(fā)射處理機 : 每個周期只取一條指令、只譯碼一條指令,只執(zhí)行一條指令,只寫回一個運算結果。 多操作部件處理機: 一條指令流水線,多個獨立的操作部件,操作部件可以采用流水線,也可以不流水。橫向處理和縱向處理相結合的方式。向量計算是按列的方式自上而下縱向地進行。向量計算是按行的方式從左至右橫向地進行。 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 向量的流水處理與向量流水處理機 向量的流水處理 例如 , 要計算 D=A*(B+C), 其中 , A、 B、 C、 D都是具有 N個元素的向量 , 應該采用什么樣的處理方式才能最充分發(fā)揮流水線的效能呢 ? 。 對于中間形成的每一個新的沖突向量,也要按照這一方法進行處理。 連接圖不能唯一表示非線性流水線的工作流程,因此,引入流水線預約表。 ?t , S=k 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 線性流水線的性能分析 衡量流水線性能的主要指標有: 吞吐率、加速比和效率 吞吐率( Though Put) 求流水線吞吐率的最基本公式: TP = n / Tk n為任務數 , Tk為完成 n個任務所用時間。 只有連續(xù)出現同一種運算時,流水線的效率才能得到充分的發(fā)揮。 多功能流水線 : 流水線的各段通過不同連接實現不同功能。 每個處理機對同一個數據流的不同部分分別進行處理。 先行指令 緩沖棧 輸入 先行控制方式 中的指令流水線 先行指令 分析器 先行讀數棧 先行操作棧 取指 譯碼 取操作數 指令執(zhí) 行部件 后行 寫數棧 輸出 執(zhí)行 寫結果 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 部件級流水線 (操作流水線),如浮點加法器流水線。 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 按照流水線的級別來分 處理機級流水線 , 又稱為指令流水線。 線性流水線能夠用流水線連接圖唯一表示 。 (4)流水線需要有 “ 裝入時間 ” 和 “ 排空時間 ” 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 流水線的分類 線性流水線與非線性流水線 流水線的各個流水段之間是否有反饋信號 線性流水線 (Linear Pipelining) 每個流水段都流過一次,且僅流過一次。 (2)在流水線的每一個流水線段中都要設置一個流水鎖存器 時間開銷:流水線的執(zhí)行時間加長 是流水線中需要增加的主要硬件之一。 分析器 分析 k+1 流水 鎖存器 執(zhí)行部件 執(zhí)行 k 流水 鎖存器 輸 入 輸 出 ?t1 ?t2 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 流水線的時空圖 一條簡單流水線的時空圖: 分析 k 分析 k+1 分析 k+2 分析 k+3 執(zhí)行 k 執(zhí)行 k+1 執(zhí)行 k+2 執(zhí)行 k+3 時間 空間 0 t1 t2 t3 t4 t5 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 流水線的主要特點 (1)只有連續(xù)提供同類任務才能充分發(fā)揮流水線的效率 對于指令流水線:要盡量減少因條件分支造成的 “ 斷流 ” 。 超流水線處理機。 不增加或只增加少量硬件就能使運算速度提高幾倍。 超標量處理機。 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 第 5章 相關處理方法: 推后讀 設置相關專用通路 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 第 5章 流水方式 空間并行性 : 設置多個獨立的操作部件。 緩沖技術是在工作速度不固定的兩個功能部件之間設置緩沖棧,用以平滑它們的工作。這種結構被稱為哈佛結構。 如果再規(guī)定,執(zhí)行指令所需要的操作數和執(zhí)行結果只寫到通用寄存器,那么,取指令、分析指令和執(zhí)行指令就可以同時進行。 取指令、讀操作數、寫結果。 (2) 要解決訪問主存儲器的沖突問題 取指令、分析指令、執(zhí)行指令都可能要訪問存儲器。 取指 k+2 分析 k+2 執(zhí)行 k+2 取指 k+1 分析 k+1 執(zhí)行 k+1 取指 k 分析 k 執(zhí)行 k 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 先行控制方式的原理 采用二次重疊執(zhí)行方式,必須解決兩個問題: (1) 有獨立的取指令部件、指令分析部件 和指令執(zhí)行部件。 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 二次重疊執(zhí)行方式 如果三過程的時間相等,執(zhí)行 n條指令的時間為: T=(2+n)t 理想情況下同時有三條指令在執(zhí)行。 主要缺點: 需要增加一些硬件。 如果兩個過程的時間相等,則執(zhí)行 n條指令的時間為: T=(1+2n)t 第 5章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 取指 k 分析 k 執(zhí)行 k 取指 k+1 分析 k+1 執(zhí)行 k+1 取指 k+2 分析 k+2 執(zhí) 主要優(yōu)點: 指令的執(zhí)行時間縮短。 主要缺點: 執(zhí)行指令的速度慢,功能部件的利用率很低。 主要考慮因素: 命中率的提高; Cache與主存之間通信量的增加。 (2) 恒預?。簾o論 Cache是否命中,都把下一塊取到 Cache中。 目前,在寫回法中采用按寫分配法,在寫直達法中采用不按寫分配法。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 寫 Cache的兩種方法: (1) 不按寫分配法:在寫 Cache不命中時,只把所要寫的字寫入主存。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 Cache的更新算法: (1) 寫直達法 (寫通過法 ), Writethrough CPU在執(zhí)行寫操作時,把數據同時寫入Cache和主存。 造成 Cache與主存的不一致的原因: (1) 由于 CPU寫 Cache,沒有立即寫主存。 全相聯映像方式的替換算法最復雜。 第 4章 計算機體系結構 計算機系統(tǒng)結構 北京理工大學計算機學院 Cache替換算法及其實現 Cache替換算法使用的時間: 發(fā)生塊失效,且可以裝入新調入塊的幾個Cache塊都已經被裝滿時。 主存塊到 Cache組之間采用直接 映像 方式。 映像規(guī)則(位選擇映像算法): 主存和 Cache按同樣大小劃分成塊;Cache劃分成大小相同的組,主存按照Cache組容量分區(qū)。 整個 Cache地址與主存地址的低位部分完全相同。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 直接映像及其變換 映像規(guī)則: 主存中一塊只能映像到 Cache的一個特定的塊中。 用硬件實現非常復雜。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 全相聯映像及其變換 映像規(guī)則: 主存中的任意一塊都可以映像到 Cache中的任意一塊。 地址變換: 當程序已經裝入到 Cache之后,在實際運行過程中,把主存地址變換成 Cache地址。 采用散列變換實現快表按地址訪問 避免散列沖突:采用相等比較器 地址變換過程:相等比較與訪問存儲器同時進行。 快表與慢表也構成了一個兩級存儲系統(tǒng) 。 快慢表 快表 TLB(Translation Lookaside Buffer): 小容量 (幾~幾十個字 ),高速硬件實現,采用相聯方式訪問。 在虛擬存儲器中,實際上有可能采用只有FIFO和 LRU兩種算法。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 (5) 最優(yōu)替換算法 (OPT OPTimal replacemant algorithm): 是一種理想化的算法。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 (3) 近期最少使用算法 (LFU Least Frequently Used algorithm): 既充分利用了歷史信息,又反映了程序的局部性,實現起來非常困難。 (2) 先進先出算法 (FIFO FirstIn FirstOut algorithm): 比較容易實現,利用了歷史信息,沒有反映程序的局部性。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 地址的映像與變換 三種地址空間 : 虛擬地址空間,主存儲器地址空間,輔存地址空間 地址映像 : 把虛擬地址空間映像到主存地址空間 地址變換 : 在程序運行時,把虛地址變換成主存實地址 因地址映像和變換方法不同,有 三種虛擬存儲器 : 頁式虛擬存儲器、段式虛擬存儲器、段頁式虛擬存儲器。 把磁盤存儲器實地址和主存儲器實頁號送入輸入輸出處理機。 主存實頁號 p與它的頁內偏移 d直接拼接起來就得到主存實地址 A。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 內部地址變換 : 多用戶虛擬地址 Av變換成主存實地址 A。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 用戶號 U 虛頁號 P 頁內偏移 D 多用戶虛擬地址 Av的組成 實頁號 p 頁內偏移 d 主存地址 A的組成 一個 主存地址 A由兩部分組成,實頁號 p和頁內偏移 d。 三 加快內部地址映像及變換 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 虛擬存儲器 虛擬存儲器工作原理 虛擬存儲器由主存儲器和聯機工作的外存儲器(磁盤存儲器)共同組成的。 第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 提高存儲系統(tǒng)速度的途徑 : 一是提高命中率 H。 ),()1(1)1( 12211112 TTHfHHTHTHTTTeTT ???????????第 4章 計算機體系結構 計算機系統(tǒng)結構北京理工大學計算機學院 采用預取技術提高命中率 方法: 不命中時,把 M2存儲器中相鄰幾個單元組成的一個數據塊都取出來送入 M1存儲器中。 命中率定義: 在 M1存儲器中訪問到的概率。 所以,程序在執(zhí)行時所用到的指令和數據的地址分布不會是隨機的,而是相對簇聚的。 時間上的局部性是指最近訪問的代碼是不久將被訪問的代碼 ,這是由程序循環(huán)造成的。由于 Cache存儲系統(tǒng)全部用硬件來調度,因
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1