freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

集成電路工程畢業(yè)論文設(shè)計(jì)-簇狀高性能數(shù)字信號(hào)處理器控制與存取關(guān)鍵技術(shù)研究(更新版)

2025-07-29 12:04上一頁面

下一頁面
  

【正文】 存信息寫回存儲(chǔ)陣列中。 空操作是在 SDRAM 沒有指令的時(shí)候采取的一種操作,避免重復(fù)上一條指令。如果要連續(xù)讀寫就是要對(duì)當(dāng)前存儲(chǔ)單元下一個(gè)單元進(jìn)行尋址,需要不斷發(fā)送列地址和讀命令,需要占用控制資源。 圖 2 8 tRCD=3 時(shí)序圖 8 Timing Diagram of tRCD=3 行列地址都選定之后確定了存儲(chǔ)單元,之后等待數(shù)據(jù)通道 DQ 讀取或者寫入數(shù)據(jù)。 Wen 信號(hào)為高時(shí)表示讀操作, Wen 為低是表示寫操作。片選和 Bank 選定可以與行有效同時(shí)進(jìn)行。 SDRAM 內(nèi)部組織結(jié)構(gòu)是并行的流水線結(jié)構(gòu)。 SDRAM 的地址也上海交通大學(xué)碩士學(xué)位論文 11 就分為 Bank 地址、行地址與列地址。與傳統(tǒng)的 DRAM 相比, SDRAM 在存儲(chǔ)體的組織方式和對(duì)外操作上做了重大改進(jìn)。其中單管型結(jié)構(gòu)簡(jiǎn)單、開銷小因此應(yīng)用廣泛。采用了分布式的結(jié)構(gòu)需要額外增加交叉開關(guān),確保數(shù)據(jù)可以在不同的寄存器文件間交互。分布式寄存器文件的面積主要由這些交叉開關(guān)決定,因此與 (N/C)2 成正比。 處理器對(duì)于寄存器帶寬和容量產(chǎn)生了更高的要求,要求大量的本地寄存器文件 , 在保證寄存器文件容量、面積和功耗的前提上海交通大學(xué)碩士學(xué)位論文 8 下,提高核心級(jí)存儲(chǔ)帶寬。 與此同時(shí)處理器和存儲(chǔ)器速度上差距不斷增大。靜態(tài)隨機(jī)存儲(chǔ)器采用觸發(fā)器的邏輯門結(jié)構(gòu)存儲(chǔ)數(shù)據(jù),因此只有在供電情況下才能保存數(shù)據(jù)。按照存儲(chǔ)器的讀寫功能進(jìn)行分類,可以將半導(dǎo)體存儲(chǔ)器分為只讀存儲(chǔ)器( ROM)和隨機(jī) 訪問 存儲(chǔ)器 [26]( RAM)。 其 目標(biāo)是將下一層存儲(chǔ)器中的數(shù)據(jù)預(yù)先取到上一層存儲(chǔ)器中,以實(shí)現(xiàn)更好的性能。 第六章概括了本文的主要工作內(nèi)容以及創(chuàng)新點(diǎn),并對(duì)后續(xù)研究工作做出展望。其次對(duì)于存儲(chǔ)預(yù)取技術(shù)進(jìn)行詳細(xì)的分類和概述。找到一種適合 現(xiàn)有 結(jié)構(gòu) 的預(yù)取 方法 ,配以相應(yīng)的存儲(chǔ)控制器,提高處理器訪存效率和系統(tǒng)性能。僅僅對(duì)于關(guān)鍵訪問驅(qū)動(dòng)預(yù)取。 預(yù)取可以大大提升訪問存儲(chǔ)器所占用的時(shí)間,然而無效的預(yù)取會(huì)造成 Cache污染,同時(shí)無效預(yù)取產(chǎn)生的功耗會(huì)增大系統(tǒng)開銷。但是預(yù)取不可能做到和理想情況一樣精準(zhǔn),數(shù)據(jù)返回時(shí)間不會(huì)恰好是處理器需要的時(shí)間。 現(xiàn)代通用處理器以及專用數(shù)字信號(hào)處理器 大 都采用三層存儲(chǔ)系統(tǒng)結(jié)構(gòu),即 核內(nèi) 寄存器,高速緩存( Cache)以及片外存儲(chǔ)器。 2021 年 6 月投片的 VIRAM[12]是 UC Berkley 開發(fā)的用于多媒體處理的向量芯片。 圖 1 2 Imagine 流處理器結(jié)構(gòu) [9] 2 Imagine Stream Processor Architecture 2021 年 4 月投片成功的 Imagine[910]是斯坦福大學(xué)開發(fā)的流體系結(jié)構(gòu)芯片。然而如果處理器要訪問的數(shù)據(jù)不在 Cache 中,則無論采用多大容量的 Cache,也無論采用多少級(jí)的存儲(chǔ)器層次結(jié)構(gòu),都只能將流水線停頓下來。 Cache 技術(shù)利用訪存的局部性原理,采用層次化組織存儲(chǔ)介質(zhì),提高 整個(gè) 存儲(chǔ)系統(tǒng)的性能。 43 表 5 2 SDRAM 芯片管腳描述 30 表 5 1 實(shí)驗(yàn)環(huán)境及其參數(shù) 25 表 4 1 三級(jí)存儲(chǔ)系統(tǒng)規(guī)格 48 圖 5 7 二維 DCT 算法訪存周期數(shù) 46 圖 5 5 FIR 濾波算法訪存周期數(shù) 34 圖 4 6 SDRAM 控制器內(nèi)部結(jié)構(gòu) 12 圖 2 8 TRCD=3 時(shí)序圖 10 圖 2 5 SDRAM BANK 結(jié)構(gòu)圖 9 圖 2 4 DRAM 單元結(jié)構(gòu)圖 40 算法映射 35 片上與片外存儲(chǔ)的交互機(jī)制 26 本章小結(jié) 23 分 布式寄存器文件結(jié)構(gòu) 7 SDRAM 基本原理 6 存儲(chǔ)器的分類 II 第一章 緒論 關(guān)鍵詞: 數(shù)字信號(hào)處理器,分布式寄存器,寫回,預(yù)取, SDRAM 控制器上海交通大學(xué)碩士學(xué)位論文 II CONTROL AND MEMORY ACCESS RESEARCH FOR CLUSTERED HIGH PERFORMANCE DIGITAL SIGNAL PROCESSOR ABSTRACT High performance digital signal processing is puteintensive, and the processor should have high putation ability. Clustered putation array has the advantage of peak putation ability and high parallelism. At the same time, the chip39。 本課題以高性能數(shù)字信號(hào)處理器項(xiàng)目為基礎(chǔ),設(shè)計(jì) 了包括 16 個(gè)運(yùn)算簇的高性能運(yùn)算陣列。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人授權(quán)上海交通大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。 針對(duì)訪問 共享的 片外 SDRAM 效率較低 的問題,提出了一種基于步長(zhǎng)的硬件數(shù)據(jù)預(yù)取設(shè)計(jì)方案。 1 課題研究背景 2 預(yù)取技術(shù)研究現(xiàn)狀 4 論文的章節(jié)安排 10 SDRAM 讀寫操作 20 簇狀高性能數(shù)字信號(hào)處理器 22 整體結(jié)構(gòu) 22 運(yùn)算功能單元結(jié)構(gòu) 29 片上預(yù)取緩沖存儲(chǔ)系統(tǒng) 34 整體結(jié)構(gòu) 34 控制器設(shè)計(jì) 39 第五章 算法映射與性能分析 43 性能評(píng)估分析 50 第六章 結(jié)束語 51 后續(xù)研究工作 52 附錄 1 1 圖 1 2 IMAGINE 流處理器結(jié) 構(gòu) [6] 44 圖 5 3 SDRAM 芯片內(nèi)部結(jié)構(gòu) 46 表 5 4 預(yù)取存儲(chǔ)系統(tǒng)綜合結(jié)果 49 表 5 8 FFT 算法訪存周期數(shù) 隨著運(yùn)算單元的發(fā)展,核內(nèi)寄存器的結(jié)構(gòu)也出現(xiàn)了新的變化。 為了減少 Cache 的缺失,及時(shí)地向處理器提供所需的數(shù)據(jù),保證流水線始終處于高速運(yùn)行狀態(tài),有 兩個(gè)趨勢(shì)一直是存儲(chǔ)系統(tǒng)發(fā)展的主旋律,一是采用更大的Cache 容量,以包含盡可能多的指令和數(shù)據(jù);二是采用多層次的 Cache 策略,形上海交通大學(xué)碩士學(xué)位論文 2 成梯次化的存儲(chǔ)體系結(jié)構(gòu)。通過數(shù)據(jù)的預(yù)取來降低存儲(chǔ)器訪問的延遲時(shí)間,進(jìn)而獲得更大的處理器性能。 在 Imagine 中實(shí)現(xiàn)了數(shù)據(jù)級(jí)并行、指令并行以及任務(wù)級(jí)并行。 VIRAM 可以像使用主存一樣使用片上 DRAM,通過使用延遲流水線隱藏訪問 DRAM 的延遲。目前的數(shù)據(jù)預(yù)取技術(shù)可以分為 兩類:軟件預(yù)取和 硬件預(yù)取。 硬件預(yù)取不需要預(yù)取指令,因此對(duì)于編譯器沒有額外的開銷?;跉v史信息的預(yù)取污染過濾器動(dòng)態(tài)的決定每一個(gè)預(yù)取的有效性。對(duì)于預(yù)取和正常訪存進(jìn)行動(dòng)態(tài)調(diào)度,提高有效預(yù)取的訪存優(yōu)先級(jí)同時(shí)過濾掉無效預(yù)取的訪存請(qǐng)求。 片外存儲(chǔ)控制器采用批量訪問模式,相對(duì)單個(gè)數(shù)據(jù)訪存大大提高訪問效率。首先介紹了項(xiàng)目的整體結(jié) 構(gòu),著重分析了簇狀運(yùn)算陣列的整體結(jié)構(gòu)和各個(gè)功能單元作用以及控制方式。 每一級(jí)的存儲(chǔ)器使用的存儲(chǔ)介質(zhì)也不相同。 存儲(chǔ)器的分類 存 儲(chǔ)器是計(jì)算機(jī)系統(tǒng)中的記憶設(shè)備,根據(jù)控制器指定的位置存入和讀取信息。 隨機(jī)訪問存儲(chǔ)器既能讀取數(shù)據(jù)也能寫入數(shù)據(jù),通過電信號(hào)完成讀寫操作。對(duì)于存儲(chǔ)系統(tǒng)而言,高速緩存通常采用SRAM 作為存儲(chǔ)介質(zhì)以實(shí)現(xiàn)更快的速度,一般高速緩存的頻率與內(nèi)核頻率一致。遠(yuǎn)離處理器的存儲(chǔ)器速度越慢容量越大。如圖 22 所示, SIMD 運(yùn)算簇的本地寄存器文件可以分為集中 式和分布式兩種結(jié)構(gòu)。 分布式寄存器文件的結(jié)構(gòu)以額外的互聯(lián)交叉開關(guān)為代價(jià),降低了面積和功耗。 SDRAM基本原理 片上的存儲(chǔ)器具有較高的效率和速度,然而對(duì)于大批量密集運(yùn)算,大容量的存儲(chǔ)設(shè)備必不可少。讀操作時(shí)行選通線置 1,存儲(chǔ)在 CS上的電荷 通過晶體管 T 輸出到數(shù)據(jù)線上。訪問時(shí)先打開一個(gè)行( Row),再指定一個(gè)列( Colum),就可以找到指定的單元格,這是芯片內(nèi)部尋址的基本原理。一般比較常見的有 32bit、 64bit 等。 SDRAM 內(nèi)部有一個(gè)邏輯控制單元,還有一個(gè)模式寄存器為其提供參數(shù)。一般 SDRAM地址線為 12 位,總共可以表示 212=4096 行。 圖 2 7 列有效時(shí)序圖 7 Column Effective Timing Diagram 由于 SDRAM 芯片的特性,行有 效和列有效之間必須有一段間隔。 CL 廣義上也是時(shí)鐘周期數(shù) ,與讀操作更為相關(guān)。 上海交通大學(xué)碩士學(xué)位論文 14 圖 2 10 突 發(fā)傳輸模式 10 Burst Transfer Mode 突發(fā)長(zhǎng)度的設(shè)定是在芯片的模式寄存器內(nèi)設(shè)定,常見的有 8 和全頁。包括定義突發(fā)長(zhǎng)度,突發(fā)模式, CAS Latency 等。刷新不需要外部提供行地址信息,這是一個(gè)內(nèi)部的自動(dòng)操作。將數(shù)據(jù)預(yù)先從片外存儲(chǔ)器取到片上高速緩存中,可有效增加Cache 命中率,減少訪問主存的開銷。 i++) for(j=0。 } 上海交通大學(xué)碩士學(xué)位論文 16 插入過晚可能會(huì)導(dǎo)致不能充分隱藏訪存延遲 。 Smith 將這些方案概括為兩種: PrefetchonMiss 算法 [30]和 Tagged Prefetch 算法。 圖 2 12 一個(gè)跨步預(yù)取的程序段 12 Step Based Prefetch Code Chen 和 Baer 提出一種基于 RPT 的硬件預(yù)取方案 [16]。 j++) for(k=0。 圖 2 13 RPT 的組織結(jié)構(gòu)圖 13 RPT Structure 預(yù)取相關(guān)的主存控制器 預(yù)取是高速緩存通過某種預(yù)測(cè)手法,將 SDRAM 中的數(shù)據(jù)預(yù)先拿到高速緩存中。通過在一段時(shí)間在特定核上運(yùn)行一個(gè)應(yīng)用來衡量預(yù)取準(zhǔn)確性。自適應(yīng)預(yù)取調(diào)度包括: 具有更高優(yōu)先級(jí) 比 行沖突請(qǐng)求 具有更高優(yōu)先級(jí) 預(yù)取準(zhǔn)確性的 核產(chǎn)生的 常規(guī)訪存請(qǐng)求 具有更高的優(yōu)
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1