freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

網(wǎng)絡(luò)處理器中微引擎的設(shè)計(jì)與實(shí)現(xiàn)學(xué)位論文-資料下載頁

2025-08-19 00:27本頁面

【導(dǎo)讀】究工作及取得的研究成果。除已特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果。培養(yǎng)單位和學(xué)位授予單位有權(quán)保留并向國家有關(guān)。索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。保密的學(xué)位論文在解密后適用此授權(quán)。能和可編程能力的解決方案,獲得了越來越多的關(guān)注和應(yīng)用。網(wǎng)絡(luò)處理器是一種。網(wǎng)絡(luò)處理器一般都集成了多個(gè)RISC處理器來滿足高性能線速處理要求,這。本文主要研究了網(wǎng)絡(luò)處理器中微引擎的設(shè)計(jì)與實(shí)現(xiàn)。首先分析了科研項(xiàng)目中。激勵(lì)與隨機(jī)產(chǎn)生激勵(lì)相結(jié)合進(jìn)行了覆蓋率統(tǒng)計(jì)。境,即運(yùn)行IPv4轉(zhuǎn)發(fā)測試從吞吐率和丟包率方面進(jìn)行性能評(píng)估。本文主要內(nèi)容和創(chuàng)新點(diǎn)總結(jié)如下:。引擎對(duì)外部數(shù)據(jù)數(shù)據(jù)的訪問以及數(shù)據(jù)運(yùn)算要求非常適用。他處理器驗(yàn)證工作提供模板。對(duì)于FPGA的開銷評(píng)估,輸入LUT,運(yùn)行頻率達(dá)到。

  

【正文】 r a m e m e m o r y 0r e s u l t m e m o r y 0r e s u l t m e m o r y n1 2 8F r a m e m e m o r yR X 5 1 26 4 6 41 1 1 7 8 7H T F DE T F DE x t e r m a l H o s t3 2S t a t i s t i c s B l o c k3 2. . .1 2 81 2 8O Q1 1 1f r a m e m e m o r y 05 1 21 2 8 1 2 86 4 6 43 25 1 25 1 2R F DR XT XF r a m e m e m o r yF r a m e m e m o r yT X 5 1 2S e a r c h 11 2 8 圖 修改微引擎組織結(jié)構(gòu) 網(wǎng)絡(luò)處理器 微引擎設(shè)計(jì)技術(shù)研究 微引擎處理 單元 架構(gòu) 網(wǎng)絡(luò)處理器 是 利用多個(gè) 微引擎 處理單元并行工作來提供強(qiáng)大的處理能力,因此作為 NP 核心的 微引擎 的必須 具備處理 高效、 設(shè)計(jì) 簡單 以及編程容易等特點(diǎn) 。一方面 需要盡量的降低每個(gè) 微引擎 的面積和功 耗,從而才能 使 集成多個(gè) 微引擎 的NP 整體仍然滿足約束;另一方面 微引擎 還要根據(jù) 網(wǎng)絡(luò) 業(yè)務(wù)特點(diǎn) ,提供豐富操作和 較 高 頻率, 才能 使 NP 達(dá)到 較好的 處理能力 。 微引擎 的 架構(gòu) 有 以下三種 實(shí)現(xiàn)方式 。 1) 基于 RISC 核 心 。 由于 RISC 處理器不僅設(shè)計(jì)難度相對(duì)較小 , 而且 精簡 指令集 有 益于 CPU 跑到更高的 時(shí)鐘 頻率 , 目前 已經(jīng)得到廣泛使用 ,包括 IBM 的 PowerNP 系列 、 Intel 的 IXP12xx/24xx 系列等等。其中的 RISC 核 心 既有 簡單的單 標(biāo)量 流水線 結(jié)構(gòu) ,也有 復(fù)雜的超標(biāo)量 流水線 結(jié)構(gòu) 。 2) 基于 VLIW ( Very Long InstructionWord,超長指令字) 核 心 。 VLIW 結(jié)構(gòu) 的目的 是通過把多條指令連接在一起來 發(fā)掘出 更 多的 指令級(jí)并行性 ,但 需 要相應(yīng)的 編譯器進(jìn)行 輔助 開發(fā)。這種架構(gòu)的優(yōu)點(diǎn)是 低功耗、低 設(shè)計(jì)復(fù)雜度 與高性能 。 目前 采用 VLIW 架 構(gòu)的 NP 不多, 如 Cisco PXF 等 ,一般應(yīng)用于網(wǎng)絡(luò)邊緣的高性能路由器中 。 電子科學(xué)研究院碩士學(xué)位論文 12 3) 基于數(shù)據(jù)流處理 單元核 心 。這 種 架構(gòu) 和傳統(tǒng)的順序編程模型 差別很大 ,它不需要顯式的控制流, 只要處理單元的 功能部件接收到 所需 數(shù)據(jù)就馬上進(jìn)行處理。采用這種 架構(gòu) 的 NP 產(chǎn)品 也 并不多, 例如 Xelerated 的 X11/X10q 網(wǎng)絡(luò) 處理器 。 微引擎指令 集 架構(gòu) 微引擎的一個(gè) 重要功能是執(zhí)行程序的每條指令,完成程序所要實(shí)現(xiàn)的功能。所以,指令系統(tǒng)的設(shè)計(jì)是微引擎設(shè)計(jì)的一大重點(diǎn) 。 目前處理器的兩種指令集架構(gòu)分別是 復(fù)雜指令集 計(jì)算機(jī) ( CISC)和精簡指令集 計(jì)算機(jī) ( RISC)。 早期的計(jì)算機(jī) 都采用 CISC 架構(gòu), 設(shè)計(jì) CISC 的目的是希望花費(fèi)盡量 少的 指令開銷 完成所需 處理 任務(wù)。 每 條 指令可執(zhí)行多個(gè)操作,如 乘法和寫數(shù)據(jù)等操作。但由于指令格式 復(fù)雜 ,尋址模式 多種 多樣, 不僅增加了硬件設(shè)計(jì)的復(fù)雜 度 而且執(zhí)行工作效率較差 。 正因?yàn)?CISC 的這些缺點(diǎn),產(chǎn)生 了 RISC 技術(shù) 。 RISC 注重 簡化指令系統(tǒng),優(yōu)先選 擇 使用頻率最高的 且不復(fù)雜的指令 ;減少指令格式 種類 和尋址方式種類; 采用等長 指令,指令 內(nèi)部 各字段的劃分比較一致 且 各字段的功能較為 規(guī)整; 控制大部分指令在單周期內(nèi)完成; 采用 專用 指令 ( Load/Store) 訪問存儲(chǔ)器 , 而安排其余 指令在寄存器之間進(jìn)行 操作 ;增加通用寄存器數(shù)量, 可用于 算術(shù)邏輯運(yùn)算指令的操作數(shù)存取;采用高級(jí)語言編程 并進(jìn)行 編譯優(yōu)化,以減少程序執(zhí)行時(shí)間。 RISC 的這些努力使計(jì)算機(jī)的結(jié)構(gòu)更簡單合理,運(yùn)算效率更高。 網(wǎng)絡(luò)處理器中的微引擎 一般負(fù)責(zé) 數(shù)據(jù)平面的處理 ( 如 包 分類、 查找、轉(zhuǎn)發(fā)等 ) ,雖 然此類操作 較為簡單 但必須 保證操作延遲較低 ;而 一般由 片上的通用處理器來完成 控制平面的處理( 如 系統(tǒng)信息維護(hù) 、 協(xié)議處理 等 ) ,這類操作較為復(fù)雜,但是通常每個(gè)分組 并不是 必須進(jìn)行。隨著 網(wǎng)絡(luò) 應(yīng)用的發(fā)展, 數(shù)據(jù)平面和控制平面 的界限已經(jīng)逐漸模糊,因此現(xiàn)在微引擎指令集必須同時(shí) 考慮兩方面的處理 。 微引擎 并行技術(shù) 并行技術(shù)可以有效地提高 微引擎 的處理能力,按照并行性等級(jí)從高 到低 可分為:線程級(jí)并行 、數(shù)據(jù)級(jí)并行、指令級(jí)并行以及指令內(nèi)部的微操作并行 。針對(duì)本文的設(shè)計(jì),本節(jié)只介紹指令 級(jí) 并行。指令 級(jí) 并行需要采用流水線技術(shù) 和超標(biāo)量技術(shù)。 ( 1) 流水線技術(shù) 如今已廣泛使用的 流水線 技術(shù) 通過將任務(wù) 劃分為 多個(gè)流水 段 執(zhí)行而提高系統(tǒng)的吞吐率。 其中 組合邏輯構(gòu)成的 流水段 負(fù)責(zé) 進(jìn)行運(yùn)算和處理,而 由 相鄰流水級(jí)之間 的寄存器 來 暫存中間 運(yùn)行 結(jié)果。 在 理想狀況下 各 流水段 處理時(shí)間相等, 從而使 吞吐率 提高到 n 倍 ( n 為流水線的深度),但 在 實(shí)際 中, 處理時(shí)間最長的流水網(wǎng)絡(luò)處理器微引擎研究 13 段將成為流水線的瓶頸 。 以 傳統(tǒng)的五級(jí)流水線 為例 , 指令的執(zhí)行過程細(xì)分為取指( IF) 、譯碼 ( ID) 、執(zhí)行 ( EX) 、訪問存儲(chǔ)器 ( MEM) 和寫回寄存器堆 ( WB) 5 個(gè)子過程,如圖 所示。 I F I D E X M E M W BI F I D E X M E M W BI F I D E X M E M W BI F I D E X M E M W BI F I D E X M E M W B 圖 五級(jí)經(jīng)典流水線 此外 實(shí)際 中 的流水線 中 的加速比 , 會(huì) 由于流水級(jí)間邏輯 增加新的開銷 , 以及由于 存在著 多種多樣 的 沖突 導(dǎo)致流水線的停頓而 大幅降低 。 流水線的沖突一般有以下三種類型: 1)結(jié)構(gòu)沖突。因?yàn)橛布Y源 ( 如功能單元、寄存器 和存儲(chǔ)器等 )滿足不了指令重疊執(zhí)行的要求而發(fā)生流水線沖突 。通常采用相應(yīng) 的指令調(diào)度策略或增加硬件資源 來減小 沖突的 影響。 2)數(shù)據(jù)沖突。 當(dāng)指令在流水線重疊執(zhí)行時(shí),因需要用到前面指令執(zhí)行的結(jié)果而發(fā)生的沖突。 大 部分?jǐn)?shù)據(jù)沖突可以通過修改相關(guān)寄 存器別名來消除。 3)控制沖突。流水線在遇到分支跳轉(zhuǎn)指令或其它會(huì)改變PC(程序指針) 值的指令所造成的沖突。 流水線暫停 是 解決 控制 沖突最簡單有效的方法。 ( 2) 超標(biāo)量技術(shù) 超標(biāo)量( Superscaler) 架構(gòu) 是 指 在 處理器 中 有 兩條及兩條 以上的 流水線 , 且每 個(gè) 時(shí)鐘周期可完成 多條 指令 , 其實(shí)質(zhì)是以空間換取時(shí)間 []。超標(biāo)量處理器是指為提高標(biāo)量指令的執(zhí)行性能而設(shè)計(jì)的一種計(jì)算機(jī)。采用超標(biāo)量技術(shù) 處理器的 在每個(gè)時(shí)鐘周期能夠發(fā)送多條指令,并相互獨(dú)立地執(zhí)行。 因此 大大提高指令流水線的指令流出率, 從而提高了處理器的性能 。 本章小結(jié) 首 先分析了網(wǎng)絡(luò)處理器的微引擎處理單元之間的組織結(jié)構(gòu), 即串行、并行以及混合模式。 并引出了本課題的研究內(nèi)容 —— P1600 網(wǎng)絡(luò)處理器,接著對(duì) P1600的四類微引擎 —— 解析、搜索、轉(zhuǎn)發(fā)、修改 進(jìn)行了詳細(xì)分析。 其次,研究了微引擎設(shè)計(jì)技術(shù) 。微引擎的架構(gòu)實(shí)現(xiàn)方式一般可以分成基于 RISC 核、 VLIW 核以及數(shù)據(jù)流處理等三種類型; 微引擎的指令集架構(gòu) 可分為電子科學(xué)研究院碩士學(xué)位論文 14 CISC 和 RISC, 微引擎處理單元的指令集必須同時(shí)適合于數(shù)據(jù)平面和控制平面。最后分析了微引擎的并行技術(shù)流水線和超標(biāo)量。 轉(zhuǎn)發(fā)微引擎的設(shè)計(jì)與實(shí)現(xiàn) 15 第 3章 轉(zhuǎn)發(fā) 微引擎設(shè)計(jì) 與 實(shí)現(xiàn) 指令集 設(shè)計(jì) 不同于 通用 處理器的指令集 設(shè)計(jì) , 網(wǎng)絡(luò)處理器 中 微引擎處理單元的指令集 設(shè)計(jì) 必須 符合網(wǎng)絡(luò)處理的特點(diǎn)。通常 微引擎 的指令集 是基于 RISC 處理器 指令集 的定點(diǎn) 操作 部分 ,然后 通過 適當(dāng) 裁減并增加一些特殊的控制 和運(yùn)算 指令來實(shí)現(xiàn)的。一方面,因?yàn)?網(wǎng)絡(luò) 的分組數(shù)據(jù) 的處理 很少使用 浮點(diǎn)操作 , 且 浮點(diǎn)操作 指令 的實(shí)現(xiàn)較為 復(fù)雜 , 所以 微引擎 的指令集 設(shè)計(jì) 不包含 浮點(diǎn)的操作。 另一方面,網(wǎng)絡(luò) 協(xié)議處理中 存在著 大量的查找比較操作 , 它并 不是按字節(jié)或是字對(duì)齊 的方式而是按位進(jìn)行 處 理 , 因此微引擎 的指令集 設(shè)計(jì)必須 對(duì)位操作有很好的支持。 對(duì)于位操作的實(shí)現(xiàn), 與實(shí)現(xiàn)字或字節(jié) 操作一樣 , 首先要解決 位訪問的問題, 然后 才能 實(shí)行 位 操作 ,而如何找到 指令操作數(shù) 就涉及到 微引擎 指令集設(shè)計(jì)中的一個(gè) 關(guān)鍵點(diǎn) ——指令尋址方式 的設(shè)計(jì) 。 通用處理器 的指令 尋址的最小單位 一般都是 字節(jié) , 但可以 采用 掩碼結(jié)合邏輯與或的方式實(shí)現(xiàn) 位操作。該方式需要付出 較 大的代碼開銷 與 較高的 位操作延遲 的代價(jià), 盡管 這 可以被 通用處理場合 接受 , 但是已經(jīng)無法滿足網(wǎng)絡(luò)處理場合 的性能要求 。因此 微引擎 指令集中的尋址方式 必須包括 位尋址的機(jī)制。 專用指令集 定制合適的 專用 指令集是滿足新的應(yīng)用和簡潔的微引擎結(jié)構(gòu)實(shí)現(xiàn)的關(guān)鍵。P1600 網(wǎng)絡(luò)處理器 轉(zhuǎn)發(fā)微引擎 采用 73 位專用指令集 設(shè)計(jì) , 并根據(jù)轉(zhuǎn)發(fā)微引擎的功能要求做出了相應(yīng)的優(yōu)化設(shè)計(jì)。總共 35 條指令 每條指令均在一個(gè)時(shí)鐘周期內(nèi)完成, 分為以下幾類:移動(dòng)指令、分支跳轉(zhuǎn)指令、 ALU 指令、特殊指令, 指令集的具體描述見表 。 表 微引擎指令集列表 指令 指令描述 移動(dòng)指令 Mov 按字節(jié)將立即數(shù)或寄存器數(shù)據(jù)移到目的寄存器 MovBits 按位將立即數(shù)或寄存器數(shù)據(jù)移到目的寄存器 Mov4Bits 移動(dòng)任意四位數(shù)據(jù)到目的寄存器 MovMul 根據(jù)優(yōu)先級(jí)編碼寄存器的值, 移動(dòng)八個(gè) 源寄存器 中的一個(gè)到目的寄存器 Get 按字節(jié)把存儲(chǔ)器數(shù)據(jù)移到目的寄存器 電子科學(xué)研究院碩士學(xué)位論文 16 指令 指令描述 PutKey 按字節(jié)把立即數(shù)或寄存器數(shù)據(jù)移到目的存儲(chǔ)器 Copy 按字節(jié)把存儲(chǔ)器數(shù)據(jù)移到目的存儲(chǔ)器 PutHdr 按字節(jié)把立即數(shù)或寄存器數(shù)據(jù)移到 Header 寄存器 PutHdrBits 按位把立即數(shù)或寄存器數(shù)據(jù)移到 Header 寄存器 PutHdr4Bits 移動(dòng)任意四位數(shù)據(jù)到 Header 寄存器 GetRndBits 移動(dòng)任意八位 Result Control 寄存器數(shù)據(jù)到目的寄存器 GetFixBits 移動(dòng)有限制的八位 Result Control 寄存器數(shù)據(jù)到目的寄存器 GetRnd4Bits 移動(dòng)任意四位 Result Control 寄存器數(shù)據(jù)到目的寄存器 分支跳轉(zhuǎn)指令 Jmp 無條件跳轉(zhuǎn) Jstack 間接跳轉(zhuǎn),地址來自 PC_STACK 寄存器 Return 間接跳轉(zhuǎn),地址來自 PC_STACK 寄存器,類同 Jstack Jmul 根據(jù)優(yōu)先級(jí)編碼寄存器的值,地址八選一進(jìn)行跳轉(zhuǎn) Loop 跳轉(zhuǎn)然后 Loop Counter 寄存器遞減 Call 跳轉(zhuǎn)并保存當(dāng)前 PC 值到 PC_STACK 寄存器 Callstack Jstack 并保存當(dāng)前 PC 值到 PC_STACK 寄存器 ALU 指令 And 邏輯與 Xor 邏輯異或 Or 邏輯或 Not 取反 Add 不帶進(jìn)位加法操作 Sub 不帶進(jìn)位減法操作 Addc DST=SRC1+SRC2+Carry Subb DST=SRC1SRC2Carry Decode 將源操作數(shù)對(duì)應(yīng)位置 1 后賦給 DST Encode 取源操作數(shù)最高位數(shù)值 NumOnes 計(jì)算源操作數(shù)中 1 的個(gè)數(shù) 特殊指令 Minterm 預(yù)定義 12 種運(yùn)算,根據(jù)參數(shù)選擇 SetMaxMin 從輸入的序列中選出最大值或最小值及該最值的序列號(hào) Halt 掛起,四種模式分別用于單播、多播、丟棄幀、調(diào)試 Nop 空指令 轉(zhuǎn)發(fā)微引擎的設(shè)計(jì)與實(shí)現(xiàn) 17 微引擎 指令的最高位( 72 位)是偶校驗(yàn)位 ( Even) , 當(dāng)需要復(fù)雜操作時(shí),可以直接由編譯器解析指令完成。 緊接著是六位表示的操作碼( Opcode),指令的最低位一般是表示 IF 條件。 不同指令還包含一些需要配置的模式( Mode),比如比較最大值或者最小值以及選擇不同的 Minterm 運(yùn)算等等。 指令一般包含一個(gè)源 操作數(shù)( Src)和一個(gè)目的操作數(shù)( Dst), 但設(shè)計(jì)了 多條 專用 指令包含多個(gè)源操作數(shù)。指令格式按操作數(shù)劃分可以歸結(jié)為以下幾類。 1) 無源操作數(shù):都是分支跳轉(zhuǎn)指令,只有跳轉(zhuǎn)的 label 地址。 O p c o d e 0E v e n7 17 2 6 6 6 5 5 8J u m p L a b e l M o d e 05 7 4 3 3 7 7I f6 04 4 2) 一個(gè)源操作數(shù): 主要是移動(dòng)指令 。
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1