正文內容

32位不恢復替代算法除法器畢業(yè)論文(編輯修改稿)

2025-07-25 07:49 本頁面

　

【文章內容簡介】。wj，l與d′的實際值所在的“不確定區(qū)域”不能同時越過重疊區(qū)域的上、下邊界。圖中的每個“網格”代表存儲陣列中的一個單元，對應的地址信號是網格左下角的頂點坐標，如下圖所示：(第一象限) 4wj與d′實際值的“不確定區(qū)域”如圖所示，當4wj與d′的高位近似值為圖中某一點時，其實際值可能位于這一點右上方“不確定區(qū)域”內的任何位置。因為4wj以進位保留形式表示而d′以標準形式表示，所以不確定區(qū)域沿縱軸方向占據(jù)兩個最小單位。通過觀察不難發(fā)現(xiàn)，為了滿足前面所述的規(guī)則，即:分界線應該位于重疊區(qū)域之內并且“不確定區(qū)域”不能同時越過重疊區(qū)域的上、下邊界，網格需要有一定的密度，這個密度是由對4wj與d′的近似程度，也就是由取它們的高幾位作近似來決定的。以往的研究結果顯示，對于商取值為最小冗余度的情況，4wj應該至少取高7位，而d′應該至少取高5位[4]。也就是說，存儲陣列中一共包含2725個存儲單元。由以上分析可知，對于基數(shù)4SRT算法的直接實現(xiàn)來說，每次循環(huán)只需進行一次進位保留加法，就可以得到一位四進制商值。但是它的商選擇邏輯比較復雜。2725的存儲陣列會占用比較大的面積，另外，存儲陣列的地址解碼邏輯也會造成較長的時延。本節(jié)內容介紹的是基數(shù)4SRT算法的直接實現(xiàn)，其特點是以地址信號輸入一個完整的存儲陣列從而直接得到商值。以往的研究資料中也提出過一些類似的實現(xiàn)方法[4] [5]。除了直接實現(xiàn)之外，還有其他一些途徑可以實現(xiàn)基數(shù)4SRT算法。本文所列的參考資料[6] …[11]介紹了不同的實現(xiàn)方式，其中應用到的技術包括操作數(shù)移位、商值預測、查找表拆分、基數(shù)拆分等。 NewtonRaphson 除法算法NewtonRaphson 除法算法（以下簡稱為牛頓迭代算法）的基本思想是用乘法代替除法運算，例如，a/b=a*(1/b)。現(xiàn)在代問題是不用除法，如何計算出1/b，這也是牛頓迭代算法代核心所在。假設我們有函數(shù)f(x),如何找出X，使得f（X）=0。，我們猜測x0，由f(x)在該點處的切線方程y f(x0)=f′ (x0)（x x0）,找出使y=0的新的一點x1，則x1更加接近X。一般地，y f(xi)=f′ (xi)（x xi）令y=0，我們有新的一點xi=1xi+1=xif(xi)/f′（xi） NewtonRaphson 除法算法重復上述過程，一直到xn足夠精確為止。令f（x）=1/xb,則在x=1/b處f（x）=0。應用牛頓迭代公式：x i+1= x i （1/ x ib）/(1/x i2)= x i+ x i x i2b= x i (2 x i b)。這樣，我們能夠用下述步驟實現(xiàn)a/b：（1）把b移位，使其滿足1≤b＜2，即，b=…。使用b高若干位查表，得到1/b的近似值x0 。（2）迭代xi+1= x i（2 x i b），直到xn足夠精確為止。（3）計算axn，把結果反向移位以消除第一步造成的影響。查表可通過ROM（只讀存儲器）來完成。事先把1/b的近似值存放在ROM中，用b的高若干位作為地址來訪問它。由于b的最高位總是1，地址可以不用它。問題是ROM中存放多少為才合適。這將影響到使用多少位地址來訪問它，以及需要多少次迭代才能使xn足夠精確?？梢詫懸粋€簡單的程序，求最少需要多少位地址才能區(qū)分出ROM中的p位精確位。從ROM中直接得到1/b所有的精確位是不實現(xiàn)的，它需要太大容量的ROM。設x i精確到p位，這意味著︱（x i1/b）（1/b）︱=2p。下面的推導過程說明︱（xi+11/b）（1/b）︱=22p，即，迭代一次，精度是原來的兩倍。︱（xi+11/b）（1/b）︱=︱（x i（2 x i b）1/b）/(1/b)︱=︱(2 x i/b x i2(1/b)2)/ (1/b)2︱=︱( x i1/b)2/ (1/b)2︱=2p牛頓迭代算法具有“自我修正”的能力，在運算過程中的舍入誤差是沒有關系的。下次的迭代總是有所改進的（精度大約是原來的兩倍）。在介紹基本除法器的后端實現(xiàn)(包括電路設計和物理設計)之前，本節(jié)先對后端設計所關涉到的一些設計方法進行介紹。這些設計方法是作者在自身實踐的基礎上結合一些理論知識加以總結得到的。在設計過程中注意運用這些方法可以達到事半功倍的效果。并行是電路結構設計的關鍵議題之一，在一周期內，如果使不同的硬件邏輯在同一時間段內并行處理，就可以提高系統(tǒng)的運行速度。所以，設計出高度并行的電路結構是達到高速度、低成本的設計目標的捷徑。但是，硬件邏輯的并行度并不是可以無限提高，因為并行度取決于內部數(shù)據(jù)之間的相關性。所以并行度實際上是由算法決定的，并行結構設計的目標也就是在面積等成本一定的條件下，盡量將算法中所包含的并行度加以利用。下面的例子說明了硬件邏輯的并行以及數(shù)據(jù)的相關等概念。對于一個簡單的算法:S=AB+CD+ E+ F+ G，如果要以加法單元和乘法單元作為基本部件來進行硬件實現(xiàn)，那么下面三種實現(xiàn)方法有明顯的區(qū)別: 。也就是說，它們的面積應該是近似相等的。但對系統(tǒng)的運行速度來說，第一種最慢，它的時延是+4(與分別是乘法單元與加法單元的時延)。第二種是+3。第三種最快，時延是+2。第三種實現(xiàn)之所以達到了最短的時延，在于它最大限度地利用了算法所包含的并行度。它的硬件邏輯中出現(xiàn)了如下幾個中間數(shù)據(jù):=AB， =CD，=E+F，，如下圖所示: 中間數(shù)據(jù)的相關性可以看出，、。是第一級邏輯的輸出，它們的輸入之間沒有交集，所以、是不相關的，以它們作為輸出的硬件邏輯之間可以并行。與之間也一樣。上面的例子說明了組合邏輯的結構優(yōu)化對于系統(tǒng)設計的重要性。這種分析與優(yōu)化的方法也適用于其它算法的系統(tǒng)設計，在后面除法器的實現(xiàn)過程中將會用到。硬件時序結構的優(yōu)化方法因為實用的除法算法都是以“循環(huán)迭代”的方式完成中間運算，所以除法器硬件整體上呈現(xiàn)循環(huán)結構。在介紹除法器的后端實現(xiàn)之前，專門討論一下對硬件循環(huán)結構在并行度方面進行優(yōu)化的方法是必要的。硬件循環(huán)結構中一定包含時序部件，例如寄存器等，用來對時序加以劃分。對于算法上連續(xù)的運算過程，具體實現(xiàn)時可以有不同的時序劃分方法，而不同的時序劃分方法往往導致不同的系統(tǒng)工作效率。下面的例子可以說明這一問題: 循環(huán)結構算法示意圖，最初的輸入為In1與In2，中間的處理過程是由兩個函數(shù)f1與f2構成的k輪循環(huán)，最終產生輸出Out1與Out2。如果直接以硬件實現(xiàn)上述算法，:、f2分別表示實現(xiàn)兩個函數(shù)的硬件模塊?？梢钥吹剑谝粋€循環(huán)周期內，f1和f2的處理過程是串行的，像算法中所表示的那樣。如果要對這種硬件實現(xiàn)在并行度上進行改進，可以先把算法在時序上展開，從全局角度重新考察：，虛線表示不同的時序劃分方法?？梢钥吹剑凑請D中第二種方式劃分時序，可以使f1與f2的處理過程并行，:，fl與f2的處理過程是并行的。如果f1與f2處理時間相仿，并且忽略寄存器和數(shù)據(jù)選擇邏輯所造成的延遲，理論上一周期內的運行速度能達到接近100%的提升，而在硬件面積上卻不會有顯著差別。上述算法結構是作者參與過的另外一個項目:DES加/解密模塊設計所采用的算法結構。DES算法是七十年代提出并成為標準的一種對稱加/解密算法，至今在數(shù)據(jù)加密領域仍被廣泛運用。，In2為密鑰。f2為密鑰處理函數(shù)，f1為主加密函數(shù)。密鑰經f2函數(shù)處理后再與明文做加密運算，構成算法中的一個循環(huán)體。原始的DES算法包含16輪循環(huán)。，循環(huán)次數(shù)越多，理論上性能提升的比例就越高。所以，對于硬件循環(huán)結構來說，有時分屬不同周期的邏輯之間存在并行度以時序展開的辦法對算法進行全局角度的考察有助于發(fā)現(xiàn)這種并行度。在一定條件下，可以通過改變系統(tǒng)結構，調整邏輯的時序劃分來達到并行的目的。作者把這種方法叫做“時序展開法”。在對包括除法算法在內的循環(huán)結構算法進行分析和結構優(yōu)化時，這種方法能起到一定作用。另外值得指出的是，本節(jié)中的小節(jié)敘述的組合邏輯優(yōu)化一般可以借助綜合工具完成，而本小節(jié)所述的時序分析與優(yōu)化還需要設計者來做，因為目前的綜合工具時序優(yōu)化功能上有所欠缺，一般不會改變由輸入代碼所描述的系統(tǒng)時序結構。對設計者來說，系統(tǒng)時序的優(yōu)化方法相對更加重要。由于本文所介紹的基本除法器在后端采用全定制設計，所以本小節(jié)討論針對全定制設計的版圖結構設計方法。與自動化設計流程相比，全定制設計能針對具體的邏輯結構對電路和版圖布局布線進行優(yōu)化，所以在系統(tǒng)的面積、運行速度上都具有優(yōu)勢，但劣勢也比較明顯，就是:設計周期長，需要投入較多人力，產品的可升級性與可維護性較差。究其原因，在于全定制設計的版圖結構十分復雜，手工繪制和修改版圖十分不易。如果繪制版圖時能夠采用系統(tǒng)的方法減低手工繪制的復雜度，就可以相對減小全定制設計的劣勢，也就可以使全定制設計方法在總體上更具備競爭力。注重全定制版圖的層次化和模塊化設計就是有效的方法之一。與系統(tǒng)設計一樣，全定制版圖設計也是按照由低層到高層的順序進行，由基本部件拼接成功能模塊，再拼接成全系統(tǒng)。每完成一級，都要做后端驗證DRC、LVS以保證正確性。但是，在拼接高層模塊的時候，由于布局或布線安排上的矛盾經常導致原來己通過驗證的低層模塊需要修改，從而破壞了它們的完整性，像下圖顯示的那樣:，在版圖模塊拼接成整個系統(tǒng)之前，每個模塊一定是已經通過后端驗證的，但由于拼接過程中修改了原有模塊，導致了雖然最后系統(tǒng)的版圖能通過后端驗證，但是將各個模塊重新提取出來后卻通不過驗證的結果。這種現(xiàn)象在全定制版圖設計中非常普遍。它不利于系統(tǒng)的升級維護，甚至對快速完成系統(tǒng)版圖本身也有影響。因為當高層模塊在后端驗證上遇到問題時，就無法通過重新驗證低層模塊來快速查找并排除這些問題。所以，在進行全定制版圖拼接時，應該注意版圖模塊的完整性與獨立性。版圖模塊的完整性與獨立性是相對于后端驗證而言的。如果一個版圖模塊從系統(tǒng)版圖中分離出來后，自身仍能通過后端驗證DRC、LVS，那么它就是完整的，如下圖所示:當碰到系統(tǒng)需要升級或其它情況，系統(tǒng)中的一個模塊需要做修改時，如果只需要修改相應的版圖模塊(而不需要改動系統(tǒng)版圖的其它部分)，將修改后的模塊替換到原版圖中就能得到符合要求的新的系統(tǒng)版圖，那么，相應的模塊就是獨立的，如下圖所示:顯而易見，這種方法能極大地提高全定制版圖設計的效率。雖然在設計過程中保持低層版圖模塊的完整與獨立需要花費一定時間，但是與解決高層模塊和全系統(tǒng)驗證遇到的問題所花費的時間相比，這些無疑是值得的。全定制版圖的層次結構完全是由設計者決定的，對于一個復雜的系統(tǒng)來說，其版圖設計可能具有多達十幾級結構，要保持每一級模塊的完整與獨立并不現(xiàn)實，一般只要使整個系統(tǒng)下面的一級或者兩級保持就可以了。按照下面所介紹的兩種方法進行設計可以保持版圖模塊的完整性與獨立性。比較簡單而省時的一種方法是使用專門的連接模塊，當需要對低層版圖模塊進行拼接時，先將它們擺放到一起，然后其內部就不再改動，它們之間的連接(一般是通過金屬層)全部在新建的連接模塊內進行，如下圖所示:當然，連接模塊內還可以有子模塊，:連接模塊內有三個子模塊，分別用來連接1與2，1與3，2與4。由于原有的低層版圖模塊不被改動，所以它們自然是完整的。但是當其中某個模塊需要修改時，與它相關的連接模塊也需要修改，這種方法可以看作是部分保持了模塊的獨立性。另一種方法是在原有模塊內部進行連接。當模塊1需要與模塊2連接時，在相關的各個模塊內分別添加相應的連接金屬，使它們在模塊邊界上對準。這樣，模塊就在邊界上形成接口。只要保持這些接口的形態(tài)不變，就可以方便地對模塊進行替換。這種方法稍微費時一些，因為做連接時需要改動相關的多個模塊，但它所形成的版圖結構比較好地保證了模塊的完整性與獨立性，非常有利于大規(guī)模系統(tǒng)版圖的設計與升級維護。3. 32位不恢復替代算法除法器設計 Verilog HDLVerilog HDL 是一種硬件描述語言，用于從算法級、門級到開關級到多種抽象設計層次到數(shù)字系統(tǒng)建模。被建模的數(shù)字系統(tǒng)對象的復雜性可以介于簡單的門和完整的電子數(shù)字系統(tǒng)之間。數(shù)字系統(tǒng)能夠按層次描述，并可在相同描述中顯式地進行時序建模。Verilog HDL 語言具有下述描述能力：設計地行為特征、設計地數(shù)據(jù)流特性、設計的結構組成以及包含響應監(jiān)控和設計驗證方面的時延和波形產生的機制。所以這些都使用同一種建模語言。此外，Verilog HDL語言提供流編程語言接口，通過該接口可以在模擬、驗證期間從設計外部訪問設計，包括模擬的具體控制和運行。Verilog HDL 語言不僅定義流語法，而且對每個語法結構都定義了清晰的模擬、仿真語義。因此，用這種語言編寫的模型能夠使用Verilog 仿真器進行驗證。語言從C編程語言中繼承了多種操作符和結構。Verilog HDL提供了擴展的建模能力，其中許多擴展最初很難理解。但是，Verilog HDL語言的核心子集非常易于學習和使用，這對大多數(shù)建模應用來說已經足夠。當然，完整的硬件描述語言是以對從最復雜的芯片到完整的電子系統(tǒng)進行描述。由于Verilog HDL的標準化，可以很容易地把完成的設計移植到不同廠家的不同芯片上去，并在不同規(guī)模應用時可以較容易地修改。采用Verilog HDL最大的優(yōu)點是與工藝的無關性。這使得工程師在功能設計、邏輯驗證階段，可以不必過多的考慮門級及工藝實現(xiàn)的具體細節(jié)，只需要利用系統(tǒng)設計時對芯片的要求，施加不同的約束條件，即可設計出實際電路[12]。本文通過使用Modelsim SE 。Mentor公司的ModelSim是業(yè)界最優(yōu)秀的HDL語言仿真軟件，它能提供友好的仿真環(huán)境，是業(yè)界唯一的單內核支持VHDL和Verilog混合仿真的仿真器。它采用直接優(yōu)化的編譯技術、Tcl/Tk技術、和單一內核仿真技術，編譯仿真速度快，編譯的代碼與平臺無關，便于保護IP核，個性化的圖形界面和用戶接口，為用戶加快調節(jié)提供強有力的手段，是FPGA/ASIC設計的首選仿真軟件。主要特點：RTL和門級優(yōu)化，本地編譯結構，編譯

點擊復制文檔內容

環(huán)評公示相關推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

32位不恢復替代算法除法器畢業(yè)論文(編輯修改稿)

畢業(yè)論文圖像分割算法研究與實現(xiàn)-資料下載頁

基于fpga的fft算法實現(xiàn)畢業(yè)論文-資料下載頁

畢業(yè)論文cma盲均衡算法仿真研究-資料下載頁

基于特征的圖像匹配算法畢業(yè)論文-資料下載頁

基于fpga的fft算法實現(xiàn)畢業(yè)論文-資料下載頁

畢業(yè)論文圖像分割算法研究與實現(xiàn)-資料下載頁

aes算法研究及應用畢業(yè)論文-資料下載頁

關于java系統(tǒng)需求算法畢業(yè)論文設計-資料下載頁

畢業(yè)論文基于music算法的doa估計-資料下載頁

伺服控制系統(tǒng)辨識算法畢業(yè)論文-資料下載頁

指紋識別算法實現(xiàn)設計畢業(yè)論文-資料下載頁

用于文檔加密算法研究畢業(yè)論文-資料下載頁

改進的pso算法的實現(xiàn)畢業(yè)論文-資料下載頁

超聲圖像紋理分析算法研究畢業(yè)論文-資料下載頁

排列組合及相關算法畢業(yè)論文-資料下載頁

32位不恢復替代算法除法器畢業(yè)論文-資料下載頁

32位不恢復替代算法除法器畢業(yè)論文(參考版)

32位不恢復替代算法除法器畢業(yè)論文-文庫吧資料

32位不恢復替代算法除法器畢業(yè)論文-展示頁

32位不恢復替代算法除法器畢業(yè)論文-在線瀏覽