freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于rhino的有限元網(wǎng)格離散技術(shù)研究_畢業(yè)論文-資料下載頁

2025-08-18 15:07本頁面

【導(dǎo)讀】據(jù),再轉(zhuǎn)換成有限元計算所需數(shù)據(jù),并進行有限元計算。對有限元法基本原理的學(xué)習(xí),其中重點偏向三維有限元分析。在Fortran語言環(huán)境下將提取網(wǎng)格數(shù)據(jù)轉(zhuǎn)換成有限元計算。據(jù)對矩形腔體模型進行相關(guān)的有限元計算。

  

【正文】 這些都是今后可研究的方向。 基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 42 參考文獻 [1] Jin J M. The Finite Element Method in Electromagics [M]. WileyIEEE Press, 1993. [2] Liu J, Chen B,Chen Y. Boundary recovery after 3D Delaunay tetrahedralization without adding extra nodes[J]. International Journal for Numerical Methods in Engineering,2020,72(6):744756. [3] 關(guān)振群 ,宋超 ,顧元憲 ,隋曉峰 .有限元網(wǎng)格生成方法研究的新進展 [J].計算機輔助設(shè)計與圖形學(xué)學(xué)報 ,2020,15(1):114. [4] 關(guān)振群 ,劉邦志 ,顧元憲等 .薄元分解與 Laplacian光順相結(jié)合的四面體有限元網(wǎng)格優(yōu)化方法 [J].計算力學(xué)學(xué)報 ,2020,24(3):257263. [5] 劉巖 ,關(guān)振群 ,張洪武 .任意多面體邊界一致四面體網(wǎng)格生成方法 [J].計算力學(xué)學(xué)報 ,2020,29(2):200204. [6] 鄭奎松 ,葛德彪 ,魏兵 .導(dǎo)彈目標的 FDTD 建模與 RCS 計算 [J].系統(tǒng)工程與電子技術(shù) ,2020,26(7):896899. [7] 張培培 ,陶華 ,顧小鋒 .CAD/CAE 集成中參數(shù)化有限元建模的研究 [J].現(xiàn)代制造工程 ,2020,(9). [8] 熊勝華 ,謝正堅 ,何濤 .計算機輔助結(jié)構(gòu)設(shè)計與分析的集成框架研究 [J].圖學(xué)學(xué)報 ,2020,33(4):129135. [9] 彭國倫 ,Fortran95 程序設(shè)計 [M].中國電力出版社 ,2020. [10] 朱江 ,費逸偉 ,郭常穎 ,黃焱飛 ,Rhino 操作平臺研究進展綜述 [J].技術(shù)與市場 ,2020,(11). [11] 古成中 ,吳新躍 .有限元網(wǎng)格劃分發(fā)展趨勢 .Journal of Frontiers of Computer Science and Technology,16739418/2020/02(03)0248 12. [12] 李海峰 ,吳冀川 ,劉建波 ,梁宇兵 .有限元網(wǎng)格剖分與網(wǎng)格質(zhì)量判定指標 .中國機械工程報 ,2020,23( 4) . [13] 張晉紅 ,吳風(fēng)林 .有限元法及其應(yīng)用現(xiàn)狀 .太原理工大學(xué) ,機械工程學(xué)院 . [14] 江磊 .工程二維有限元網(wǎng)格生成系統(tǒng)研究 .煤炭技術(shù) ,2020,30(5). 基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 43 [15] 尹勤 ,魏群 .Rhino 中 NURBS 曲線質(zhì)量控制技術(shù)的研究 .Computer Knowledge and Technology,2020,8(23). [16] 黃志超 ,包忠詡 ,周天瑞 .有限元網(wǎng)格劃分技術(shù)研究 [J].南昌大學(xué)學(xué)報 ,2020,23(4):2532. [17] 李俊 ,游理華 .有限元網(wǎng)格自動生成算法的研究進展 [J].機械研究與應(yīng)用 ,1998,11(4):2527. [18] 李衛(wèi)民 . 有 限 元 網(wǎng) 格 生 成 算 法 的 評 述 [J]. 泰 州 職 業(yè) 技 術(shù) 學(xué) 院 學(xué)報 ,2020,4(1):1214. [19] 胡恩球 ,張新訪 ,向文 .有限元網(wǎng)格生成方法發(fā)展綜述 [J].計算機輔助設(shè)計與圖形學(xué)學(xué)報 ,1997,9(4):378383. [20] 單菊林 .自適應(yīng)有限元網(wǎng)格生成算法研究與應(yīng)用 [D].大連理工大學(xué) ,2020. [21] 于開平 ,周傳月 ,譚惠豐 .HyperMesh 從入門到精通 [M].北京科學(xué)出版社 ,2020. [22] 羅特軍 ,羅季軍 ,汪榴 .有限元網(wǎng)格優(yōu)化方法[J] .四川聯(lián)合大學(xué)學(xué)報 ,1999,3(3)6:572. 基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 44 譯 文 一種基于 GPU的內(nèi)存高效快速的稀疏矩陣向量乘 A. Dziekonski, A. Lamecki, and M. Mrozowski WiComm 卓越中心,電子系 電信和信息( ETI) 格但斯克大學(xué)學(xué)報( GUT),波蘭格但斯克 80233 摘要 —— 本文提出了一種新的稀疏矩陣的存 儲格式,這使得一個稀疏矩陣矢量乘在費米圖形處理單元( GPU)有效地執(zhí)行。不同于以往的格式,它具有低內(nèi)存占用和良好的吞吐量,我們稱這種新的格式為 Sliced ELLRT。該格式適用于計算電磁學(xué)中產(chǎn)生的大型稀疏、復(fù)值線性系統(tǒng)的加速迭代求解。數(shù)值試驗表明,該執(zhí)行性能達到 69 GFLOPS(復(fù)單精度運算)。相比于優(yōu)化的六核中央處理單元( CPU)(英特爾處理 5680),這樣的表現(xiàn)意味著一個 6 倍的加速。在速度方面的新格式以最快的速度成為迄今公布的最佳格式,同時它不引入多余的零元素,這種元素必須存儲以確??焖賰?nèi)存訪問。 相比此前公布的解決方案,大問題可以使用成本更低、具有有限數(shù)量板上存儲器的 GPU 進行處理。 一、緒論 解決電磁問題包括密集和耗時的計算。 為了減少處理時間,計算電磁學(xué)團體一直在探索使用 GPU(圖形處理器)為加快各種數(shù)值方法的可能性,包括時域有限差分( FDTD)方法 [1 {4],交替方向隱式( ADI)方法[5],傳輸線模型( TLM)方法 [6, 7],也為應(yīng)用在如雷達散射截面預(yù)測基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 45 ( RCS) [810]。 相對很少有人注意迄一直以來已有的有限元法( FEM)。這種方法,通常用于分析的復(fù)雜諧振器或的波導(dǎo)或解決電磁輻射和散射問題 [11{16],產(chǎn)生一個很大的稀疏的方程系統(tǒng)。由此產(chǎn)生的特征值或驅(qū)動的問題,然后經(jīng)常使用的克雷洛夫空間迭代技術(shù)來解決 [17{19]。這種技術(shù)涉及到很多稀疏矩陣倍向量積( SPMV)的計算 [20]。一些研究小組已經(jīng)證明, SPMV 操作可以更快的執(zhí)行在 GPU 上比在多核中央處理器( CPUs)上 [2124]。 SPMV作用于 GPU 上的速度是非常重要的,因為該操作施加一個顯著的影響在克雷洛夫空間解算器的整體解決方案的時間尤其是當(dāng)多項式 [17]或多級預(yù)條件的雅各比平滑 [25]被使用。影響的矩陣矢量乘積的效率,其原因之一 就是這種被存儲在 GPU 的存儲器的系數(shù)矩陣 [21]。對于不規(guī)則的非零項模式的矩陣在 GPU 上的最好的結(jié)果,得到存儲方案的使用變體稱為 Ellpack[21]。 Ellpack 格式可以被修改,以最好地利用特別的 GPU 結(jié)構(gòu)的計算功能 [22 24]。 可惜, Ellpack 的格式具有一個嚴重的缺點,即,它存儲一個矩陣一行接一行,每行包含相同數(shù)目的元素。如果某行包含較少的非零元素,它是用零填充。對于矩陣,其中每行的非零的數(shù)目變化顯著,這意味著存儲了大量的冗余元件。在計算涉及只有非常有限的快速內(nèi)存(一般可達 GB)的商 品 GPU(圖形處理器)時,這將成為一個問題。 問題是找到一個高效的內(nèi)存矩陣的存儲格式,它也適用于在 GPU 上快速執(zhí)行稀疏矩陣的向量積,甚至更為明顯在計算電磁學(xué)方面,人們常常處理復(fù)雜的矩陣時。 在本文中,我們提出了一種新的高效,快速的內(nèi)存存儲格式,非常適合用于實現(xiàn)稀疏矩陣的時間向量乘法用于由英偉達設(shè)計的 CUDA(統(tǒng)一計算設(shè)備架構(gòu))。我們還通過使用可配置的緩存和并發(fā)內(nèi)核執(zhí)行顯示如何調(diào)整 SPMV 操作最新的英偉達的費米系列 GPU。我們證明了追求效率的新的格式和 SPMV 操作在來自電介質(zhì)天線問題有限元離散化的一些復(fù)雜的價基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 46 值 稀疏矩陣。新方法不僅顯著降低多余的零填充,但它也允許一個實現(xiàn)SPMV 的性能,這等同于至今最好的結(jié)果報告。 二、 GPUS 程序設(shè)計 我們將簡要回顧一下幾個概念是必要的理解追求效率的 GPU 計算[26, 27]。 GPU(圖形處理器)有很多處理器稱為內(nèi)核對不同的數(shù)據(jù)并行執(zhí)行的相同的代碼。在 CUDA 架構(gòu) [28], GPU 的處理器被收集到多處理器。在一個 CPU 里被稱為內(nèi)核的。在內(nèi)核一個線程是并行化的最小單元。線程將被收集到線程塊,共享內(nèi)存在一臺單一的多重處理器。線程塊將被收集到線性塊的網(wǎng)格,在邏輯上是并行執(zhí)行的一個內(nèi)核執(zhí) 行期間。線程可以訪問 GPU 內(nèi)存幾種:全球記憶體(大,讀寫延遲),共享內(nèi)存(片上,低延時,限每塊 16 KB),紋理內(nèi)存(低延遲,只讀),和寄存器(低延遲)。為了獲得高效率的代碼執(zhí)行,重要的是要注意以下規(guī)則: ◎保證聯(lián)合訪問全局內(nèi)存 ◎如果聯(lián)合訪問全局存儲器是不可能的 使用紋理內(nèi)存代替 ◎盡可能地使用共享內(nèi)存 ◎用共享內(nèi)存訪問取代全局存儲器訪問(如果可能) ◎ GPU 和 CPU 之間的傳輸降到最低 費米,這是最新一代的 CUDA 架構(gòu)的代碼名稱 [29],增加了新的功能,可以利用以提高性能。特別是,費米架構(gòu): ◎支持可 配置的緩存,可分配的共享內(nèi)存和 16 KB, 48 KB 的 L1 額外的緩存或 48 KB 的可分配的共享內(nèi)存和 16 kB 的 L1 額外的緩存 ◎允許并行執(zhí)行的并行執(zhí)行內(nèi)核(最多 16 個不同的 GPU 功能) ◎執(zhí)行雙精度計算顯著快于前代 GPU 基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 47 三、 壓縮存儲使 SPMV 更高效 如引言中所解釋的矩陣存儲的格式,同時影 SPMV 操作的性能和使用的內(nèi)存量。影響速度的第二個因素是明智地使用各種功能的 CUDA 架構(gòu)。 在本節(jié)中,我們將討論的幾個矩陣存儲格式,可用于在 SPMV 產(chǎn)品的功能和 GPU 計算的背景下展示自己的優(yōu)點和缺點。 壓縮行存 儲 在一個 CRS(壓縮行存儲)格式,一個稀疏矩陣被壓縮成三個矢量:一個非零項的向量,一個非零項的向量的列指數(shù),在一行中的第一非零項的矢量列索引 [17]。 這種格式采用的是英特爾 MKL(數(shù)學(xué)核心函數(shù)庫),它對于稀疏矩陣矢量運算在多核心的 CPU 上實施是有效的。盡管 GPU 實現(xiàn) SPMV 基于CRS[21, 30]比 MKL 有著更好的表現(xiàn),由于缺乏聯(lián)合訪問全局存儲器,它們顯示更壞的吞吐量比基于狀 Ellpacklike 格式的 SPMV。然而,從存儲器的角度來看,這種格式是非常有效的,因為沒有需要零填充。對于雙精度和復(fù)雜的值的 矩陣所需的存儲在 CRS 格式的字節(jié)的數(shù)目是: )4)(82( BytesNNNZBytesNNZCR S ?????? ( 1) 其中: NNZ 為非零項向量的長度, N 為數(shù)行。 ELLR 為了確保聯(lián)合訪問內(nèi)存,同時執(zhí)行 SPMV 在一個 GPU Ellpack( ELL)格式 [21]中提出的。在的 ELL 格式,壓縮的矩陣的每一行存儲兩個向量中的非零項的矢量和矢量的非零項的列指數(shù)(包括一些額外的零)。此格式允許在 GPU 上實現(xiàn)更好的性能相對于在 CPU 上,但是在內(nèi)存方面引 入了顯著的冗余,用行零填充的方法來獲得長度最長的非零項行( Nmax)。以 ELLR 格式為基礎(chǔ)的 SPMV 產(chǎn)品以一列線程的工作方式在 GPU 上實現(xiàn)。然而,可以進一步改善 SPMV 的性能通過增加一個額外的矢量提供了有關(guān)基于 Rhino 的有限元網(wǎng)格離散技術(shù)研究 上海工程技術(shù)大學(xué)畢業(yè)設(shè)計論文 48 下列內(nèi)容的信息的數(shù)量在每行中的非零點。此修改的格式被稱為 ELLR和增強的性能,因為只有非零在計算中被涉及的 22]。為了更好地執(zhí)行在一個 GPU 上行數(shù)是程序塊尺寸的除數(shù),否則就沒有全局存儲器的聯(lián)合訪問。要滿足這樣的條件只有用零元素添加一些額外的行( 0N)。從以上的描述得知 ELLR 格式?jīng)]有 CRS 有效是顯而易見的從存儲器的角度來看。在 ELLR 格式里,對于雙精度和復(fù)雜的值的矩陣所需存儲字節(jié)的數(shù)量是: )4)()(2( 0m a x0m a x B ytesNNNB ytesNNRE L L ????????? ( 2) 其中: maxN—— 數(shù)最長行中的非零項。 Sliced ELLPACK 在 ELL 格式中為了消除固有的冗余, Monakovetal [23]提出限制矩陣在壓縮之前。在這種被稱為 Slicde ELL 的格式中,有一個特定的預(yù)處理應(yīng)用,也就是一個稀疏矩陣首先被劃分成由子矩陣(切片)組成的 S 相鄰行( S=1, ..., N),然后切片存儲在 ELL 格式。其結(jié)果是,額外零的數(shù)量被確定通過切片的行之間最短和最長的距離,而不是由整個矩陣的距離來確定。 ELLRT 在 SPMV操作在 GPU上的浮點運算方面表現(xiàn)出最佳性能是至今以被報道的一種存儲格式先前被提到在 [24]。格式被稱為 ELLRT,它是一個擴張的 ELLR, ELLR 需要施加預(yù)處理 [24]。在這種預(yù)處理非零元素和它們的列索引被置換和零填充時,每行是 16 的倍數(shù)。由于此修改,使聚結(jié)和對齊訪問全局內(nèi)存發(fā)生。相比于 ELLR
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1