freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

并行軟件庫(kù)介紹ppt課件-免費(fèi)閱讀

  

【正文】 28 /*退出 PETSc運(yùn)行環(huán)境 */ ierr = PetscFinalize()。 ierr = VecDestroy(u)。CHKERRQ(ierr)。 CHKERRQ(ierr)。sles)。 } 27 ierr = MatMult(A,u,b)。 CHKERRQ(ierr)。 ierr =VecDuplicate(b,amp。 CHKERRQ(ierr)。v,INSERT_VALUES)。I,1,amp。} if (j0) {J = I 1。v,INSERT_VALUES)。 IIend。 CHKERRQ(ierr)。 ierr =PetscOptionsGetInt(PETSC_NULL,m,amp。 /* 隨機(jī)數(shù)發(fā)生器環(huán)境 */ PetscReal norm。對(duì)于 SNES 和 TS求解器,用戶通常還需提供計(jì)算函數(shù)及其雅可比矩陣的子程序。 TS積分器最終依賴線性解法器 SLES和非線性解法器 SNES來(lái)實(shí)現(xiàn)。 SLES求解線性方程組 Ax = b 其中解算子 A是 n*n 維非奇異矩陣, b是 n維右端向量, x為 n維解向量。 PETSc 還提供了兩個(gè)對(duì)象 DA和 IS,來(lái)分別管理向量在規(guī)則正交網(wǎng)格和無(wú)結(jié)構(gòu)網(wǎng)格上各進(jìn)程之間的分發(fā)、聚集和邊界點(diǎn)的數(shù)據(jù)通信等操作。 51 測(cè)試結(jié)果 測(cè)試數(shù)據(jù): 在深騰 7000上對(duì)上述數(shù)據(jù)在 1024核上所測(cè)試的結(jié)果: Graph scheme 32核 128核 256核 512核 1024核 Auto Auto Auto WF LMSR URA mdual2 mdual2 mdual2 WF LMSR URA mrng3 mrng3 mrng3 WF LMSR URA 52 PETSC: 并行可擴(kuò)展科學(xué)計(jì)算工具箱 Argonne 國(guó)家實(shí)驗(yàn)室 53 PETSC PETSC:并行可擴(kuò)展科學(xué)計(jì)算工具箱( Parallel Extensible Toolkits for Scientific Computing) ? 國(guó)能源部 ODE2022 支持開(kāi)發(fā)的 20 多個(gè) ACTS 工具箱之一,由Argonne 國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)的可移植可擴(kuò)展科學(xué)計(jì)算工具箱,主要用于在分布式存儲(chǔ)環(huán)境高效求解偏微分方程組及相關(guān)問(wèn)題。它能有效地隨機(jī)分布圖的填充 約化次序。 ? 同 ParMETIS_V3_AdaptiveRepart一樣 , ParMETIS_V3_RefineKway執(zhí)行局部粗化。然而,它提供了例程 ParMETIS_V3_Mesh2Dual,用來(lái)快速、并行地為一個(gè)給定的網(wǎng)格構(gòu)造一個(gè)偶圖( dual graph)。它包括三個(gè)階段: 圖的粗化、初步劃分、加密。 ? ParMETIS中實(shí)現(xiàn)的算法基于并行多層 k路圖劃分算法、自適應(yīng)再劃分算法及并行多約束算法。 并且平均每天被下載一次。 右端項(xiàng) : F= 2π2 sin(πx)sin(πy) 。 0 I] [ui 。 HYPRE_StructMatrixDestroy(A)。 HYPRE_StructPFMGSetMaxIter(solver, 50)。 ... HYPRE_StructVectorAssemble(b)。A)。 用戶可以根據(jù)情況選擇不同的并行粗化技巧 (比 如 CLJP粗化 、 經(jīng)典 RS粗化 ) 和松弛策略 (比如 GaussSeidel松弛 、 Jacobi或加權(quán) Jacobi松弛 ) . 26 Hypre 使用方法 下面的例子是采用 并行半粗化 多 重網(wǎng)格迭代法求解結(jié)構(gòu)網(wǎng)格界面下的線性系統(tǒng) /* Set up the grid and stencil */ HYPRE_StructGridCreate(MPI_COMM_WORLD, dim, amp。應(yīng)用于稀疏線性方程組 , 為網(wǎng)格界面的補(bǔ)充 21 迭代法與預(yù)條件子 ? 迭代方法 Krylov解法器( CG, GMRES(缺省情形 ), TFQMR, BiCGSTAB); BoomerAMG(一個(gè)并行代數(shù)多重網(wǎng)格解法器); 具有迭代加細(xì) (refinement)的 SuperLU直接解法器(串行)。 2048個(gè)核上性能達(dá)到了較高的可擴(kuò)展性能 N u m o f C o r e s 5 1 2 1 0 2 4 2 0 4 8T i m e ( s e c ) 2 2 2 0 . 6 1 3 5 0 . 4 9 1 2 . 5T F L O P S 4 . 5 T 8 . 2 T 1 4 . 5 TRun n i n g tim e (s) Num of C or e s 3 0000* 3 0000 6 0000* 6 0000 128 8 5 6 5 9 8 5 256 6 7 8 3 8 3 2 .78 512 4 6 5 2 7 5 8 .77 1024 4 0 3 2 2 3 0 .48 17 Hypre軟件包 美國(guó)加州大學(xué)( UC) 勞倫斯 利弗莫爾國(guó)家實(shí)驗(yàn)室( LLNL) / 應(yīng)用科學(xué)計(jì)算中心( CASC) 18 軟件包概述 Hypre ( High Performance Preconditioners, 高性能預(yù)條件子) 源于美國(guó)能源部和 LLNL等在研究國(guó)防、環(huán)境、 能 源和生物科學(xué)中的物理現(xiàn)象時(shí),開(kāi)發(fā)的一些模擬代碼 。 15 使用 HPSEPS編程的方法 HPSEPS為求解不同模式的矩陣特征問(wèn)題提供了相應(yīng)的模板。 (6) pdist_A: 將矩陣按 2D塊方式分布到二維處理器網(wǎng)格中 ? 其它子程序 (1) p*gnrm: 廣義特征問(wèn)題特征向量余范數(shù)求解 (2) p*nrm: 標(biāo)準(zhǔn)特征問(wèn)題特征向量余范數(shù)求解 (3) *lag_app_eigen: Laguerre迭代求解函數(shù)近似值 (4) *sort: 數(shù)據(jù)排序子程序 (5) Mem_free: 釋放內(nèi)存空間 (6) Comm_free: 釋放通信器 12 稀疏對(duì)稱特征問(wèn)題 ? 在 HPSEPS中,提供了基于顯式重啟 再正交和deflate技術(shù)的 Lanczos算法的稀疏對(duì)稱矩陣特征問(wèn)題并行求解模塊。 9 軟件包功能模塊接口 下面給出了 HPSEPS提供的子程序的簡(jiǎn)要說(shuō)明,其中在子程序名中出現(xiàn)的符號(hào) *代表 z(復(fù)雙精度 )、 c(復(fù)單精度)、 d(雙精度)或 s(單精度)。 ? 應(yīng)用范圍廣 ? 是國(guó)外許多超級(jí)計(jì)算機(jī)極力求解的計(jì)算問(wèn)題之一。 ? 是目前國(guó)際上唯一提供了稠密和稀疏特征問(wèn)題等多個(gè)并行求解器 的并行軟件包 : ? 稠密問(wèn)題并行求解器優(yōu)于國(guó)際通用軟件包 ScaLAPACK,并被鑒定專家評(píng)為國(guó)際領(lǐng)先水平(十五信息化建設(shè)專項(xiàng)鑒定專家); ? 稀疏問(wèn)題并行求解器在可擴(kuò)展性優(yōu)于國(guó)際通用軟件包PARPACK; ? 形成了在千核以上對(duì)大規(guī)模問(wèn)題的可擴(kuò)展并行計(jì)算; ? 已用于多個(gè)具體應(yīng)用問(wèn)題的并行求解 ? 用戶應(yīng)用程序可以直接調(diào)用所需的并行求解器 ? 可將軟件包的并行模塊作為黑匣子嵌入應(yīng)用程序 5 應(yīng)用領(lǐng)域 大規(guī)模特征值問(wèn)題是許多科學(xué)和工程應(yīng)用:結(jié)構(gòu)動(dòng)力分析、量子化學(xué)、電子結(jié)構(gòu)和材料科學(xué)等計(jì)算核心,成為國(guó)外許多超級(jí)計(jì)算機(jī)極力求解的計(jì)算問(wèn)題之一。整個(gè)軟件包由多層結(jié)構(gòu)構(gòu)成,其層次結(jié)構(gòu)如下圖。下面列出了其中部分主要子程序。 (3) p*sletr: m步 Lanczos并行化處理和分解。 – 核查計(jì)算結(jié)果的精度。 20 網(wǎng)格接口 HYPRE為不同的應(yīng)用提供了不同的接口 , 該接口目前僅支持標(biāo)量偏微分方程。其中 SMG和 BoomerAMG是目前實(shí)際應(yīng)用中使用最廣泛的兩個(gè)解法器 . 25 – SMG求解矩形網(wǎng)格下對(duì)流擴(kuò)散方程的 FDM, FEM或FVM離散得到的方程組。stencil)。b)。 ... HYPRE_StructVectorAssemble(x)。 HYPRE_StructPFMGDestroy(solver)。 ub], b = [bi 。 對(duì)流系數(shù) B=。 32 主要功能 ? 求解不同類型的稀疏矩陣方程問(wèn)題: 對(duì)稱或非對(duì)稱矩陣(部分主元法),復(fù)和實(shí)算術(shù)矩陣 ? 提供了多種矩陣輸入格式: ? 組裝格式( assembled format) ? 分布式組裝格式( distributed assembled format) ? 單元格式( elemental format) ? 迭代加密和向前誤差分析 。最后設(shè)定 JOB=2,調(diào)用 MUMPS完成數(shù)據(jù)結(jié)構(gòu)的釋放 PROGRAM MUMPS_EXAMPLE NCLUDE ’’ INCLUDE ’’ TYPE (DMUMPS_STRUC) id INTEGER IERR, I CALL MPI_INIT(IERR) C Define a municator for the package id%COMM = MPI_COMM_WORLD C Ask for unsymmetric code id%SYM = 0 C Host working id%PAR = 1 C Initialize an instance of the package id%JOB = 1 CALL DMUMPS(id) 39 C Define problem on the host (processor 0) IF ( id%MYID .eq. 0 ) THEN READ(5,*) id%N READ(5,*) id%NZ ALLOCATE( id%IRN ( id%NZ ) ) ALLOCATE( id%JCN ( id%NZ ) ) ALLOCATE( id%A( id%NZ ) ) ALLOCATE( id%RHS ( id%N ) ) READ(5,*) ( id%IRN(I) ,I=1, id%NZ ) READ(5,*) ( id%JCN(I) ,I=1, id%NZ ) READ(5,*) ( id%A(I),I=1, id%NZ ) READ(5,*) ( id%RHS(I) ,I=1, id%N ) END IF C Call package for solution id%JOB = 6 CALL DMUMPS(id) C Solution has been assembled on the host IF ( id%MYID .eq. 0 ) THEN WRITE( 6, * ) ’ Solution is ’,(id%RHS(I),I=1,id%N) END IF C Deallocate user data IF ( id%MYID .eq. 0 )THEN DEALLOCATE( id%IRN ) DEALLOCATE( id%JCN ) DEALLOCATE( id%A ) DEALLOCATE( id%RHS ) END IF C Destroy the instance (deallocate internal data structures) id%JOB = 2 CALL DMUMPS(id) CALL MPI_FINALIZE(IERR) STOP END 55?2 3 4331 1 2241??????????20249613?????
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1