freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

scalasca13用戶手冊--中文-展示頁

2024-11-24 18:20本頁面
  

【正文】 序可視化 優(yōu)勢 和豐富的統(tǒng)計功能。在分析時, Scalasca 搜索 指示等 待狀態(tài)的特征模式及相關(guān)的性能特性,按類別 對 找到的實例 分類 并量化它們的重要性,分析結(jié)果是一個與 匯總報表 結(jié)構(gòu)類似的模式分析報 表 ,但對高級通信和低效同步進行了濃縮。 當跟蹤被激活,每個進程產(chǎn)生一個包含它的所有本地進程事件記錄的跟蹤文件。運行時 概括能力 對獲取性能行為概觀及下一次的優(yōu)化插樁都是非常有用的。有些系統(tǒng)上提供 人工和自動插樁的混合機制。插樁的意思是修改代碼以隨時記錄發(fā)生的與性能相關(guān)的事件。圖 Scalasca支持的基本分析流程。 Scalasca 概述 Scalasca 支持 當前大多數(shù) HPC 平臺上的用 C、 C++和 Fortran 編寫的 MPI、 OpenMP 及混合MPI/OpenMP應用 程序的測量和分析。然后,優(yōu)化效能被另一個優(yōu)化周期驗證。 評估階段的結(jié)論是由表示的信息產(chǎn)生優(yōu)化意向。如果呈現(xiàn)的數(shù)據(jù)太抽象,關(guān)鍵性能事件可能不能被用戶識別,如果太詳細,用戶可能被淹沒在大量數(shù)據(jù)中。 收集的數(shù)據(jù)被分析后,結(jié)果需要表示在一個分析報告中,從而轉(zhuǎn)入性能優(yōu)化 周期 的下一階段 ,稱作表示階段 。用于分析這些相互關(guān)系的信息通常 分布在這些進程中。如果 已經(jīng) 收集了詳細的事件跟蹤,可以研究不同 進程 產(chǎn)生的事件間更復雜的依賴, 生成更詳細的分析報告。因此必須避免對這些區(qū)域的測量。由額外測量指令產(chǎn)生的干擾很小,足以獲取應用程序行為的精確視 圖。 插樁期間被插入的額外指令及關(guān)聯(lián)的測量存儲需要一些資源(內(nèi)存以及CPU 時間)。 當被插樁代碼在測量 階 段執(zhí)行時,性能數(shù)據(jù)被收集。消息傳遞接口標準 MPI提供 了 用于這種插樁的專門接口,稱作 PMPI接口。大多數(shù)系統(tǒng)中,插樁工作可以通過使用編譯器的專門特征自動完成,但是這種方法通常不允許進行細粒度的插樁控制。如源代碼插樁、基于編譯 器 的自動插樁和連接預插樁庫。插樁描述修改應用程序代碼的處理 過程 , 使得能夠 在應用運行 期間對性能相關(guān)數(shù)據(jù)進行測量。這是一個迭代過程,可以用一個 周期 來描述,稱作性能優(yōu)化 周期 。 如何閱讀本文檔 性能優(yōu)化周期 無論是 為 了 單 個 核 心的 性能 還是可擴展性 , 對 應用 進行 優(yōu)化 的 基本途徑是很相似的。特別是當試圖測量處理器數(shù) 量巨大 的通信集約型 應用時,這些等待狀態(tài)對 取得 好的性能 可能 是嚴峻的挑戰(zhàn)。 Scalasca 支持一 種漸增式的 性能分析 處理,它 采用 不斷細化的 測量配置 策略 ,通過事件跟蹤 機制 將 并發(fā) 行為的 深入研究 與運行時摘要 有機地 結(jié)合 在一起 。 Scalasca 是一個 由 J252。 scalasca 用戶手冊i 目 錄 1 引言 ............................................................................................................................. 1 如何閱讀本文檔 .................................................................................................. 1 性能優(yōu)化周期 ..................................................................................................... 1 Scalasca概述 ....................................................................................................... 2 2 入門指南 ...................................................................................................................... 4 插樁 ................................................................................................................... 4 運行時測量收集與分析 ....................................................................................... 5 分析報告審查 ..................................................................................................... 6 CUBE3的使用 ........................................................................................... 6 一個完整的工作流程例子 .................................................................................... 7 3. 應用插樁 ................................................................................................................... 12 自動編譯器插樁 ................................................................................................ 13 手動區(qū)域插樁 ................................................................................................... 14 半自動插樁 ....................................................................................................... 15 使用 PDTOOLKIT 進行自動源代碼插樁 ............................................................. 16 限制 ........................................................................................................ 17 選擇插樁 .......................................................................................................... 18 4. 測量收集與分析 ......................................................................................................... 19 NEXUS配置 ...................................................................................................... 19 測量配置 .......................................................................................................... 20 基于編譯器插樁的子程序過濾 ................................................................. 20 選擇性 MPI事件生成 .............................................................................. 20 硬件計數(shù)器度量參數(shù)的測量與分析 .................................................................... 21 自動并行事件痕跡分析 ..................................................................................... 22 自動串行事件痕跡分析 ..................................................................................... 23 5. 輔助工具 ................................................................................................................... 25 輔助 EPILOG事件痕跡工具 .............................................................................. 25 痕跡轉(zhuǎn)換器 ....................................................................................................... 25 用戶指定的虛擬拓撲記錄 .................................................................................. 25 附錄 A: MPI包聯(lián)系 ...................................................................................................... 27 函數(shù)到組 .......................................................................................................... 27 組到函數(shù) .......................................................................................................... 34 參考文獻 ........................................................................................................................ 41 1 1 引言 超級計算是現(xiàn)代科學與工程的關(guān)鍵技術(shù)之一,是解決高復雜度關(guān)鍵問題不可缺少的。作為當今大規(guī)模計算系統(tǒng)生產(chǎn)應用的先決條件,高性能計算機需要強大而健壯的性能分析工具,這些工具 能夠優(yōu)化并行應用使之更有效、更高效。lich 超算中心開發(fā)的 性能分析工具集 ,它被 專門 設計 用于包括 IBM Blue Gene 和 Cray XT等大規(guī)模系統(tǒng) , 不過, 它也適用于使用 MPI和 /或 OpenMP的較小的高性能計算平臺。 Scalasca 的 一個與眾不同的 特征是 它能夠 識別 如 工作 負載 分布 不均衡 等所導致 的等待狀態(tài)。與它的前身 KOJAK相比, Scalasca可以發(fā)現(xiàn)這些等待狀態(tài),即使 在使 用一個新的并行跟蹤分析模式 的 很大的 過程配置中。首先,應用的行為必須被監(jiān)測,然后 可以評估 記錄下來的行為 并得出進一步改進的結(jié)論。它 由 下列部分組成: ? 插樁( Instrumentation) ? 測量( Measurement) ? 分析( Analysis) ? 表示( Presentation) ? 評估( Evaluation) ? 代碼優(yōu)化( Optimization of the code) 圖 性能優(yōu)化 周期 如圖 所示,用戶以原始(未優(yōu)化)的應用開始,進入優(yōu)化 周期 的 ―插樁 ‖階 段。 Scalasca 可以通過不同的機制來完成這一工作。源代碼級插樁可以通過引入附加指令到源代碼中來實現(xiàn) 。第三種方法是使用預插樁庫,2 預插樁庫中 含有已插樁的相關(guān)庫函數(shù)的實現(xiàn)。 由于這種接口被定義在 MPI標準中,因此它的 API是輕量的,并且為工具開發(fā)者創(chuàng)造了一個為多種不同的 MPI實現(xiàn)提供單一輕量級測量庫的機會。這些數(shù)據(jù)可以 依據(jù)期望的信息需求級別 存儲為 概要 描述或事件跟蹤 。因此應用的執(zhí)行會受到一定程度的影響。 然而,某些應用屬性,如極小時間內(nèi)頻繁執(zhí)行的區(qū)域,將總是導致高的干擾。 應用執(zhí)行之后可以分析測量數(shù)據(jù)。特別是 交互進程 事件的相互關(guān)系通常只能通過事后檢查分析進行。測量期間應用程序運行過程中的數(shù)據(jù)傳輸將引起嚴重干擾 ,為此將需要一些網(wǎng)絡應用資源。 在這一階段,重要的是
點擊復制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1