freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

scalasca13用戶手冊--中文-文庫吧資料

2024-11-20 18:20本頁面
  

【正文】 128_trace [00000]EPIK: Flushed file ./epik_sor_vn128_trace/ELG/00000 ... [00013]EPIK: Flushed file ./epik_sor_vn128_trace/ELG/00013 [00000]EPIK: Closed experiment ./epik_sor_vn128_trace S=C=A=N: Collect done S=C=A=N: Analysis start mpirun mode vn np 128 ./epik_sor_vn128_trace [... SCOUT output ...] S=C=A=N: Analysis done S=C=A=N: ./epik_sor_vn128_trace plete. 11 這將創(chuàng)建一個試驗檔 案目錄 epik_sor_vn128_trace,通過后綴 _trace 與之前的匯總試驗 相 區(qū)分 。 在開始跟蹤測量試驗之前,要確保建立試驗的文件系統(tǒng)適合于并行 I/O(典型地,如 /scratch、/work、或 /home),并且對期望的跟蹤有足夠的磁盤容量。 一旦確定了緩沖區(qū)大小和 /或過濾器的配置,在后續(xù)測量中 要確保 通過環(huán)境變量或工作目錄下的測量配置文件 它們。 說明: 過濾不會防止 被插樁的函數。 cube3_score r epik_sor_vn128_sum/ Reading ... done. Estimated aggregate size of event trace (total_tbc): 25698304 bytes Estimated size of largest process trace (max_tbc): 215168 bytes (When tracing set ELG_BUFFER_SIZE max_tbc to avoid intermediate flushes or reduce requirements using a file listing USR regions to be filtered.) flt type max_tbc time % region ANY 215168 (summary) ALL MPI 195728 (summary) MPI COM 9696 (summary) COM USR 9744 (summary) USR MPI 80000 MPI_Irsend MPI 73600 MPI_Irecv MPI 16040 MPI_Allreduce MPI 16000 MPI_Barrier MPI 9600 MPI_Waitall COM 9600 get_halo USR 4800 update_red USR 4800 update_black MPI 240 MPI_Gather MPI 200 MPI_Bcast USR 48 TRACING USR 48 looplimits MPI 24 MPI_Finalize USR 24 init_boundary 10 USR 24 init_red_black COM 24 sor_iter COM 24 init_field COM 24 setup_grid MPI 24 MPI_Init COM 24 main (執(zhí)行命令 scalasca examine –s可以報告該命令的基本格式。當然,為了實際設置過濾器,還需要更詳細的考察。而 MPI 和OpenMP 區(qū)域是 Scalasca分析需要的,它們不能被過濾。 對過濾來說,具有 USR類型的例程通常是最佳候選,過濾將有效地使它們對測量和分析不可見。 為輔助 建立合適的過濾器文件, ―評分 ‖功能提供了不同類型的 劃分 ,這取決于每個調用路徑的區(qū)域類型。如果 max_tbc 超過了內存中事件流的有效緩沖區(qū)大小,在測量期間將引發(fā)中間刷新。 scalasca examine s epik_sor_vn128_sum [cube3_score epik_sor_vn128_sum/] Reading ./epik_sor_vn128_sum/... done. Estimated aggregate size of event trace (total_tbc): 25698304 bytes Estimated size of largest process trace (max_tbc): 215168 bytes (When tracing set ELG_BUFFER_SIZE max_tbc to avoid intermediate flushes or reduce requirements using a file listing USR regions to be filtered.) flt type max_tbc time % region ANY 215168 (summary) ALL 9 MPI 195728 (summary) MPI COM 9696 (summary) COM USR 9744 (summary) USR 表的第一行( ALL)給出了執(zhí)行的所有函數的匯總信息。減少跟蹤的體積(如,指定更短的執(zhí)行程序、有選擇地插樁和測量)通常更合理,然后才是增加緩沖區(qū)大小。當然,如果為緩沖區(qū)指定的值太大,應用程序可能因運行內存不足而無法裝入,或者以磁盤分頁的方式運行。刷新影響應用程序的性能,因為不同進程間刷新并不協(xié)調,而且運行時的不均衡會影響測量。為了減少需要的內存量、縮短刷新事件緩沖到磁盤的時間,應該只監(jiān)視最相關的函數。 圖 用 CUBE觀察運行時匯總 在跟蹤收集的時候,應用程序執(zhí)行行為的相關信息被記錄,寫入事件流。應用程序性能匯總的檢查 可能顯示若干應用程序行為測量方面的影響。匯總分析報表可以 被后期處理并使用 Scalasca報表瀏覽器審查分析。 S=C=A=N: Scalasca runtime summarization S=C=A=N: ./epik_sor_vn128_sum experiment archive S=C=A=N: Collect start mpirun mode vn np 128 ./ [00000]EPIK: Created new measurement archive ./epik_sor_vn128_sum [00000]EPIK: Activated ./epik_sor_vn128_sum [NO TRACE] [... Application output ...] [00000]EPIK: Closing experiment ./epik_sor_vn128_sum ... [00000]EPIK: Closed experiment ./epik_sor_vn128_sum S=C=A=N: Collect done S=C=A=N: ./epik_sor_vn128_sum plete. 作業(yè)成功執(zhí)行之后,在一個新的目錄中創(chuàng)建一個匯總報表。在 Blue Gene系統(tǒng)上參數 mode和 np是 mpirun的選項,其他的運行器將有不同的選項和語法。這里, Scalasca分析器的調用必須 放置在應用執(zhí)行命令之前。 不同調度系統(tǒng)中批處理腳本的語法是不同的。在超級計算系統(tǒng)中,用戶通常必須提交他們的作業(yè)到批處理系統(tǒng),并且不允許直接運行并行作業(yè)。 SOR僅由一個源文件構成,它可以使用下面 2條命令編譯和連接。 缺省的, Scalasca 使用基于編譯器的自動插樁特征 。 本節(jié)將通過 SOR( solver kernel)實例分析 指導使用紅黑相間的 overrelaxation方法解算泊松方程。 使用 f filter_file選項可以評估可能的過濾器文件。如沒有 OpenMP7 及 MPI 操作的區(qū)域通過選擇插樁和測量(見 節(jié)和 節(jié))從后續(xù)試驗中排除可能是合適的。如果物理內存充足,可以 將其指定為配置變量 ELG_BUFFER_SIZE的值用于 后續(xù)的跟蹤收集 。這些工具 中的每一個都產生一個新的 CUBE格式的報表 作為 輸出。使用 cube3_cut 可以修剪指定的調用樹或 /和指定一個新的調用樹根( root)節(jié)點,而產生一個新的分析報表??梢允褂?cube3_mean 或 cube3_merge平均或 合并多個分析報告。 為了獲取性能屬性的準確定義,按鼠標右鍵,選擇與性能屬性關聯(lián)的上下文菜單中的 Online Description,從 Info菜單項可以得到 簡要 描述。單擊樹節(jié)點左邊的圖標展開或收縮該節(jié)點。就是說,選擇一個性能屬性后,中間畫板顯示整個調用樹的分布。 在性能屬性或者調用路徑上單擊選擇相應節(jié)點。所有的樹節(jié)點用參數值和顏色框標識以幫助識別熱點。 CUBE3主窗口由 3個 包含樹形顯示或交替式分析報表圖形視圖的畫板構成。 CUBE3是一個通用用戶接口,它顯示和瀏覽并行應用的性能和調試信息。 CUBE3的使用 下面是 CUBE3 用法的一個簡短介紹。 CUBE3同樣能夠 用于一個 試驗 檔案或 CUBE文件。 可以不運行閱讀器來獲得一個短小的文本評價表。 scalasca examine epik_title 在 運行 CUBE3 報表閱讀器之前,已在第一時間完成了檢查檔案的后處理工作。 6 分析報告審查 自動分析的結果被存儲成 試驗 檔案目錄中的一個或多個報表。 當在機群環(huán)境中使用環(huán)境變量時,確保這些環(huán)境變量在機群的所有節(jié)點的所 有應用進程具有相同的值。額外的說明信息(通過 –v)可能也是有用的,特別是測量和分析不成功時。當然,你可能仍然希望收集跟蹤以便在圖形跟蹤瀏覽器中進行可視化顯示和研究。這樣,在測量完成后會自動啟動跟蹤分析。 也可以收集事件跟蹤數據 作為 測量的一部分,為每個進程產生一個 EPILOG跟蹤文件?;旌?MPI/OpenMP包含兩個參數集合。對于 MPI 測量包括MPI時間、消息和文件 I/O的統(tǒng)計。 測量完成后,測量檔案目錄中包含若干記錄文件及一個或多個分析報告 。每個 EPIK 測量檔案目錄的 缺省名依據目標可執(zhí)行應用的名字、運行配置(即指定的處理器數及 OMP_NUM_THREADS)以及測量配置來創(chuàng)建。 scalasca analyze [options] $MPIEXEC $MPI_FLAGS target [target args] 對于非 MPI(單純的 OpenMP)應用,應忽略 MPI運行命令及相關的 選項 。 盡管自動插樁通常很方便,但它可能導致太多或太破碎的測量,可以使用選擇插樁或測量過濾(見 )。 MPICC = $(PREP) mpicc MPICXX = $(PREP) mpicxx MPIF90 = $(PREP) mpif90 使用下面的命令可以很 容易地 產生一個程序的插樁版本。 雖然并不是所有的 object 文件都需要插樁, 并且僅 對 包含5 MPI和 /或 OpenMP代碼的源模塊 插樁 往往已足夠。 因此,構建應用的編譯和連接命令應該具有 ―scalasca –instrument‖前綴(在 Makefile中)。閱讀 作為 Scalasca文檔一部分的 OPEN_ISSUES文件的 OPARI節(jié),來了解當前的限制及如何圍繞它工作。此外如果 Scalasca已經配置,還可以使用 PDTOOLKIT插樁器進行自動源代碼插樁( )。 插樁 為了使用 Scalasca 測量系統(tǒng)進行測量,用戶應用程序需要被插樁,即在應用程序運行時的特定關鍵點(事件)必須插入專門的測量調用。 以下三節(jié)給出 這三個選項最核心的綜述,以及在性能分析的相關步驟如何使用它們。并啟動 Scalasca分析報告審查瀏覽器 CUBE3。 Scalasca測量系統(tǒng)支持運行時 匯 總 和 /或事件跟蹤與分析, 也 可選擇包括硬件計數器信息。 有自動、半自動和連接預插樁庫三種方式。 Scalasca命令提供調用 skin、 scan和 square等相關命令的選項。 將指出最 突出的特點并給出后面章節(jié)更深入的相關信息的參照。自動分析的另一種選擇是,轉換跟蹤事件并使用諸如 Paraver和 Vampir的第三方跟蹤瀏覽器進行分析研究,以發(fā)揮它們強大的時間
點擊復制文檔內容
高考資料相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1