freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

scalasca13用戶手冊--中文(參考版)

2024-11-16 18:20本頁面
  

【正文】 一個為全部支持的函數(shù)調(diào)用生成事件的簡寫方法是: EPK_MPI_ENABLED=ALL 把一個組,如 TYPE,增加到缺省配置中的簡寫方法是: EPK_MPI_ENABLED=DEFAULT:TYPE 與每個組相關(guān)的 MPI函數(shù)的詳細(xì)概述在附錄 A中。通訊、組和其他內(nèi)部數(shù)據(jù)的跟蹤不受影響并且總是開啟。此外, 使用特定標(biāo)記能夠使用戶處理更容易。每個模塊有一個用于識別它的短的字符串標(biāo)記。這意味在應(yīng)用程序的開始,用戶可以決定是否開啟或關(guān)閉一個函數(shù)組的事件生成。 MPI 定義一個所謂的 ―profiling接口 ‖, 它提供了能夠容易地插入在用戶應(yīng)用和 MPI庫調(diào)用之間的包裝庫。有時,即使這樣的最小插樁處理也是不受歡迎的,函數(shù)應(yīng)該 從 插 樁中 剔 除,見 節(jié)的討論。另一方面,如果 C++名子 demangling被支持 , ‖*‖字符指針變量 必須用反斜線轉(zhuǎn)義??梢允褂?EPIK配置變量 EPIK_FILTER或 通過 scalasca –analyze命令的 f filter_file選項(xiàng)(將被歸檔為 epik_title/驗(yàn)的一部分)來指定 包含測量中執(zhí)行的函數(shù)名(每行一個)的文件 。 基于編譯器插樁的子程序過濾 當(dāng)使用自動編譯器插樁對用戶級源程序例程 (分類為 USR例程) 插樁時, 有時測量及其關(guān)聯(lián)分析會退化,如,小的、頻繁執(zhí)行的或通常不感興趣的函數(shù)、方法或子程序。 跟蹤(大規(guī)模) MPI 應(yīng)用時,建議設(shè)置 EPK_LDIR 和 EPK_GDIR 變量為同一位置,因?yàn)檫@樣可以避免寫中間文件并有效改善性能。 環(huán)境變量的值可以包含 $XYZ 或 ${XYZ}形式的字符串,這里, XYZ 是另外的環(huán)境變量名 。 測量配置 可以使用一些配置變量來控制 EPIK 測量的運(yùn)行時結(jié)構(gòu),關(guān)于配置變量的說明列表以及它們的缺省設(shè)置情況,運(yùn)行 epik_conf 命令。使用 SCAN_ANALYZE_OPTS 可以為20 跟蹤分析器指定選項(xiàng)。 依據(jù) 分析器的可用性和 試驗(yàn)的類型,跟蹤分析使用不同的 跟蹤 分析器來完成。 如果環(huán)境變量沒能被啟動器自動地發(fā)送給 MPI 進(jìn)程, 必須用環(huán)境變量 SCAN_SETENV 說明啟動器需要的語法。 如果可執(zhí)行目標(biāo)沒有被指定為啟動器的一個參數(shù), 它被期望 是 命令行的隨后部分, 必須 使用 來明確地分隔目標(biāo) 和 之前的啟動器說明。 解析 MPI啟動命令時, 可能報告已按忽略處理的未識別 選項(xiàng) ,未識別選項(xiàng)連同它可能需要的參數(shù)被用引號括住。 串行程序和 OpenMP 程序 總是 被直接執(zhí)行,然而 MPI(或混合 MPI/OpenMP)程序 通常需要一個專門的啟動器(如 mpiexec),并且可能還需要為啟動 器指定要創(chuàng)建的進(jìn)程數(shù)。 說明:在命令行上指定的配置優(yōu)先于環(huán)境變量或配置文件中的指定。 檢查目標(biāo)可執(zhí)行程序以確定是否已存在 MPI 和 /或 OpenMP 插樁,以及從啟動環(huán)境和命令行描述中確定 MPI進(jìn)程數(shù)或 OpenMP線程數(shù),這些被用于生成缺省的試驗(yàn)名字,除非已用 e expt_title(或EPK_TITLE)明確地指定了標(biāo)題。 NEXUS配置 Scalasca 測量收集與分析 NEXUS( SCAN)是一個前綴 命令,它位于 啟動和運(yùn)行應(yīng)用 可執(zhí)行程序的命令之前。另外,使用 KOJAK痕跡 分析器,進(jìn)行后續(xù)的 痕跡 分析是可能的(見 ),盡管只在極少情況下建議這樣。 ―執(zhí)行模式 ‖是 低效行為 的 標(biāo)準(zhǔn) 化表示,在分析處理期間,這些模式用于識別和量化應(yīng)用中的低效行為。 Scalasca的突出特征是自動分析事件 痕跡 ,以查找性能瓶頸。 一個被插樁的可執(zhí)行程序可以執(zhí)行許多不同的測量試驗(yàn),不需要按不同的測量與分析配置重新插樁。如: scalasca instrument disable atomic,locks gcc fopenmp ... 當(dāng)然,當(dāng)這些結(jié)構(gòu)不被插樁并且也不出現(xiàn)在后續(xù)的測量和分析中時, 應(yīng)用程序可能仍會因太多的 OpenMP 同步調(diào)用而有性能問題。 對于 OpenMP(或混合的)應(yīng)用,有大量的同步操作, 它們的插樁可能還造成過多的測量開銷。 如果一個源模塊中只有一部分子程序應(yīng)該被插樁,而另一部分保持未插樁, 可以將 該模塊分割成 兩個文件,或者用條件預(yù)處理器指示 選擇分開的部分編譯兩次產(chǎn)生兩個 object文件。 通過選擇常規(guī)方法編譯這些資源,即不使用 Scalasca 插樁器預(yù)處理,可以繞過 工作在源模塊級的自動子程序插樁 。未被插樁的子程序仍然可以執(zhí)行,但是在測量和后續(xù)分析中變得 ―不可見 ‖。測量期間可以使用過濾(在 )來忽略來 自編譯器插樁的例程事件。這些子程序的測量開銷與未插樁時的執(zhí)行時間相比會很大,導(dǎo)致測量膨脹。 與 等待狀態(tài) 及無效的內(nèi)部處理有關(guān)的附加 度量參數(shù) 的更詳細(xì)分析,需要事件 痕跡 ,事件 痕跡 被收集在每個進(jìn)程的 緩沖區(qū)中,緩沖區(qū)必須 有足夠容量存儲 來自整個程序執(zhí)行中的事件。 ? 還不支持 象靜態(tài) /動態(tài)計時器、 循環(huán)、 I/O和內(nèi)存測試等的先進(jìn) TAU測試特性,選擇性插樁文件中的相應(yīng)條目將被忽略。 ? C/C++頭文件中的代碼及 Fortran 中包含的代碼(使用 C預(yù)處理器或 include 保留字)目前不能被插樁。 ? 如果被插樁的 Fortran子程序使用 len作為 參數(shù)名,插樁代碼的編譯將失?。ㄊ褂脙?nèi)部函數(shù)len的插樁代碼將被參數(shù)定義屏蔽)。 限制 由于基于 PDTOOLKIT源代碼插樁器的支持是一個新的附加的特性,而且部分工作仍在進(jìn)行中,因此目前存在一些限制: ? 對 Fortran 77應(yīng)用插樁時,插入的插樁代碼片段尚不能遵守 Fortran 77的行長限制。例如: BEGIN_EXCLUDE_LIST Exclude C function matmult void matmult(Matrix*, Matrix*, Matrix*) C Exclude C++ functions with prefix ‘sort_‘ and a single int pointer argument void sort_(int *) Exclude all void functions in namespace ‘foo‘ void foo:: END_EXCLUDE_LIST 不幸的是, 還被用作注釋,因此要指定一個 通配符開始的條目,要用雙引號 ()將其括住。對于 C 和 C++,必須給出包括返回值和參數(shù)類型的完整的函數(shù)原型??梢粤谐鰡为?dú)的名字或使用 通配符。源代碼插樁器還可被配置成對文件和例程有選擇地插樁,此時,需要在 pdt 選項(xiàng)后提供附加選項(xiàng) optTauSelectFile=filename。但是要注意,這一功能仍處于實(shí)驗(yàn)階段且有一些限制(見 )。 使用 PDTOOLKIT 進(jìn)行自動源代碼插樁 如果 Scalasca已被配置支持 PDToolkit,自動源代碼插樁可 作為 一個可選的插樁方案使用。 另外,下述情況應(yīng)該插入, 作 為主程序的第一個可執(zhí)行語句。 Fortran: subroutine foo(...) !declarations !POMP$ INST BEGIN(foo) ... if (condition) then !POMP$ INST ALTEND(foo) return end if ... !POMP$ INST END(foo) end subroutine foo 16 C/C++: void foo(...) { /* declarations */ pragma pomp inst begin(foo) ... if (condition) { pragma pomp inst altend(foo) return。其主要好處是: ? 作為指示, 忽略 ―normal‖正常 編譯期間的插樁 ? 當(dāng)全自動編譯器插樁不被支持時,可使用這種半自動插樁方法 INST BEGIN/END指示 可用于標(biāo)記任何用戶定義的語句序列。 半自動插樁 如果你使用下面介紹的 POMP INST 指示對應(yīng)用源文件中期望的區(qū)域或函數(shù)進(jìn)行手動插樁,Scalasca插樁器的 pomp選項(xiàng)將為它們插樁。 也就是, 這種情況下,通常 僅用戶 區(qū)域 插樁是 需要 的 。 還需 注意, 這種方法插樁的 Fortran 源文件 必須 使 用 C預(yù)處理程序( CPP) 進(jìn)行 預(yù) 處理 。 用這種方法插樁的源文件必須用- DEPIK 編譯,否則 EPIK_*調(diào)用 什 么也不做并被忽略。 對于 C 和 C++ , 函數(shù) 名 由 EPIK_FUNC_BEGIN 和EPIK_FUNC_END 自動提供(因此不需要登記) 。 } 15 C++ only: include void foo(...) { EPIK_TRACER(foo)。 ++i) { ... } EPIK_USER_END(r_name)。 for (i = 0。 EPIK_FUNC_START()。 可以根據(jù)使用的程序設(shè)計語言,按照下列方法完成 插樁。手動插樁還可用于擴(kuò)展自動插樁 區(qū)域或程序段來改善分析報表的結(jié)構(gòu)。 對插樁例程的命名取決于編譯器,它 可能對 Fortran和 C++例程名增加下劃線或其他修飾,并且14 在 Scalasca安裝時是否已激活 ―demangling‖名字及能被成功應(yīng)用。目前,使用自動編譯器插樁在所有平臺上避免特定函數(shù)的插樁是不可能的。這可能影響測量期間應(yīng)用的整體性能。 但 SUN Studio編譯器是個例外,在它的 Fortran編譯器上僅提供適當(dāng)?shù)闹С帧? 基于編譯器的自動插樁已經(jīng)在幾個編譯器上進(jìn)行了測試。使用 p=none可以屏蔽編譯器插樁。 自動編譯器插樁 目前大多數(shù)編譯器都支持位于例程入口和出口的插樁調(diào)用的自動插入, Scalasca 可以利用這種能力來確定哪些例程被包含在插樁測量中。編譯器、 PDToolkit、 POMP、 EPIK用戶 API手動源代碼插樁可以同時使用或任意組合。 缺省情況下, 自動 由編譯器對用戶級源代碼例程 進(jìn)行 插樁(等價于 p=all) 。被插樁的 MPI庫函數(shù)的缺省集在安裝 Scalasca時指定 。 kconfig命令還可以用于確定正確的編譯選項(xiàng)以指定 錄。如果需要,可用 32 或 64 選項(xiàng)選擇 32 位或 64位測量 版本庫。在缺省情況下, kconfig 假定正在被連接的是 C 或 C++程序, Fortran 應(yīng)用必須用 for 選項(xiàng)顯式地指明。 使用編譯器進(jìn)行預(yù)處理時,前綴命令不是必須的,因?yàn)?此時不進(jìn)行插樁。 Scalasca插樁器命令 scalasca –instrument自動地 使用 正確的 前綴 編譯和連接 命令 ,產(chǎn)生一個被插樁的可執(zhí)行程序。如何對 OpenMP 源代碼插樁,參見OPARI文檔。注意, EPIK庫必須在 MPI庫之前被連接 以確保插入的有效性。 象用戶例程和 指定的源代碼區(qū)域一樣, Scalasaca目前支持下列事件類型: ? MPI庫調(diào)用 插樁操作通過使用標(biāo)準(zhǔn) MPI描述接口 PMPI來完成。除基于編譯器的自動插樁( )外,還提供了使用 EPIK API的人工插樁( )、使用 POMP指示 的半自動插樁( )及使用基于PDToolkit插樁器的自動源代碼插樁( ,如果配置)。 在跟蹤分析成功之后,刪除試驗(yàn)檔案之前, 可以通過刪除試驗(yàn)檔案目錄中的 ELG子目錄來刪除跟蹤文件。成功跟蹤之后 , Scalasca 測量已經(jīng)創(chuàng)建了一個包含事件跟蹤和它的分析文件的目錄。 EPILOG 事件跟蹤與分析的文件系統(tǒng)需求比運(yùn)行時匯總更高。 scalasca examine epik_sor_vn128_trace INFO: Postprocessing trace analysis report ... INFO: Displaying ./epik_sor_vn128_trace/ ... 圖 用 CUBE3確定一個遲到發(fā)送者 圖 給出了一幅屏幕截圖,分析結(jié)果提供的信息乍看與匯總分析結(jié)果相同,但是,跟蹤分析報表濃縮了額外的 度量 參數(shù),這些 度量參數(shù) 揭露為匯總性征的子參數(shù),如由于發(fā)送者遲到,早到的接收不得不等待發(fā)送啟動而潛在地耗費(fèi)的點(diǎn)到點(diǎn)通信時間部分。 scalasca analyze t mpirun mode vn np 128 ./ S=C=A=N: Scalasca trace collection and analysis S=C=A=N: ./epik_sor_vn128_trace experiment archive S=C=A=N: Collect start mpirun mode vn np 128 ./ [00000]EPIK: Created new measurement archive ./epik_sor_vn128_trace [00000]EPIK: Activated ./epik_sor_vn128_trace [10000000 bytes] [... Application output ...] [00000]EPIK: Closing experiment ./epik_sor_vn
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1