freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

hadoop大數(shù)據(jù)平臺(tái)-建設(shè)要求及應(yīng)答方案-資料下載頁

2025-06-07 07:40本頁面
  

【正文】 執(zhí)行時(shí)間 最大Reduce任務(wù)執(zhí)行時(shí)間 秒 系統(tǒng)級(jí)Map任務(wù)執(zhí)行失敗數(shù) Map任務(wù)執(zhí)行失敗數(shù) 個(gè) 系統(tǒng)級(jí)Reduce任務(wù)執(zhí)行失敗數(shù) Reduce任務(wù)執(zhí)行失敗數(shù) 個(gè) 系統(tǒng)級(jí)Map任務(wù)執(zhí)行成功數(shù) Map任務(wù)執(zhí)行成功數(shù) 個(gè) 系統(tǒng)級(jí)Reduce任務(wù)執(zhí)行成功數(shù) Reduce任務(wù)執(zhí)行成功數(shù) 個(gè) 系統(tǒng)級(jí)6.6. HBase指標(biāo)KPI名稱 KPI描述 單位 級(jí)別 系統(tǒng)空間 系統(tǒng)總空間 MB 系統(tǒng)級(jí)/ 已用空間 NoSQL系統(tǒng)已用數(shù)據(jù)量 (系統(tǒng)級(jí));RegionServer的Region個(gè)數(shù)(節(jié)點(diǎn)級(jí))MB 系統(tǒng)級(jí)/節(jié)點(diǎn)級(jí) 可用空間 NoSQL系統(tǒng)可用數(shù)據(jù)量 MB 系統(tǒng)級(jí)/空間使用比率 已使用的空間與總空間的比值 % 系統(tǒng)級(jí)/ CPU平均使用率 NoSQL系統(tǒng)平均CPU使用率 % 系統(tǒng)級(jí)/節(jié)點(diǎn)級(jí) CPU IOwait使用率 NoSQL系統(tǒng)平均CPU IOwait使用率 % 系統(tǒng)級(jí)/節(jié)點(diǎn)級(jí) 壓縮合并隊(duì)列長度 數(shù)據(jù)分區(qū)服務(wù)器中的壓縮合并(Compaction)隊(duì)列大小,當(dāng)存儲(chǔ)文件數(shù)量達(dá)到該數(shù)值時(shí)將啟動(dòng)壓縮合并。 個(gè) 系統(tǒng)級(jí) 請(qǐng)求時(shí)延10毫秒次數(shù) 請(qǐng)求響應(yīng)時(shí)間小于或等于10毫秒的請(qǐng)求次數(shù) 次 系統(tǒng)級(jí)/ 請(qǐng)求時(shí)延2000毫秒次數(shù) 請(qǐng)求響應(yīng)時(shí)間小于或等于2000毫秒的請(qǐng)求次數(shù) 次 系統(tǒng)級(jí)/ 請(qǐng)求時(shí)延2000毫秒以上次數(shù) 請(qǐng)求響應(yīng)時(shí)間大于2000毫秒的請(qǐng)求次數(shù) 次 系統(tǒng)級(jí)/ 讀IO次數(shù) 讀IO次數(shù) 次 節(jié)點(diǎn)級(jí) 寫IO次數(shù) 寫IO次數(shù) 次 節(jié)點(diǎn)級(jí) IO次數(shù) 節(jié)點(diǎn)IO次數(shù)(讀寫IO次數(shù)總和) 次 節(jié)點(diǎn)級(jí) 性能要求支持高性能計(jì)算處理,且性能應(yīng)能隨節(jié)點(diǎn)數(shù)呈線性增長。說明具體實(shí)現(xiàn)方式、適用場(chǎng)景和使用工具技術(shù)等,并說明節(jié)點(diǎn)數(shù)和性能的關(guān)系。hadoop平臺(tái)的特點(diǎn)就是隨著節(jié)點(diǎn)數(shù)的增長,性能隨之線性增長。提供平臺(tái)并行及并發(fā)處理能力的實(shí)施方案。詳細(xì)描述支持多服務(wù)器、多CPU、多進(jìn)程并行、并發(fā)處理數(shù)據(jù)的機(jī)制,以及系統(tǒng)解決并行處理方面主要瓶頸和限制因素的措施。MapReduce是Hadoop的核心,是Google提出的一個(gè)軟件架構(gòu),用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。概念“Map(映射)”和“Reduce(化簡(jiǎn))”,及他們的主要思想,都是從函數(shù)式編程語言借來的,還有從矢量編程語言借來的特性。當(dāng)前的軟件實(shí)現(xiàn)是指定一個(gè)Map(映射)函數(shù),用來把一組鍵值對(duì)映射成一組新的鍵值對(duì),指定并發(fā)的Reduce(化簡(jiǎn))函數(shù),用來保證所有映射的鍵值對(duì)中的每一個(gè)共享相同的鍵組。MapReduce 是用于并行處理大數(shù)據(jù)集的軟件框架。 MapReduce 的根源是函數(shù)性編程中的 map 和 reduce 函數(shù)。Map 函數(shù)接受一組數(shù)據(jù)并將其轉(zhuǎn)換為一個(gè)鍵/值對(duì)列表,輸入域中的每個(gè)元素對(duì)應(yīng)一個(gè)鍵/值對(duì)。Reduce 函數(shù)接受 Map 函數(shù)生成的列表,然后根據(jù)它們的鍵縮小鍵/值對(duì)列表。MapReduce起到了將大事務(wù)分散到不同設(shè)備處理的能力,這樣原本必須用單臺(tái)較強(qiáng)服務(wù)器才能運(yùn)行的任務(wù),在分布式環(huán)境下也能完成了說明節(jié)點(diǎn)間高性能切換的實(shí)施方案,說明節(jié)點(diǎn)間切換的極限時(shí)間。通過QJM日志系統(tǒng)來實(shí)現(xiàn)name node節(jié)點(diǎn)之間的高性能切換,節(jié)點(diǎn)之間的切換時(shí)間在秒級(jí)之內(nèi)。提供具有圖形化的性能調(diào)優(yōu)工具,并提供持續(xù)調(diào)優(yōu)的策略、方法。通過CM可以進(jìn)行圖形化的性能調(diào)優(yōu),并能進(jìn)行回滾和進(jìn)一步調(diào)優(yōu),滿足供持續(xù)調(diào)優(yōu)的策略、方法。 擴(kuò)展性要求支持?jǐn)?shù)據(jù)量彈性伸縮,考慮數(shù)據(jù)量增大或者減小情況,存儲(chǔ)容量能夠動(dòng)態(tài)不停機(jī)擴(kuò)容,擴(kuò)容時(shí)現(xiàn)有系統(tǒng)可以不間斷正常運(yùn)行,不受擴(kuò)容影響。擴(kuò)容時(shí)無需遷移數(shù)據(jù),避免硬盤和數(shù)據(jù)損壞。詳細(xì)說明實(shí)現(xiàn)方式。hadoop系統(tǒng)本身可以支持動(dòng)態(tài)增加節(jié)點(diǎn),不影響現(xiàn)有系統(tǒng)的正常運(yùn)行。HDFS( Hadoop Distributed File System),是一個(gè)分布式文件系統(tǒng)。它具有高容錯(cuò)性的特點(diǎn),可以被廣泛的部署于廉價(jià)的PC之上。它以流式訪問模式訪問應(yīng)用程序的數(shù)據(jù),這大大提高了整個(gè)系統(tǒng)的數(shù)據(jù)吞吐量,能夠滿足多來源、多類型、海量的數(shù)據(jù)存儲(chǔ)要求,因而非常適用于日志詳單類非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)。HDFS架構(gòu)采用主從架構(gòu)(master/slave)。一個(gè)典型的HDFS集群包含一個(gè)NameNode節(jié)點(diǎn)和多個(gè)DataNode節(jié)點(diǎn)。NameNode節(jié)點(diǎn)負(fù)責(zé)整個(gè)HDFS文件系統(tǒng)中的文件的元數(shù)據(jù)保管和管理,集群中通常只有一臺(tái)機(jī)器上運(yùn)行NameNode實(shí)例,DataNode節(jié)點(diǎn)保存文件中的數(shù)據(jù),集群中的機(jī)器分別運(yùn)行一個(gè)DataNode實(shí)例。在HDFS中,NameNode節(jié)點(diǎn)被稱為名字節(jié)點(diǎn),DataNode節(jié)點(diǎn)被稱為數(shù)據(jù)節(jié)點(diǎn),DataNode節(jié)點(diǎn)通過心跳機(jī)制與NameNode節(jié)點(diǎn)進(jìn)行定時(shí)的通信。HDFS可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)可靠的分布式讀寫。HDFS針對(duì)的使用場(chǎng)景是數(shù)據(jù)讀寫具有“一次寫,多次讀”的特征,而數(shù)據(jù)“寫”操作是順序?qū)?,也就是在文件?chuàng)建時(shí)的寫入或者在現(xiàn)有文件之后的添加操作。HDFS保證一個(gè)文件在一個(gè)時(shí)刻只被一個(gè)調(diào)用者執(zhí)行寫操作,而可以被多個(gè)調(diào)用者執(zhí)行讀操作。其主要特性如下:? 靈活:統(tǒng)一的存儲(chǔ)可以存放結(jié)構(gòu)化,半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)? 可擴(kuò)展:根據(jù)業(yè)務(wù)需要增加PC服務(wù)器實(shí)現(xiàn)存儲(chǔ)擴(kuò)容? 容錯(cuò):數(shù)據(jù)有多個(gè)副本以保障數(shù)據(jù)的可靠性? 開放:基于開源的存儲(chǔ)格式,避免廠商鎖定提供靈活的擴(kuò)展,如復(fù)雜數(shù)據(jù)類型,擴(kuò)展函數(shù)和腳本等。需二次開發(fā)。工作量預(yù)估為5人天提供對(duì)數(shù)據(jù)并行計(jì)算的擴(kuò)展,數(shù)據(jù)自動(dòng)在集群中進(jìn)行數(shù)據(jù)并行計(jì)算。hadoop的基本原理就是數(shù)據(jù)自動(dòng)在集群中進(jìn)行數(shù)據(jù)并行計(jì)算。支持在線的節(jié)點(diǎn)變動(dòng),單個(gè)集群可線性擴(kuò)展不少于500個(gè)計(jì)算節(jié)點(diǎn)、至少能處理3PB數(shù)據(jù)量,在線增加、刪除節(jié)點(diǎn)時(shí),能支持?jǐn)?shù)據(jù)和索引的傾斜探測(cè)和自動(dòng)平衡功能,保證平滑擴(kuò)展和性能的線性增長,詳細(xì)說明實(shí)施方案。通過CM工具,可以很容易的在線增加和刪除節(jié)點(diǎn),可以滿足單個(gè)集群可線性擴(kuò)展不少于500個(gè)計(jì)算節(jié)點(diǎn)、至少能處理3PB數(shù)據(jù)量。通過hadoop自身的balancer命令行工具,可以完成傾斜探測(cè)和自動(dòng)平衡功能,保證平滑擴(kuò)展和性能的線性增長。支持以Web圖形界面實(shí)現(xiàn)分布式平臺(tái)的節(jié)點(diǎn)批量自動(dòng)集群部署、監(jiān)控和管理功能。提供節(jié)點(diǎn)的動(dòng)態(tài)添加、刪除接口,當(dāng)數(shù)據(jù)容量或者計(jì)算資源不足時(shí),支持通過橫向添加同等配置的服務(wù)器的方式,為系統(tǒng)進(jìn)行在線擴(kuò)容??梢酝ㄟ^Cloudera Manager 來實(shí)現(xiàn)需要的功能。 可靠性和可用性要求不允許存在單點(diǎn)故障,應(yīng)采用高可靠設(shè)計(jì)架構(gòu),任一節(jié)點(diǎn)出現(xiàn)故障時(shí),不影響應(yīng)用的正常運(yùn)行,并在監(jiān)控頁面上對(duì)錯(cuò)誤狀態(tài)進(jìn)行顯示標(biāo)識(shí)。說明任一節(jié)點(diǎn)故障后的處理機(jī)制,以及各環(huán)節(jié)處理的延時(shí),同時(shí)說明集群允許多少個(gè)節(jié)點(diǎn)同時(shí)發(fā)生問題。hadoop 平臺(tái)本身的處理方式?jīng)Q定了不會(huì)存在單點(diǎn)故障,出現(xiàn)故障的處理時(shí)延在秒級(jí),默認(rèn)有3個(gè)備份,因此允許兩個(gè)節(jié)點(diǎn)同時(shí)發(fā)生問題。HDFS的高可用性可以通過兩種方式實(shí)現(xiàn),一種是NFS方案;還有一種是QJM的方案。Cloudera企業(yè)版推薦客戶使用QJM的方案。在通過QJM方式配置HDFS高可用性前,你需要了解或準(zhǔn)備以下事項(xiàng): Standby NameNode和Primary NameNode必須具有相同的硬件配置,包括CPU、內(nèi)存和磁盤大小。 Cloudera推薦你把JournalNode部署在元數(shù)據(jù)節(jié)點(diǎn)上(Primary NameNode、Standby NameNode、JobTracker等) 為避免某個(gè)機(jī)架成為單點(diǎn)故障,高可用性配置中的任一節(jié)點(diǎn)(Primary NameNode、Standby NameNode、JobTracker和Backup JobTracker)不能和高可用性配置中的其他節(jié)點(diǎn)位于同一機(jī)架上。 你需要決定是否啟用自動(dòng)故障恢復(fù)。如果自動(dòng)故障恢復(fù)被啟用,你必須已在集群中安裝了ZooKeeper組件,并指定一個(gè)ZooKeeper quorum來處理自動(dòng)故障恢復(fù)。ZooKeeper組必須包含奇數(shù)個(gè)節(jié)點(diǎn),且必須包含至少三個(gè)節(jié)點(diǎn)。 如果高可用性被啟用,則集群內(nèi)不必有secondary namenode或其他檢查點(diǎn)的服務(wù)。原因在于Standby NameNode可提供此類檢查點(diǎn)的服務(wù)。 如果你有非高可用性集群且在HDFS中存有數(shù)據(jù),則你需要決定在啟用高可用性時(shí)是否保留這些HDFS數(shù)據(jù)。如果你需要進(jìn)行這一操作,你需要知道如下限制:167。 來自非高可用性集群的DataNode和NameNode不可從集群中刪除。167。 來自非高可用性集群的DataNode和NameNode在啟用高可用性后,不可從之前所在機(jī)架中刪除。167。 來自非高可用性集群的DataNode的之前所在目錄不可被刪除。 如果你選擇使用Quorum Journal Manager(QJM),則你必須決定QJM集群中有多少節(jié)點(diǎn)。節(jié)點(diǎn)數(shù)量決定了集群是如何容錯(cuò)的。QJM集群中允許失敗且失敗后可繼續(xù)提供服務(wù)的節(jié)點(diǎn)數(shù)量根據(jù)以下算法計(jì)算:(N 1) / 2例如,如果集群中有5個(gè)JournalNode,則允許失敗的節(jié)點(diǎn)數(shù)量是 2,且失敗后可繼續(xù)提供服務(wù)。例如,如果集群中有3個(gè)JournalNode,則允許失敗且的節(jié)點(diǎn)數(shù)量是1,且失敗后可繼續(xù)提供服務(wù)。SAP HANA搭建方式也采取集群架構(gòu),每個(gè)集群中有一至多個(gè)備用節(jié)點(diǎn),當(dāng)工作節(jié)點(diǎn)出現(xiàn)問題是,備用節(jié)點(diǎn)會(huì)主動(dòng)接管其工作,保證前端業(yè)務(wù)的連續(xù)性。發(fā)生切換過程時(shí),通過HANA Stuido可以監(jiān)控到各個(gè)節(jié)點(diǎn)的狀態(tài),查看整個(gè)切換過程。平臺(tái)軟件中某一部分功能出錯(cuò)不應(yīng)導(dǎo)致其他功能出錯(cuò)。實(shí)現(xiàn)容錯(cuò)處理,能夠?qū)Σ僮魅藛T的誤操作進(jìn)行提示。并可以監(jiān)控系統(tǒng)的運(yùn)行情況,提高平臺(tái)的可靠性,從而提高業(yè)務(wù)運(yùn)營的水平,保證服務(wù)質(zhì)量。智能化參數(shù)驗(yàn)證當(dāng)用戶在配置過程中,部分參數(shù)配置值有問題時(shí),Cloudera Manager會(huì)產(chǎn)生錯(cuò)誤提示,以幫助用戶更合理的修改參數(shù)。實(shí)現(xiàn)數(shù)據(jù)的安全與完整保障,平臺(tái)保證穩(wěn)定可靠的運(yùn)行,在平臺(tái)系統(tǒng)出現(xiàn)問題時(shí),應(yīng)保證數(shù)據(jù)的完整、可恢復(fù)以及事務(wù)的完整性??梢酝ㄟ^平臺(tái)本身的快照和備份恢復(fù)功能來達(dá)到要求。系統(tǒng)可用度:%,系統(tǒng)可用度=系統(tǒng)無故障運(yùn)行時(shí)間/(系統(tǒng)無故障運(yùn)行時(shí)間+系統(tǒng)故障維護(hù)時(shí)間)。通過在主機(jī)、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用等多個(gè)層面設(shè)置高可用性,可以將系統(tǒng)可用度提升到這個(gè)級(jí)別。系統(tǒng)應(yīng)支持備份與恢復(fù)功能(包括主機(jī)、操作系統(tǒng)、數(shù)據(jù)庫與應(yīng)用軟件等),數(shù)據(jù)備份和恢復(fù)方案要保證數(shù)據(jù)的完整性,備份和恢復(fù)的有效性。應(yīng)用軟件恢復(fù)時(shí)間不超過2小時(shí)。平臺(tái)內(nèi)部的數(shù)據(jù)不可用(數(shù)據(jù)問題)有以下幾種錯(cuò)誤可能:硬件故障是分布式系統(tǒng)中最常見的錯(cuò)誤,恢復(fù)的成本相對(duì)較低;用戶、應(yīng)用錯(cuò)誤導(dǎo)致的數(shù)據(jù)不可用比較少見,修復(fù)的代價(jià)稍高;數(shù)據(jù)中心失效導(dǎo)致的數(shù)據(jù)部可用問題更少見,恢復(fù)的成本也最高。Cloudera平臺(tái)中的有全方位的數(shù)據(jù)備份策略,保障數(shù)據(jù)的高可靠性,有三個(gè)維度來保障數(shù)據(jù)問題導(dǎo)致的數(shù)據(jù)的不可用:? HDFS固有的分片冗余技術(shù)Hadoop在設(shè)計(jì)是就已經(jīng)考慮集群的容錯(cuò),包含磁盤、節(jié)點(diǎn)、網(wǎng)絡(luò)和機(jī)柜錯(cuò)誤,任何單一設(shè)備的故障不會(huì)導(dǎo)致數(shù)據(jù)的不可用,而且HDFS會(huì)觸發(fā)自動(dòng)的數(shù)據(jù)分片恢復(fù)過程。另外在數(shù)據(jù)應(yīng)用的設(shè)計(jì)中,也應(yīng)該設(shè)計(jì)一定的數(shù)據(jù)存儲(chǔ)策略,如下圖:在整個(gè)數(shù)據(jù)流圖中,包含原始數(shù)據(jù)、數(shù)據(jù)落地區(qū)、數(shù)據(jù)使用區(qū)和歸檔區(qū),每個(gè)區(qū)域都有特定的存儲(chǔ)周期。? HDFS的快照、權(quán)限控制以及回收站功能快照是指保存特定時(shí)間點(diǎn)的系統(tǒng)狀況,之后如果發(fā)生用戶或者應(yīng)用的誤操作,可以通過之前保存的快照數(shù)據(jù)恢復(fù)。在Cloudera管理平臺(tái)中可以非常簡(jiǎn)單地進(jìn)行快照創(chuàng)建、恢復(fù)以及刪除快照,也可以配置快照任務(wù)。? 數(shù)據(jù)中心間的遠(yuǎn)程災(zāi)備功能Cloudera提供了BDR管理界面方便用戶進(jìn)行HDFS,Hive,Impala的數(shù)據(jù)備份功能。BDR提供了全量數(shù)據(jù)備份和增量備份的功能。系統(tǒng)采用高可用性集群方案,應(yīng)能提供724持續(xù)服務(wù),詳細(xì)描述應(yīng)用層和數(shù)據(jù)層面的集群機(jī)制、負(fù)載均衡或切換機(jī)制,并闡述對(duì)主流操作系統(tǒng)和集群方式的支持方式。詳細(xì)內(nèi)容請(qǐng)參考可靠性和可用性要求部分 開放性和兼容性要求支持Hadoop發(fā)布的多個(gè)版本,要求支持部署包括但不限于Hbase,Hive,Oozie、Spark、Yarn、Sqoop、ZooKeeper等各種知名的Hadoop開源組件。我公司的系統(tǒng)實(shí)施基于開源的Hadoop技術(shù),首推Cloudera的發(fā)行版本,若甲方有特殊要求也可以選用其它發(fā)行版本。在 Cloudera的發(fā)行版本理Hbase,Hive,Oozie、Spark、Yarn、Sqoop、ZooKeeper等各種知名的Hadoop開源組件Hadoop系統(tǒng)應(yīng)支持開源社區(qū)的標(biāo)準(zhǔn),快速跟進(jìn)開源社區(qū)的成果,始終保持和開源的兼容性,同時(shí)提供系統(tǒng)升級(jí)部署實(shí)施。如對(duì)開源社區(qū)有代碼貢獻(xiàn),應(yīng)提供相應(yīng)證明資料。Cloudera軟件開源免費(fèi)并與Apache社區(qū)同步,用戶無限制使用,保證Hadoop基本功能持續(xù)可用,不會(huì)被廠家綁定。作為第一個(gè)商業(yè)化Hadoop的軟件供應(yīng)商,在所有商業(yè)化的Hadoop里,Cloudera的Committer數(shù)量也是最多的。Cloudera有超過80位的Committer,是世界上擁有最多Committer的Hadoop廠商。Cloudera還奉獻(xiàn)了約40%的Hadoop代碼修改。系統(tǒng)中組件具有良好的跨平臺(tái)特性,支持紅旗Linux服務(wù)器版操作系統(tǒng)(Red Flag Asianux Server)的最新版本。支持Red Flag以及Asianux Server支持常見軟件產(chǎn)品集成。1) 支持各種常見的大數(shù)據(jù)分析軟件,例如SAS、SPSS、Murex, Algorithmics, Sugard, Calypso, TillingHast,MicroStrategy, IBM Cognos等。2) 支持常見的數(shù)據(jù)可視化工具集成,例如Tableau,Pentaho,Zoomdata等
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1