正文內(nèi)容

谷歌大規(guī)模排序?qū)嶒灥臍v史[翻譯]-文庫吧資料

2025-06-21 22:10本頁面

　　

【正文】 B/s/worker)1PB, , TB/min, MB/s/workerThis year we enjoyed faster networking and started to pay more attention to permachine efficiency, particularly in I/O. We made sure that all our disk I/Os operations were performed in large 2MB blocks versus sometimes as small as 64kB blocks. We used SSDs for part of the data. That got us the first Petasort in under an hour — 33 minutes, to be exact — and weDataflow.為了減少人的影響，我們采用了一種叫做減少殘余碎片的動態(tài)分區(qū)技術。這也是第一次，我們驗證了輸出的結(jié)果是正確的。我們不再有我們遇到過的GFS文件污染的問題。在前幾年，當我們讀/寫1PB GFS文件時，實際上混排的數(shù)據(jù)只有300TB，因為前幾年的數(shù)據(jù)是用ASCII格式壓縮好的。任何事情的缺失都會造成數(shù)據(jù)丟失的高風險。我們曾經(jīng)在這個博客里記錄過結(jié)果。blogged about the result here. The bottleneck ended up being writing the threeway replicated output GFS, which was the standard we used at Google at the time. Anything less would create a high risk of data loss.2008年我們第一次把注意力集中于調(diào)整。不幸的是，這個基準所使用的文件格式?jīng)]有任何嵌入式校驗供MapReduce使用(谷歌使用的典型MapReduce的文件是有嵌入式校驗的)。我們懷疑這是因為我們用來存儲輸入和輸出的文件是GFS格式(谷歌文件系統(tǒng))的緣故。在那個時候，我們最高興的是這個程序最終完成了排序，盡管我們對排序的結(jié)果有一些疑問(我們沒有驗證排序結(jié)果的正確性)。這是我們有機會去“燃燒”這個cluster，延伸硬件的限制，放棄一些硬盤，而使用一些真正昂貴的設備，了解系統(tǒng)的性能，并贏得(非正式)排序基準。結(jié)合適當?shù)?字典)分區(qū)功能，MapReduce的輸出是一組包含了最終排序數(shù)據(jù)的文件序列。而我們從未正式參加過比賽。tracks official winners for this benchmark. We never entered the official petition.那時候，GraySort是大型排序基準的選擇。These days, GraySort is the large scale sorting benchmark of choice. In GraySort, you must sort at least 100TB of data (as 100byte records with the first 10 bytes being the key), lexicographically, as fast as possible. The site然而，真正有趣的事情在我們進一步擴大數(shù)據(jù)規(guī)模后才開始。reports a TeraSort result. Engineers run 1TB or 10TB sorts as regression tests on a regular basis, because obscure bugs tend to be more visible on a large scale. However, the real fun begins when we increase the scale even further. In this post I’ll talk about our experience with some petabytescale sorting experiments we did a few years ago, including what we believe to be the largest MapReduce job ever: a 50PB sort.我們最初的Map

點擊復制文檔內(nèi)容

法律信息相關推薦

大規(guī)模的海水運動3-文庫吧資料

【摘要】《大規(guī)模的海水運動》（課時）的教學設計設計的依據(jù)[課程標準分析]這是課程標準中“運用地圖，歸納世界洋流分布規(guī)律，說明洋流對地理環(huán)境的影響”這一條標準的要求。分析這條標準，其中包含的具體要求如下：1、學習應落實在地圖上，其中最主要的是圖——“世界表層洋流的分布”；2、通過閱讀“世界表層洋流的分布”圖，歸納世界表層洋流分布的一般規(guī)律，即

2024-12-13 05:06

大規(guī)模的海水運動說課稿范文-文庫吧資料

【摘要】《大規(guī)模的海水運動》說課稿范文一、教材分析：確立依據(jù)：教學大綱的規(guī)定，新課程標準的要求，教學內(nèi)容及學生的實際情況 1、教材的地位和作用本節(jié)是學生在學習了全球氣壓帶和風帶的分布與自然界的水...

2024-12-06 00:47

高校大規(guī)?？荚嚨陌才欧桨竷?yōu)化-文庫吧資料

【摘要】第九屆華東地區(qū)大學生數(shù)學建模邀請賽論文高校大規(guī)模考試的安排方案優(yōu)化摘要本文對高校大規(guī)?？荚嚨暮侠戆才艈栴}進行了研究和探討。由于高校在校學生的增多，學校在安排期終考試等大型考試時總會碰到各種難題，如，1、必須保證不會出現(xiàn)同一學生有兩門考試時間沖突的情況；2、盡量使一個學生的各門考試間隔較為均衡；3、合理利用容量不同的考場；4、使每個監(jiān)考老師的監(jiān)考日程比較平均

2025-06-16 02:33

展訊通信國內(nèi)最大規(guī)模實驗室落戶深圳-文庫吧資料

【摘要】展訊通信國內(nèi)最大規(guī)模實驗室落戶深圳，將針對客戶提供免費服務2014年9月5日，展訊通信在深圳英唐大廈舉行深圳創(chuàng)新實驗工程中心落成典禮，包括深圳市科創(chuàng)委副主任劉錦女士、展訊通信有限公司董事長兼CEO李力游博士、酷派集團常務副總裁李旺、中興通訊副總裁李迎風登臺發(fā)表演講致詞，多家深圳本土手機制造商前來出席活動。以下為演講實錄：深圳市科創(chuàng)委副主任劉錦女士：非常高興我們展訊今天舉辦這樣

2025-04-23 00:50

家具業(yè)大規(guī)模定制的設計方法-文庫吧資料

【摘要】家具業(yè)大規(guī)模定制的設計方法困擾目前國內(nèi)家具業(yè)和整個制造業(yè)的難題是：小批量多品種與大批量生產(chǎn)之間的矛盾。在這個充滿個性化的時代，人們都在追求個性，強調(diào)個性，尊重個性，而在工業(yè)化的制造技術支撐下的制造業(yè)卻更適合高效快速生產(chǎn)大批量小品種的產(chǎn)品。當這種矛盾突顯出來時，業(yè)內(nèi)開始尋找解決辦法--大規(guī)模定制成為一種必然，并迅速在制造業(yè)擴展開來。　　大規(guī)模定制是企業(yè)采用技術和管理手段實現(xiàn)對每個顧客

2025-04-14 22:42

大規(guī)模的海水運動考試提綱-文庫吧資料

【摘要】第三章地球上的水第二節(jié)大規(guī)模的海水運動【高考目標定位】最新考綱目標在線1、洋流的類型2洋流的分布規(guī)律及應用3、洋流對地理環(huán)境的影響【考綱知識梳理】一、世界好樣表層洋流的分布：海洋中的海水，常年比較穩(wěn)定地沿著一定的方向做大規(guī)模的流動，叫做洋流。暖流：從水溫較高的海區(qū)流向水溫較低的海區(qū)

2025-03-31 00:25

云計算服務的大規(guī)模計算網(wǎng)絡-文庫吧資料

【摘要】云計算服務的大規(guī)模計算網(wǎng)絡2010年04月21日文/李延峰如果說提供云計算這種巨型計算服務的IT架構(gòu)必然是集結(jié)了大規(guī)?；A資源的數(shù)據(jù)中心“超級航母”，它也必然要求大規(guī)模計算網(wǎng)絡與其相適應。?云計算IT資源供應模型云計算既然擁有近乎無限的計算、存儲、數(shù)據(jù)通信能力，那么提供云計算服務的IT架構(gòu)必然是集結(jié)了大規(guī)?；A資源的數(shù)據(jù)中心“超級航母”。云計算IT資

2025-05-22 01:12

大規(guī)模項目中的相關問題-文庫吧資料

【摘要】e-businessUniversityCentreofe-businessInnovation::VancouverIBMPacificDevelopmentCentreJoHardjasa.大規(guī)模項目中管理問題大規(guī)模項目中的管理問題?大型項目面臨的挑戰(zhàn)?需要考慮的重點?項目組織–結(jié)構(gòu)–

2025-02-15 18:41

大規(guī)模的海水運動-課件-文庫吧資料

【摘要】珍珠港事件：１９４１年１２月７日，日軍在兩個小時內(nèi)出動３５０余架飛機偷襲珍珠港的美軍基地，炸沉炸傷美軍艦艇４０余艘，炸毀飛機２００多架，斃傷美軍４０００多人，美軍主力戰(zhàn)艦“亞利桑那”號被１７６０磅重的炸彈擊中沉沒，艦上１１７７名將士全部殉難。第二節(jié)大規(guī)模的海水運動1、洋流：海洋表層的水，常年比較穩(wěn)定地沿著一定的方向作

2024-08-29 01:14

大規(guī)模的海水運動(3)-文庫吧資料

【摘要】1912年4月10日，泰坦尼克號從英國南安普敦（Southampton）出發(fā)，途經(jīng)法國瑟堡-奧克特維爾（Cherbourg-Octeville）以及愛爾蘭（此時為英屬）的昆士敦（Queenstown），計劃中的目的地為美國的紐約（NewYork），開始了這艘“夢幻客輪”的處女航。4月14日晚11點40分，泰坦尼克號在北大西洋撞上冰山，兩小時四

2025-05-18 18:00

大規(guī)模的海水運動(1)-文庫吧資料

【摘要】思考：古代，哥倫布從歐洲去美洲時，走了圖中A、B兩條不同的路線。有趣的是走距離較短的A路線用了37天，而走距離較長的B路線卻只用了22天。請思考原因。AB一、海水的運動形式波浪：潮汐：洋流：風浪是最常見的一種波浪。在風力作用下，海面波狀起伏。海嘯是由海底地震、火山爆發(fā)或風暴引起的巨浪。

2025-05-23 05:13

大規(guī)模的海水運動一-文庫吧資料

【摘要】1992年，一艘從中國出發(fā)的貨輪在太平洋上遭遇強烈風暴，船上一個裝滿塑料玩具鴨的集裝箱墜入大海，令人難以置信的是，其中1萬多只玩具鴨組成的鴨子艦隊在海洋上漂流了14年之后，于2020年到達英國海岸。第二節(jié)大規(guī)模的海水運動（一）‖世界海洋表層洋流的分布１．洋流海洋中

2024-12-01 11:39

大規(guī)模項目中的管理問題-文庫吧資料

【摘要】e-businessUniversityCentreofe-businessInnovation::VancouverIBMPacificDevelopmentCentreJoHardjasa大規(guī)模項目中的管理問題?大型項目面臨的挑戰(zhàn)?需要考慮的重點?項目組織–結(jié)構(gòu)–角色?團隊之間的溝

2025-02-15 18:50

大規(guī)模的海水運動(2)-文庫吧資料

【摘要】第二節(jié)大規(guī)模的海水運動(二)教學目標：1、復習檢查鞏固世界洋流分布的規(guī)律：副熱帶海區(qū)、副極地海區(qū)、環(huán)南極大陸海區(qū)和北印度洋海區(qū)等；2、理解掌握洋流對地理環(huán)境的影響：對氣候、對漁場、對航海、對海洋污染的影響等；3、了解厄爾尼諾現(xiàn)象和拉尼娜現(xiàn)象，海水的異常變化等知識。北赤道暖流

2025-05-18 18:00

大規(guī)模培訓干部思考-文庫吧資料

【摘要】大規(guī)模培訓干部思考 **區(qū)干部培訓工作適應經(jīng)濟社會發(fā)展的要求，緊緊圍繞區(qū)委、區(qū)政府提出的“打造經(jīng)濟強區(qū)，建設山水田園城市，構(gòu)建繁榮和諧**”三大目標，以改革創(chuàng)新為動力，著力創(chuàng)新培訓方式方法，在實...

2024-09-30 19:23