正文內(nèi)容

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯-免費閱讀

2025-02-11 14:15 上一頁面

下一頁面

　　

【正文】如果這些文件損壞了，整個HDFS實例都將失效。如果某個Datanode節(jié)點上的空閑空間低于特定的臨界點，按照均衡策略系統(tǒng)就會自動地將數(shù)據(jù)從這個Datanode移動到其他空閑的Datanode。常見的三種出錯情況是：Namenode出錯, Datanode出錯和網(wǎng)絡(luò)割裂(network partitions)。在同一個目錄中創(chuàng)建所有的本地文件并不是最優(yōu)的選擇，這是因為本地文件系統(tǒng)可能無法高效地在單個目錄中支持大量的文件。 Namenode在內(nèi)存中保存著整個文件系統(tǒng)的名字空間和文件數(shù)據(jù)塊映射(Blockmap)的映像。每個數(shù)據(jù)塊都有一個指定的最小副本數(shù)。當前，這里介紹的默認副本存放策略正在開發(fā)的過程中。這種策略設(shè)置可以將副本均勻分布在集群中，有利于當組件失效情況下的負載均衡。HDFS采用一種稱為機架感知(rackaware)的策略來改進數(shù)據(jù)的可靠性、可用性和網(wǎng)絡(luò)帶寬的利用率。副本系數(shù)可以在文件創(chuàng)建的時候指定，也可以在之后改變。 Namenode負責維護文件系統(tǒng)的名字空間，任何對文件系統(tǒng)名字空間或?qū)傩缘男薷亩紝⒈籒amenode記錄下來。這種架構(gòu)并不排斥在一臺機器上運行多個Datanode，只不過這樣的情況比較少見。它也負責確定數(shù)據(jù)塊到具體Datanode節(jié)點的映射。這種特性方便了HDFS作為大規(guī)模數(shù)據(jù)應用平臺的推廣。這一假設(shè)簡化了數(shù)據(jù)一致性問題，并且使高吞吐量的數(shù)據(jù)訪問成為可能。為了提高數(shù)據(jù)的吞吐量，在一些關(guān)鍵方面對POSIX的語義做了一些修改。二、前提和設(shè)計目標硬件錯誤硬件錯誤是常態(tài)而不是異常。它和現(xiàn)有的分布式文件系統(tǒng)有很多共同點。 one can create and remove files, move a file from one directory to another, or rename a file. HDFS does not yet implement user quotas or access permissions. HDFS does not support hard links or soft links. However, the HDFS architecture does not preclude implementing these features. The NameNode maintains the file system namespace. Any change to the file system namespace or its properties is recorded by the NameNode. An application can specify the number of replicas of a file that should be maintained by HDFS. The number of copies of a file is called the replication factor of that file. This information is stored by the NameNode. Data Replication HDFS is designed to reliably store very large files across machines in a large cluster. It stores each file as a sequence of blocks。HDFS在最開始是作為Apache Nutch搜索引擎項目的基礎(chǔ)架構(gòu)而開發(fā)的。HDFS的設(shè)計中更多的考慮到了數(shù)據(jù)批處理，而不是用戶交互處理。一個單一的HDFS實例應該能支撐數(shù)以千萬計的文件。將計算移動到數(shù)據(jù)附近，比之將數(shù)據(jù)移動到應用所在顯然更好。HDFS暴露了文件系統(tǒng)的名字空間，用戶能夠以文件的形式在上面存儲數(shù)據(jù)。HDFS采用Java語言開發(fā)，因此任何支持Java的機器都可以部署Namenode或Datanode。文件系統(tǒng)名字空間的層次結(jié)構(gòu)和大多數(shù)現(xiàn)有的文件系統(tǒng)類似：用戶可以創(chuàng)建、刪除、移動或重命名文件。為了容錯，文件的所有數(shù)據(jù)塊都會有副本。副本存放: 最最開始的一步副本的存放是HDFS可靠性和性能的關(guān)鍵。通過一個機架感知的過程，Namenode可以確定每個Datanode所屬的機架id。于此同時，因為數(shù)據(jù)塊只放在兩個（不是三個）不同的機架上，所以此策略減少了讀取數(shù)據(jù)時需要的網(wǎng)絡(luò)傳輸總帶寬。處于安全模式的Namenode是不會進行數(shù)據(jù)塊的復制的。例如，在HDFS中創(chuàng)建一個文件，Namenode就會在Editlog中插入一條記錄來表示；同樣地，修改文件的副本系數(shù)也將往Editlog插入一條記錄。 Datanode將HDFS數(shù)據(jù)以文件的形式存儲在本地的文件系統(tǒng)中，它并不知道有關(guān)HDFS文件的信息。一個遠程過程調(diào)用(RPC)模型被抽象出來封裝ClientProtocol和Datanodeprotocol協(xié)議。Datanode的dead可能會引起一些數(shù)據(jù)塊的副本系數(shù)低于指定值，Namenode不斷地檢測這些需要復制的數(shù)據(jù)塊，一旦發(fā)現(xiàn)就啟動復制操作。當客戶端創(chuàng)建一個新的HDFS文件，會計算這個文件每個數(shù)據(jù)塊的校驗和，并將校驗和作為一個單獨的隱藏文件保存在同一個HDFS名字空間下。這種多副本的同步操作可能會降低Namenode每秒處理的名字空間事務數(shù)量。數(shù)據(jù)完整性從某個Datanode獲取的數(shù)據(jù)塊有可能是損壞的，損壞可能是由Datanode的存儲設(shè)備錯誤、網(wǎng)絡(luò)錯誤或者軟件bug造成的。Namenode通過心跳信號的缺失來檢測這一情況，并將這些近期不再發(fā)送心跳信號Datanode標記為dead，不會再將新的IO請求發(fā)給它們?？蛻舳送ㄟ^一個可配置的TCP端口連接到Namenode，通過ClientProtocol協(xié)議與Namenode交互。這個過程稱為一個檢查點(checkpoint)。六、文件系統(tǒng)元數(shù)據(jù)的持久化 Namenode上保存著HDFS的名字空間。如果一個HDFS集群跨越多個數(shù)據(jù)中心，那么客戶端也將首先讀本地數(shù)據(jù)中心的副本。這種策略減少了機架間的數(shù)據(jù)傳輸，這就提高了寫操作的效率。大型HDFS實例一般運行在跨越多個機架的計算機組成的集群上，不同機架上的兩臺機器之間的通訊需要經(jīng)過交換機。接收到心跳信號意味著該Datanode節(jié)點工作正常。五、數(shù)據(jù)復制 HDFS被設(shè)計成能夠在一個大集群中跨機器可靠地存儲超大文件。四、文件系統(tǒng)的名字空間 (namespace) HDFS支持傳統(tǒng)的層次型文件組織結(jié)構(gòu)。 Namenode和Datanode被設(shè)計成可以在普通的商用機器上運行。Namenode是一個中心服務器，負責管理文件系統(tǒng)的名字空間(namespace)以及客戶端對文件的訪問。 “移動計算比移動數(shù)據(jù)更劃算” 一個應用請求的計算，離它操作的數(shù)據(jù)越近就越高效，在數(shù)據(jù)達到海量級別的時候更是如此。因此，HDFS被調(diào)節(jié)以支持大文件存儲。因此錯誤檢測和快速、自動的恢復是HDFS最核心的架構(gòu)目標。HDFS能提供高吞吐量的數(shù)據(jù)訪問，非常適合大規(guī)模數(shù)據(jù)集上的應用。江漢大學畢業(yè) 論文（設(shè) 計）外文翻譯原文來源 The Hadoop Distributed File System: Architecture and Design 中文譯文 Hadoop分布式文件系統(tǒng)：架構(gòu)和設(shè)計姓名 XXXX 學號 200708202137 2013年 4月 8 日英文原文The Hadoop Distributed File System: Architecture and DesignSource：Introduction The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on modity hardware. It has many similarities with existing distributed file systems. However, the differences from other distributed file systems are significant. HDFS is highly faulttolerant and is designed to be deployed on lowcost hardware. HDFS provides high throughput access to application data and is suitable for applications that have large data sets. HDFS relaxes a few POSIX requirements to enable streaming access to file system data. HDFS was originally built as infrastructure for the Apache Nutch web search engine project. HDFS is part of the Apache Hadoop Core project. The project URL is Assumptions and Goals Hardware Failure Hardware failure is the norm rather than the exception. An HDFS instance may consist of hundreds or thousands of server machines, each storing part of the file system’s data. The fact that there are a huge number of ponents and that each ponent has a nontrivial probability of failure means that some ponent of HDFS is always nonfunctional. Therefore, detection of faults and quick, automatic recovery from them is a core architectural goal of HDFS. Streaming Data Access Applications that run on HDFS need streaming access to their data sets. They are not general purpose applications that typically run on general purpose file systems. HDFS is designed more for batch processing rather than interactive use by users. The emphasis is on high throughput of data access rather than low latency of data access. POSIX imposes many hard requirements that are not needed for applications that are targeted for HDFS. POSIX semantics in a few key areas has been traded to increase data throughput rates. Large Data Sets Applications that run on HDFS have large data sets. A typical file in HDFS is gigabytes to terabytes in size. Thus, HDFS is tuned to support large files. It should provide high aggregate data bandwidth and scale to hundreds of nodes in a single cluster. It should support tens of millions of files in a single instance. Simple Coherency Model HDFS applications need a writeoncereadmany access model for files. A file once created, written, and closed need not be changed. This assumption simplifies data coherency issues and enables high throughput data access. A Map/Reduce application or a web crawler application fits perfectly with this model. There is a plan to support appendingwrites to files in the future. “Moving Computation is Cheaper than Moving Data” A putation requested by an application is much more efficient if

點擊復制文檔內(nèi)容

環(huán)評公示相關(guān)推薦

基于javaweb的搜索引擎的實現(xiàn)報告模板-資料下載頁

【摘要】仁愛學院長實習設(shè)計說明書題目:基于Javaweb的搜索引擎的實現(xiàn)系別：專業(yè)班級：學號：

2024-11-07 22:01

專業(yè)資源與搜索引擎-資料下載頁

【摘要】網(wǎng)絡(luò)學術(shù)資源檢索專業(yè)資源網(wǎng)站檢索搜索引擎的檢索專業(yè)資源網(wǎng)站檢索專業(yè)信息網(wǎng)站通過英特網(wǎng)向信息用戶提供圖書、期刊、視頻、音頻等數(shù)字信息資源，已成為獲取學術(shù)資源與專業(yè)信息的重要來源。國家科技圖書文獻中心中國高等教育文獻保障系統(tǒng)中國高校人文社會科學文獻中心專業(yè)資源網(wǎng)站檢索國家科技圖書文

2025-08-04 10:46

一個java搜索引擎的實現(xiàn)論文-資料下載頁

【摘要】一個Java搜索引擎的實現(xiàn)第1部分:網(wǎng)絡(luò)爬蟲自己動手寫一個搜索引擎，想想這有多cool：在界面上輸入關(guān)鍵詞，點擊搜索，得到自己想要的結(jié)果；那么它還可以做什么呢？也許是自己的網(wǎng)站需要一個站內(nèi)搜索功能，抑或是對于硬盤中文檔的搜索，這里說明使用Java語言而不是C/C++等其它語言的原因，因為Java中提供了對于網(wǎng)絡(luò)編程眾多的基礎(chǔ)包和類，比如URL類、InetAdd

2025-06-26 18:45

搜索引擎及搜索技巧-資料下載頁

【摘要】（SearchEngine）搜索引擎是指用于因特網(wǎng)信息查找的網(wǎng)絡(luò)工具一、搜索引擎的發(fā)展歷史最早的搜索引擎出現(xiàn)于1994年4月。斯坦福大學的兩名博士生，美籍華人楊致遠和美國人DavidFilo共同創(chuàng)辦了超級目錄索引雅虎（YAHOO），并成功地使用搜索引擎的概念深入人心。??????

2025-05-13 10:00

nuwaaa搜索引擎-資料下載頁

【摘要】信息檢索與分析利用第3章搜索引擎1第3章搜索引擎概述典型的搜索引擎搜索引擎的檢索技巧信息檢索與分析利用第3章搜索引擎2概述基本概念I(lǐng)nter的主要信息服務類型搜索引擎的類型信息檢索與分析利用第3章搜索引擎31．搜索引擎搜

2025-08-04 09:37

kegaaa搜索引擎-資料下載頁

【摘要】所有搜索引擎的祖先，是1990年由Montreal的McGillUniversity三名學生（AlanEmtage、PeterDeutsch、BillWheelan）發(fā)明的Archie（ArchieFAQ）。AlanEmtage等想到了開發(fā)一個可以用文件名查找文件的系統(tǒng)，于是便有了Archie。Archie是第一個自動索引互聯(lián)網(wǎng)上匿名

2025-08-04 09:55

搜索引擎優(yōu)化-資料下載頁

【摘要】搜索引擎優(yōu)化百度版影響搜索引擎優(yōu)化的因素?域名及空間?網(wǎng)站建設(shè)?網(wǎng)站運營域名及空間?域名盡量簡短、與網(wǎng)站主題有關(guān)聯(lián)?域名后綴盡量常見如、、等?查看域名是否有被懲罰歷史?服務器空間要穩(wěn)定、訪問速度要快?相同服務器要看有沒有相同IP的網(wǎng)站被懲罰網(wǎng)站建設(shè)?對用戶體

2025-08-04 15:47

搜索引擎(3)-資料下載頁

【摘要】搜索引擎?1、什么是搜索引擎?2、搜索引擎的工作原理?3、搜索引擎的發(fā)展過程?4、搜索引擎的類型及使用技巧什么是搜索引擎(p54)?搜索引擎是指通過網(wǎng)絡(luò)機器人在網(wǎng)際某一空間、某一領(lǐng)域中尋找和發(fā)現(xiàn)有用或相關(guān)的信息，并在此基礎(chǔ)上建立檢索數(shù)據(jù)庫，通過簡單友好的界面提供給用戶查詢的工具。

2025-08-04 17:13

iqraaa搜索引擎-資料下載頁

【摘要】獲取信息的方法1搜索引擎主流搜索引擎搜索引擎(searchengine)是指根據(jù)一定的策略、運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息，在對信息進行組織和處理后，為用戶提供檢索服務的系統(tǒng)。搜索信息的機器2常用的檢索工具兩種檢索方法?目錄檢索?關(guān)鍵字檢索Contents3Cont

2025-08-04 09:44

web圖片搜索引擎設(shè)計-資料下載頁

【摘要】Web圖片搜索引擎設(shè)計——基于文本的圖片信息提取大綱?圖片檢索技術(shù)簡介?我們設(shè)計的系統(tǒng)總體結(jié)構(gòu)?圖片文字信息提取?無用圖片過濾?一些統(tǒng)計規(guī)律?結(jié)合文本與內(nèi)容的方法（后期打算）圖片檢索技術(shù)分類?基于文本?利用某種提取方法獲得與圖片內(nèi)容相關(guān)的文本信息，利用傳統(tǒng)文本檢索方法提供檢索。?

2025-08-01 12:34

搜索引擎銷售協(xié)議-資料下載頁

【摘要】搜索引擎銷售協(xié)議搜索引擎銷售協(xié)議搜索引擎銷售協(xié)議本合同用于代理商向客戶銷售_______公司的搜索引擎登錄服務。如有任何附加合同，請客戶參照本合同中關(guān)于服務詳情與收費報價的部分。本...

2024-12-16 23:11

web圖片搜索引擎設(shè)計-資料下載頁

2025-07-24 16:18

搜索引擎現(xiàn)狀與趨勢-資料下載頁

【摘要】我們堅持網(wǎng)絡(luò)營銷實戰(zhàn)經(jīng)驗分享我們堅持面向廣大企業(yè)實際需求搜索引擎營銷市場發(fā)展趨勢Beijing|Shanghai|Guangzhou鄒蕾Lily艾瑞咨詢聯(lián)合總裁中國網(wǎng)絡(luò)營銷市場現(xiàn)狀來自于實體經(jīng)濟下的增長挑戰(zhàn)Source:iResearch，-20%0%

2025-08-16 02:25

基于java技術(shù)搜索引擎的研究及實現(xiàn)-資料下載頁

【摘要】基于JAVA技術(shù)的搜索引擎的研究與實現(xiàn)網(wǎng)絡(luò)中的資源非常豐富，但是如何有效的搜索信息卻是一件困難的事情。建立搜索引擎就是解決這個問題的最好方法。本文首先詳細介紹了基于英特網(wǎng)的搜索引擎的系統(tǒng)結(jié)構(gòu)，然后從網(wǎng)絡(luò)機器人、索引引擎、Web服務器三個方面進行詳細的說明。為了更加深刻的理解這種技術(shù)，本人還親自實現(xiàn)了一個自己的搜索引擎——新聞搜索引擎。新聞搜索引擎是從指定的Web頁面中按照超連接進行

2025-06-19 17:35

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯-免費閱讀

基于javaweb的搜索引擎的實現(xiàn)報告模板-資料下載頁

專業(yè)資源與搜索引擎-資料下載頁

一個java搜索引擎的實現(xiàn)論文-資料下載頁

搜索引擎及搜索技巧-資料下載頁

nuwaaa搜索引擎-資料下載頁

kegaaa搜索引擎-資料下載頁

搜索引擎優(yōu)化-資料下載頁

搜索引擎(3)-資料下載頁

iqraaa搜索引擎-資料下載頁

web圖片搜索引擎設(shè)計-資料下載頁

搜索引擎銷售協(xié)議-資料下載頁

web圖片搜索引擎設(shè)計-資料下載頁

搜索引擎現(xiàn)狀與趨勢-資料下載頁

基于java技術(shù)搜索引擎的研究及實現(xiàn)-資料下載頁

外文數(shù)據(jù)庫及學術(shù)搜索引擎-資料下載頁

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯(已修改)

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯(編輯修改稿)

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯-wenkub.com

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯(已改無錯字)

全文搜索引擎的設(shè)計與實現(xiàn)-外文翻譯-資料下載頁