正文內(nèi)容

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(參考版)

2025-01-23 07:30本頁(yè)面

　　

【正文】七、通訊協(xié)議所有的 HDFS 通訊協(xié)議都是建立在 TCP/IP 協(xié)議之上。在同一個(gè)目錄中創(chuàng)建所有的本地文件并不是最優(yōu)的選擇，這是因?yàn)楸镜匚募到y(tǒng)可能無(wú)法高效地在單個(gè)目錄中支持大量的文件。它把每個(gè) HDFS 數(shù)據(jù)塊存儲(chǔ)在本地文件系統(tǒng)的一個(gè)單獨(dú)的文件中。在當(dāng)前實(shí)現(xiàn)中，檢查點(diǎn)只發(fā)生在 Namenode 啟動(dòng)時(shí)，在不久的將來(lái)將實(shí)現(xiàn)支持周期性的檢查點(diǎn)。當(dāng) Namenode 啟動(dòng)時(shí)，它從硬盤中讀取Editlog 和 FsImage，將所有 Editlog 中的事務(wù)作用在內(nèi)存中的 FsImage 上，并將這個(gè)新版本的 FsImage 從內(nèi)存中保存到本地磁盤上，然后刪除舊的 Editlog，因?yàn)檫@個(gè)舊的 Editlog 的事務(wù)都已經(jīng)作用在 FsImage 上了。 Namenode 在內(nèi)存中保存著整個(gè)文件系統(tǒng)的名字空間和文件數(shù)據(jù)塊映射(Blockmap)的映像。 Namenode 在本地操作系統(tǒng)的文件系統(tǒng)中存儲(chǔ)這個(gè) Editlog。對(duì)于任何對(duì)文件系統(tǒng)元數(shù)據(jù)產(chǎn)生修改的操作， Namenode 都會(huì)使用一種稱為 EditLog 的事務(wù)日志記錄下來(lái)。接下來(lái)它會(huì)確定還有哪些數(shù)據(jù)塊的副本沒(méi)有達(dá)到指定數(shù)目，并將這些數(shù)據(jù)塊復(fù)制到其他Datanode 上。每個(gè)數(shù)據(jù)塊都有一個(gè)指定的最小副本數(shù)。 Namenode 從所有的 Datanode 接收心跳信號(hào)和塊狀態(tài)報(bào)告。安全模式 Namenode 啟動(dòng)后會(huì)進(jìn)入一個(gè)稱為安全模式的特殊狀態(tài)。如果在讀取程序的同一個(gè)機(jī)架上有一個(gè)副本，那么就讀取該副本。當(dāng)前，這里介紹的默認(rèn)副本存放策略正在開(kāi)發(fā)的過(guò)程中。在這種策略下，副本并不是均勻分布在不同的機(jī)架上。機(jī)架的錯(cuò)誤遠(yuǎn)遠(yuǎn)比節(jié)點(diǎn)的錯(cuò)誤少，所以這個(gè)策略不會(huì)影響到數(shù)據(jù)的可靠性和可用性。在大多數(shù)情況下，副本系數(shù)是 3， HDFS 的存放策略是將一個(gè)副本存放在本地機(jī)架的節(jié)點(diǎn)上，一個(gè)副本放在同一機(jī)架的另一個(gè)節(jié)點(diǎn)上，最后一個(gè)副本放在不同機(jī)架的節(jié)點(diǎn)上。這種策略設(shè)置可以將副本均勻分布在集群中，有利于當(dāng)組件失效情況下的負(fù)載均衡。一個(gè)簡(jiǎn)單但沒(méi)有優(yōu)化的策略就是將副本存放在不同的機(jī)架上。在大多數(shù)情況下，同一個(gè)機(jī)架內(nèi)的兩臺(tái)機(jī)器間的帶寬會(huì)比不同機(jī)架的兩臺(tái)機(jī)器間的帶寬大。實(shí)現(xiàn)這個(gè)策略的短期目標(biāo)是驗(yàn)證它在生產(chǎn)環(huán)境下的有效性，觀察它的行為，為實(shí)現(xiàn)更先進(jìn)的策略打下測(cè)試和研究的基礎(chǔ)。 HDFS 采用一種稱為機(jī)架感知 (rackaware)的策略來(lái)改進(jìn)數(shù)據(jù)的可靠性、可用性和網(wǎng)絡(luò)帶寬的利用率。優(yōu)化的副本存放策略是 HDFS 區(qū)分于其他大部分分布式文件系統(tǒng)的重要特性。塊狀態(tài)報(bào)告包含了一個(gè)該 Datanode 上所有數(shù)據(jù)塊的列表。 Namenode 全權(quán)管理數(shù)據(jù)塊的復(fù)制，它周期性地從集群中的每個(gè) Datanode 接收心跳信號(hào)和塊狀態(tài)報(bào)告 (Blockreport)。副本系數(shù)可以在文件創(chuàng)建的時(shí)候指定，也可以在之后改變。每個(gè)文件的數(shù)據(jù)塊大小和副本系數(shù)都是可配置的。它將每個(gè)文件存儲(chǔ)成一系列的數(shù)據(jù)塊，除了最后一個(gè)，所有的數(shù)據(jù)塊都是同樣大小的。文件副本的數(shù)目稱為文件的副本系數(shù)，這個(gè)信息也是由 Namenode 保存的。 Namenode 負(fù)責(zé)維護(hù)文件系統(tǒng)的名字空間，任何對(duì)文件系統(tǒng)名字空間或?qū)傩缘男薷亩紝⒈?Namenode 記錄下來(lái)。當(dāng)前， HDFS 不支持用戶磁盤配額和訪問(wèn)權(quán)限控制，也不支持硬鏈接和軟鏈接。用戶或者應(yīng)用程序可以創(chuàng)建目錄，然后將文件保存在這些目錄里。 Namenode 是所有 HDFS元數(shù)據(jù)的仲裁者和管理者，這樣，用戶數(shù)據(jù)永遠(yuǎn)不會(huì)流過(guò) Namenode。這種架構(gòu)并不排斥在一臺(tái)機(jī)器上運(yùn)行多個(gè) Datanode，只不過(guò)這樣的情況比較少見(jiàn)。由于采用了可移植性極強(qiáng)的 Java 語(yǔ)言，使得 HDFS 可以部署到多種類型的機(jī)器上。這些機(jī)器一般運(yùn)行著 GNU/Linux操作系統(tǒng) (OS)。在 Namenode 的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制。它也負(fù)責(zé)確定數(shù)據(jù)塊到具體 Datanode節(jié)點(diǎn)的映射。從內(nèi)部看，一個(gè)文件其實(shí)被分成一個(gè)或多個(gè)數(shù)據(jù)塊，這些塊存儲(chǔ)在一組 Datanode 上。集群中的 Datanode 一般是一個(gè)節(jié)點(diǎn)一個(gè)，負(fù)責(zé)管理它所在節(jié)點(diǎn)上的存儲(chǔ)。一個(gè) HDFS 集群是由一個(gè) Namenode 和一定數(shù)目的 Datanodes 組成。這種特性方便了 HDFS 作為大規(guī)模數(shù)據(jù)應(yīng)用平臺(tái)的推廣。 HDFS 為應(yīng)用提供了將它們自己移動(dòng)到數(shù)據(jù)附近的接口。因?yàn)檫@樣就能降低網(wǎng)絡(luò)阻塞的影響，提高系統(tǒng)數(shù)據(jù)的吞吐量。目前還有計(jì)劃在將來(lái)擴(kuò)充這個(gè)模型，使之支持文件的附加寫(xiě)操作。這一假設(shè)簡(jiǎn)化了數(shù)據(jù)一致性問(wèn)題，并且使高吞吐量的數(shù)據(jù)訪問(wèn)成為可能。簡(jiǎn)單的一致性模型 HDFS 應(yīng)用需要一個(gè)“一次寫(xiě)入多次讀取”的文件訪問(wèn)模型。它應(yīng)該能提供整體上高的數(shù)據(jù)傳輸帶寬，能在一個(gè)集群里擴(kuò)展到數(shù)百個(gè)節(jié)點(diǎn)。 HDFS 上的一個(gè)典型文件大小一般都在 G 字節(jié)至 T 字節(jié)。為了提高數(shù)據(jù)的吞吐量，在一些關(guān)鍵方面對(duì) POSIX的語(yǔ)義做了一些修改。比之?dāng)?shù)據(jù)訪問(wèn)的低延遲問(wèn)題，更關(guān)鍵的在于數(shù)據(jù)訪問(wèn)的高吞吐量。流式數(shù)據(jù)訪問(wèn) 運(yùn)行在 HDFS 上的應(yīng)用和普通的應(yīng)用不同，需要流式訪問(wèn)它們的數(shù)據(jù)集。我們面對(duì)的現(xiàn)實(shí)是構(gòu)成系統(tǒng)的組件數(shù)目是巨大的，而且任一組件都有可能失效，這意味著總是有一部分 HDFS 的組件是不工作的。這個(gè)項(xiàng)目的地址是二、前提和設(shè)計(jì)目標(biāo) 硬件錯(cuò)誤硬件錯(cuò)誤是常態(tài)而不是異常。 HDFS 在最開(kāi)始是作為 Apache Nutch 搜索引擎項(xiàng)目的基礎(chǔ)架構(gòu)而開(kāi)發(fā)的。 HDFS 能提供高吞吐量的數(shù)據(jù)訪問(wèn)，非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用。但同時(shí)，它和其他的分布式文件系統(tǒng)的區(qū)別也是很明顯的。 this policy does not impact data reliability and availability guarantees. However, it does reduce the aggregate work bandwidth used when reading data since a block is placed in only two unique racks rather than three. With this policy, the replicas of a file do not evenly distribute across the racks. One third of replicas are on one node, two thirds of replicas are on one rack, and the other third are evenly distributed across the remaining racks. This policy improves write performance without promising data reliability or read performance. The current, default replica placement policy described here is a work in progress. Replica Selection To minimize global bandwidth consumption and read latency, HDFS tries to satisfy a read request from a replica that is closest to the reader. If there exists a replica on the same rack as the reader node, then that replica is preferred to satisfy the read request. If angg/ HDFS cluster spans multiple data centers, then a replica that is resident in the local data center is preferred over any remote replica. Safemode On startup, the NameNode enters a special state called Safemode. Replication of data blocks does not occur when the NameNode is in the Safemode state. The NameNode receives Heartbeat and Blockreport messages from the DataNodes. A Blockreport contains the list of data blocks that a DataNode is hosting. Each block has a specified minimum number of replicas. A block is considered safely replicated when the minimum number of replicas of that data block has checked in with the NameNode. After a configurable percentage of safely replicated data blocks checks in with the NameNode (plus an additional 30 seconds), the NameNode exits the Safemode state. It then determines the list of data blocks (if any) that still have fewer than the specified number of replicas. The NameNode then replicates these blocks to other DataNodes. The Persistence of File System Metadata The HDFS namespace is stored by the NameNode. The NameNode uses a transaction log called the EditLog to persistently record every change that occurs to file system metadata. For example, creating a new file in HDFS causes the NameNode to insert a record into the EditLog indicating this. Similarly, changing the replication factor of a file causes a new record to be inserted into the EditLog. The NameNode uses a file in its local host OS file system to store the EditLog. The entire file system namespace, including the mapping of blocks to files and file system properties, is stored in a file called the FsImage. The FsImage is stored as a file in the NameNode’s local file system too. The NameNode keeps an image of the entire file system namespace and file Blockmap in memory. This key metadata item is designed to be pact, such that a NameNode with 4 GB of RAM is plenty to support a huge number of files and directories. When the NameNode starts up, it reads the FsImage and EditLog from disk, applies all the transactions from the EditLog to the inmemory representation of the FsImage, and flushes out this new version into a new FsImage on disk. It can then truncate the old EditLog because its transactions have been applied to the persistent FsImage. This process is called a checkpoint. In the current implementation, a checkpoint only occurs when the NameNode starts up. Work is in progress to support periodic checkpointing in the near future.

點(diǎn)擊復(fù)制文檔內(nèi)容

法律信息相關(guān)推薦

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(參考版)

【摘要】江漢大學(xué)畢業(yè)論文（設(shè)計(jì)）外文翻譯原文來(lái)源TheHadoopDistributedFileSystem:ArchitectureandDesign中文譯文Hadoop分布式文件系統(tǒng)：架構(gòu)和設(shè)計(jì)姓名

2025-01-23 07:30

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯(參考版)

【摘要】江漢大學(xué)畢業(yè)論文（設(shè)計(jì)）外文翻譯原文來(lái)源TheHadoopDistributedFileSystem:ArchitectureandDesign中文譯文Hadoop分布式文件系統(tǒng)：架構(gòu)和設(shè)計(jì)姓名XXXX

2025-01-21 14:15

搜索引擎外文翻譯(參考版)

【摘要】外文資料翻譯資料來(lái)源:網(wǎng)絡(luò)文章名：UsingtheSEOforFirefoxPlus-In書(shū)刊名：《SearchEngineOptimization》作者：KristopherB.Jones出版社：WileyPublishing,Inc,2021章節(jié)：Usingth

2024-12-11 08:58

搜索引擎優(yōu)化畢業(yè)論文外文翻譯-其他專業(yè)(參考版)

【摘要】外文資料翻譯-英文原文中文3780字英文原文出處：Nursel,Yal??n,Utku,K?se.Whatissearchengineoptimization:SEO?[J].Procedia-SocialandBehavioralSciences,2021,(9):487-49Whatissea

2025-01-23 11:44

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

【摘要】畢業(yè)論文（設(shè)計(jì)）論文（設(shè)計(jì)）題目：站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)目錄摘要 1ABSTRACT 2第1章緒論 3課題的研究背景與意義 3研究現(xiàn)狀 4本文的工作 4第2章站內(nèi)搜索引擎相關(guān)技術(shù)介紹 6全文檢索技術(shù) 6.NET相關(guān)技術(shù) 7.NET平臺(tái) 7VisualStudio2

2025-01-16 15:35

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

【摘要】畢業(yè)論文（設(shè)計(jì)）論文（設(shè)計(jì)）題目：站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)目錄摘要.....................................................................................................1

2025-06-08 10:42

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)論文(參考版)

【摘要】江漢大學(xué)本科畢業(yè)論文（設(shè)計(jì)）I全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)論文目錄1緒論...................................................................................1課題背景及介紹.....................................

2025-07-01 12:48

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-畢業(yè)論文(參考版)

【摘要】江漢大學(xué)本科畢業(yè)論文（設(shè)計(jì)）I作者聲明本人鄭重聲明：所呈交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外，本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)的成果作品。本人完全了解有關(guān)保障、使用學(xué)位論文的規(guī)定，同意學(xué)校保留并向有關(guān)學(xué)位論文管理機(jī)構(gòu)送交論文的復(fù)印件和電子版。同意省級(jí)優(yōu)秀學(xué)位

2025-07-01 13:40

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-畢業(yè)論文(參考版)

2024-08-31 16:43

元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

【摘要】本科畢業(yè)設(shè)計(jì)院系計(jì)算機(jī)科學(xué)與技術(shù)系專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)題目元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)年級(jí)2020級(jí)學(xué)號(hào)學(xué)生姓名劉宣

2024-09-06 07:18

外文搜索引擎(參考版)

【摘要】SpringerLink新平臺(tái)使用指南徐州師范大學(xué)圖書(shū)館信息咨詢部2022-10-9LibraryofHenanNormalUniversityJuneSpringerLink簡(jiǎn)介?Springer出版社擁有165年的出版歷史?全球最大的學(xué)術(shù)與科技圖書(shū)出版社（每年出版4,000種新

2024-08-05 04:13

全文搜索引擎技術(shù)的研究和實(shí)現(xiàn)(參考版)

【摘要】目錄摘要：······························

2024-11-12 01:37

基于lucene的全文搜索引擎設(shè)計(jì)(參考版)

【摘要】畢業(yè)設(shè)計(jì)基于Lucene的全文搜索引擎設(shè)計(jì)學(xué)生承諾書(shū)本人鄭重承諾：所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外，本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)的成果作品。

2024-12-08 01:01

基于lucene的全文搜索引擎設(shè)計(jì)(參考版)

2024-08-18 15:00

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)本科畢業(yè)論文(參考版)

【摘要】江漢大學(xué)本科畢業(yè)論文（設(shè)計(jì)）I全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)作者聲明本人鄭重聲明：所呈交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外，本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)的成果作品。本人完全了解有關(guān)保障、使用學(xué)位論文的規(guī)定，同意學(xué)校保留并

2025-07-08 18:41

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯(參考版)

搜索引擎外文翻譯(參考版)

搜索引擎優(yōu)化畢業(yè)論文外文翻譯-其他專業(yè)(參考版)

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)論文(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-畢業(yè)論文(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-畢業(yè)論文(參考版)

元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)(參考版)

外文搜索引擎(參考版)

全文搜索引擎技術(shù)的研究和實(shí)現(xiàn)(參考版)

基于lucene的全文搜索引擎設(shè)計(jì)(參考版)

基于lucene的全文搜索引擎設(shè)計(jì)(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)本科畢業(yè)論文(參考版)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(已修改)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(編輯修改稿)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)-wenkub.com

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)(已改無(wú)錯(cuò)字)

全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-外文翻譯-其他專業(yè)-資料下載頁(yè)