正文內(nèi)容

基于flume的美團(tuán)日志收集系統(tǒng)-資料下載頁

2025-06-18 15:52本頁面

　　

【正文】 //讀取配置，并檢查配置 } @Override public synchronized void start() { //初始化producer } @Override public synchronized void stop() { //關(guān)閉producer } @Override public Status process() throws EventDeliveryException { Status status = 。 Channel channel = getChannel()。 Transaction tx = ()。 try { ()。 //將日志按category分隊(duì)列存放 MapString, ListString topic2EventList = new HashMapString, ListString()。 //從channel中取batchSize大小的日志，從header中獲取category，生成topic，并存放于上述的Map中； //將Map中的數(shù)據(jù)通過producer發(fā)送給kafka ()。 } catch (Exception e) { ()。 throw new EventDeliveryException(e)。 } finally { ()。 } return status。 }} 修復(fù)和scribe的兼容問題Scribed在通過ScribeSource發(fā)送數(shù)據(jù)包給Flume時(shí)，大于4096字節(jié)的包，會(huì)先發(fā)送一個(gè)Dummy包檢查服務(wù)器的反應(yīng)，()=0的包返回TRY_LATER，此時(shí)Scribed就認(rèn)為出錯(cuò)，斷開連接。這樣循環(huán)反復(fù)嘗試，無法真正發(fā)送數(shù)據(jù)?，F(xiàn)在在ScribeSource的Thrift接口中，對(duì)size為0的情況返回OK，保證后續(xù)正常發(fā)送數(shù)據(jù)。3. 基礎(chǔ)參數(shù)調(diào)優(yōu)經(jīng)驗(yàn)l HdfsSink中默認(rèn)的serializer會(huì)每寫一行在行尾添加一個(gè)換行符，我們?nèi)罩颈旧韼в袚Q行符，這樣會(huì)導(dǎo)致每條日志后面多一個(gè)空行，修改配置不要自動(dòng)添加換行符； = falsel 調(diào)大MemoryChannel的capacity，盡量利用MemoryChannel快速的處理能力；l 調(diào)大HdfsSink的batchSize，增加吞吐量，減少hdfs的flush次數(shù)；l 適當(dāng)調(diào)大HdfsSink的callTimeout，避免不必要的超時(shí)錯(cuò)誤； HdfsSink獲取Filename的優(yōu)化HdfsSink的path參數(shù)指明了日志被寫到Hdfs的位置，該參數(shù)中可以引用格式化的參數(shù)，將日志寫到一個(gè)動(dòng)態(tài)的目錄中。這方便了日志的管理。例如我們可以將日志寫到category分類的目錄，并且按天和按小時(shí)存放： = /user/hive/work/{category}/dt=%Y%m%d/hour=%HHdfsS ink中處理每條event時(shí)，都要根據(jù)配置獲取此event應(yīng)該寫入的Hdfs path和filename，默認(rèn)的獲取方法是通過正則表達(dá)式替換配置中的變量，獲取真實(shí)的path和filename。因?yàn)榇诉^程是每條event都要做的操作，耗時(shí)很長。通過我們的測(cè)試，20萬條日志，這個(gè)操作要耗時(shí)68s左右。由于我們目前的path和filename有固定的模式，可以通過字符串拼接獲得。而后者比正則匹配快幾十倍。拼接定符串的方式，20萬條日志的操作只需要幾百毫秒。 HdfsSink的b/m/s優(yōu)化在我們初始的設(shè)計(jì)中，所有的日志都通過一個(gè)Channel和一個(gè)HdfsSink寫到Hdfs上。我們來看一看這樣做有什么問題。首先，我們來看一下HdfsSink在發(fā)送數(shù)據(jù)的邏輯：//從Channel中取batchSize大小的eventsfor (txnEventCount = 0。 txnEventCount batchSize。 txnEventCount++) { //對(duì)每條日志根據(jù)category append到相應(yīng)的bucketWriter上； (event)。｝for (BucketWriter bucketWriter : writers) { //然后對(duì)每一個(gè)bucketWriter調(diào)用相應(yīng)的flush方法將數(shù)據(jù)flush到Hdfs上 ()。｝假設(shè)我們的系統(tǒng)中有100個(gè)category，batchSize大小設(shè)置為20萬。則每20萬條數(shù)據(jù)，就需要對(duì)100個(gè)文件進(jìn)行append或者flush操作。其次，對(duì)于我們的日志來說，基本符合80/20原則。即20%的category產(chǎn)生了系統(tǒng)80%的日志量。這樣對(duì)大部分日志來說，每20萬條可能只包含幾條日志，也需要往Hdfs上flush一次。上述的情況會(huì)導(dǎo)致HdfsSink寫Hdfs的效率極差。下圖是單Channel的情況下每小時(shí)的發(fā)送量和寫hdfs的時(shí)間趨勢(shì)圖。鑒于這種實(shí)際應(yīng)用場(chǎng)景，我們把日志進(jìn)行了大小歸類，分為big, middle和small三類，這樣可以有效的避免小日志跟著大日志一起頻繁的flush，提升效果明顯。下圖是分隊(duì)列后big隊(duì)列的每小時(shí)的發(fā)送量和寫hdfs的時(shí)間趨勢(shì)圖。13

點(diǎn)擊復(fù)制文檔內(nèi)容

職業(yè)教育相關(guān)推薦

企業(yè)日志管理系統(tǒng)代碼清單-資料下載頁

【總結(jié)】河北大學(xué)工商學(xué)院學(xué)年論文題目：企業(yè)在線工作日志管理系統(tǒng) ——代碼清單學(xué)部信息科學(xué)與工程學(xué)部班級(jí)2010級(jí)網(wǎng)絡(luò)工程1班專業(yè)電氣信息二類學(xué)號(hào)2010482160姓名李曉

2025-04-08 11:26

美氏職位評(píng)估系統(tǒng)-資料下載頁

【總結(jié)】職位評(píng)估系統(tǒng)簡(jiǎn)介在過去幾年里，職位評(píng)估得到了越來越廣泛的運(yùn)用。其原因在于：應(yīng)用系統(tǒng)性的職位評(píng)估方法，可消除職位名稱的歪曲，并可在不同部門或企業(yè)當(dāng)中真實(shí)和一致地比較所有職位的判別。使用職位評(píng)估系統(tǒng)具有方便招聘工作，有利于職位發(fā)展規(guī)劃、績效評(píng)估、人員升降、工作調(diào)整、公司發(fā)展等優(yōu)點(diǎn)，當(dāng)然也為建立合理的工資水平提供了方便。本系統(tǒng)是一個(gè)職位評(píng)估的新方法，被諸多跨國企業(yè)和國內(nèi)知名企業(yè)

2025-04-09 12:07

目標(biāo)系統(tǒng)信息收集技術(shù)-資料下載頁

【總結(jié)】第二章目標(biāo)系統(tǒng)信息收集技術(shù)1）信息采集及其內(nèi)容2）信息采集的基本原理和技術(shù)3）信息采集常用的工具4）交換式網(wǎng)絡(luò)上的嗅探5）嗅探器的檢測(cè)與防范信息采集的定義與內(nèi)容1、黑客攻擊的基本原則：從不進(jìn)入自己不了解的系統(tǒng)2、什么是信息采集？對(duì)目標(biāo)主機(jī)、目標(biāo)網(wǎng)絡(luò)、相關(guān)的系統(tǒng)管理人員進(jìn)行非公開的檢測(cè)，全面收集

2025-05-01 06:22

基于asp的選課系統(tǒng)-資料下載頁

【總結(jié)】基于ASP的選課系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)學(xué)生姓名學(xué)號(hào)專業(yè)班級(jí)計(jì)算機(jī)科學(xué)與技術(shù)指導(dǎo)教師完成日期

2024-11-17 22:07

基于java的聊天系統(tǒng)-資料下載頁

【總結(jié)】學(xué)院學(xué)生課程設(shè)計(jì)（論文）題目：Java課程設(shè)計(jì)聊天程序?qū)W生姓名：學(xué)號(hào)：所在院(系)：計(jì)算機(jī)學(xué)院專業(yè)：計(jì)算機(jī)科學(xué)與技術(shù)班

2025-06-27 17:59

健康系統(tǒng)日志ppt課件-資料下載頁

【總結(jié)】系統(tǒng)日志?Syslog工具–Syslog是將kernel和系統(tǒng)工具產(chǎn)生的信息傳遞給syslogddaemon–Syslogddaemon依靠/etc/文件的配置來處理?寫messages到systemlog;?寫messages到systemconsole;?發(fā)送信息到所列出的用戶；?發(fā)送信息到

2025-01-04 02:09

海量日志分析系統(tǒng)實(shí)踐-資料下載頁

【總結(jié)】基于MySql的日志分析系統(tǒng)設(shè)計(jì)漆興主要內(nèi)容?日志分析系統(tǒng)查詢需求分析?訪問特點(diǎn)分析?基于性能考慮的系統(tǒng)體系架構(gòu)?基于需求的mysql優(yōu)化及表設(shè)計(jì)?基于需求的memcache使用?其他開源工具的使用?總結(jié)系統(tǒng)簡(jiǎn)介?分

2025-04-30 01:26

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

【總結(jié)】目錄第一章前言...................................................................................................................III選題背景及目的.............................

2025-08-20 12:05

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

【總結(jié)】目錄第一章前言 2選題背景及目的 2國內(nèi)外研究狀況 3設(shè)計(jì)和解決方法 3第二章需求分析 5范圍 5系統(tǒng)概述 5文檔概述 5需求概述 5系統(tǒng)目標(biāo) 5運(yùn)行環(huán)境 6用戶的特點(diǎn) 6 6系統(tǒng)用例圖 7系統(tǒng)各項(xiàng)功能描述 8 11數(shù)據(jù)關(guān)系ER實(shí)體類 11 14

2025-07-27 08:39

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

2025-03-04 05:03

安全避險(xiǎn)系統(tǒng)設(shè)計(jì)需收集資料-資料下載頁

【總結(jié)】地下礦山安全避險(xiǎn)“六大系統(tǒng)”設(shè)計(jì)所需收集的資料1、礦山地質(zhì)勘探報(bào)告（詳細(xì)描述水文地質(zhì)、工程地質(zhì)情況及礦山井下可能產(chǎn)生的有害氣體種類、礦巖含硫品位和有無自然發(fā)火危險(xiǎn)）；2、礦山開采設(shè)計(jì)；3、井下各生產(chǎn)中段（分段）實(shí)測(cè)平面圖（注明中段井底車場(chǎng)、馬頭門、井下運(yùn)輸調(diào)度室、主要機(jī)電硐室、井下變電所、采區(qū)、主要泵房、爆破時(shí)撤離人員集中地點(diǎn)、井下爆破器材庫、裝卸礦點(diǎn)等位置）；4、礦山通風(fēng)系

2025-01-16 14:17

基于mps系統(tǒng)的基本plc實(shí)驗(yàn)系統(tǒng)的改造-資料下載頁

【總結(jié)】河南科技大學(xué)畢業(yè)設(shè)計(jì)（論文）I基于MPS系統(tǒng)的基本PLC實(shí)驗(yàn)系統(tǒng)的改造摘要MPS系統(tǒng)是基于西門子PLC上的教學(xué)實(shí)驗(yàn)系統(tǒng)。它是為了提高學(xué)生動(dòng)手能力和技能而設(shè)計(jì)的一套實(shí)用性實(shí)驗(yàn)設(shè)備。MPS體現(xiàn)了機(jī)電一體化的技術(shù)實(shí)際應(yīng)用，利用該系統(tǒng)可以模擬一個(gè)與實(shí)際生產(chǎn)情況十分接近的控制過程。但由于MPS單元各個(gè)原件與接口是特定的，所以限制了PLC作為教學(xué)實(shí)驗(yàn)設(shè)

2025-06-27 18:40

基于essh框架平臺(tái)日志管理與審批的開發(fā)-畢業(yè)設(shè)計(jì)論文-資料下載頁

【總結(jié)】畢業(yè)設(shè)計(jì)（論文）題目：基于ESSH框架平臺(tái)日志管理與審批的開發(fā)目錄摘要 1引言 2一、需求分析 3（一）概述 3（二）日志管理系統(tǒng)運(yùn)行環(huán)境 4（三）總體功能描述 4（四）功能性需求描述 6二、系統(tǒng)設(shè)計(jì) 10（一）架構(gòu)設(shè)計(jì) 10（二）數(shù)據(jù)庫設(shè)計(jì) 13（三）界面設(shè)計(jì) 16（四）模塊設(shè)計(jì)

2025-06-27 17:31

美世國際職位評(píng)估系統(tǒng)-資料下載頁

【總結(jié)】國際職位評(píng)估系統(tǒng)第二版版權(quán)所有，未經(jīng)許可，不得以任何形式翻印或轉(zhuǎn)讓簡(jiǎn)介IPE系統(tǒng)是一個(gè)職稱評(píng)估的新方法。在許多長期從事職位評(píng)估工作專家的經(jīng)驗(yàn)基礎(chǔ)上，他已由原來的基本方法發(fā)展成為現(xiàn)在易于運(yùn)用的IPE系統(tǒng)。他含有可以對(duì)各行業(yè)里所有職位進(jìn)行比較的必要因素。在過去幾年里，職位評(píng)估得到了越來越廣泛的

2025-04-09 12:07

基于菲涅爾透鏡的陽光收集器的開發(fā)設(shè)計(jì)方案-資料下載頁

【總結(jié)】基于菲涅爾透鏡的陽光收集器的開發(fā)設(shè)計(jì)方案第一部分執(zhí)行總結(jié)萊特陽光導(dǎo)入有限公司是一家集研發(fā)、銷售、安裝基于菲涅爾透鏡的陽光收集器（以下簡(jiǎn)稱萊特陽光導(dǎo)入器）為一體的綠色新能源企業(yè)，注冊(cè)資本175萬元。萊特陽光導(dǎo)入器是一套通過收集并傳導(dǎo)自然光來實(shí)現(xiàn)室內(nèi)照明的系統(tǒng)，既能充分利用太陽能，有效地減少白天的照明電耗，緩解能源供應(yīng)緊張的局面，在節(jié)約能源方面發(fā)揮巨大的作用，又能夠提供良好

2025-05-12 23:10

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

基于flume的美團(tuán)日志收集系統(tǒng)-資料下載頁

企業(yè)日志管理系統(tǒng)代碼清單-資料下載頁

美氏職位評(píng)估系統(tǒng)-資料下載頁

目標(biāo)系統(tǒng)信息收集技術(shù)-資料下載頁

基于asp的選課系統(tǒng)-資料下載頁

基于java的聊天系統(tǒng)-資料下載頁

健康系統(tǒng)日志ppt課件-資料下載頁

海量日志分析系統(tǒng)實(shí)踐-資料下載頁

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

基于android系統(tǒng)的個(gè)人記賬系統(tǒng)設(shè)計(jì)-資料下載頁

安全避險(xiǎn)系統(tǒng)設(shè)計(jì)需收集資料-資料下載頁

基于mps系統(tǒng)的基本plc實(shí)驗(yàn)系統(tǒng)的改造-資料下載頁

基于essh框架平臺(tái)日志管理與審批的開發(fā)-畢業(yè)設(shè)計(jì)論文-資料下載頁

美世國際職位評(píng)估系統(tǒng)-資料下載頁

基于菲涅爾透鏡的陽光收集器的開發(fā)設(shè)計(jì)方案-資料下載頁

基于flume的美團(tuán)日志收集系統(tǒng)(完整版)

基于flume的美團(tuán)日志收集系統(tǒng)(更新版)

基于flume的美團(tuán)日志收集系統(tǒng)(專業(yè)版)

基于flume的美團(tuán)日志收集系統(tǒng)(留存版)