freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

大數(shù)據(jù)架構和模式42(編輯修改稿)

2025-05-06 11:35 本頁面
 

【文章內容簡介】 外的鏈鎖信息的能力。對于內部使用者,為業(yè)務用戶構建報告和儀表板的能力使得利益相關者能夠制定精明的決策并設計恰當?shù)膽?zhàn)略。為了提高操作有效性,可以從數(shù)據(jù)中生成實時業(yè)務警告,而且可以監(jiān)視操作性的關鍵績效指標:交易攔截器— 此組件可實時攔截高容量交易,將它們轉換為一種容易被分析層理解的實時格式,以便在傳入數(shù)據(jù)上執(zhí)行實時分析。事務攔截器應能夠集成并處理來自各種來源的數(shù)據(jù),比如傳感器、智能儀表、麥克風、攝像頭、GPS 設備、ATM 和圖像掃描儀??梢允褂酶鞣N類型的適配器和 API 來連接到數(shù)據(jù)源。也可以使用各種加速器來簡化開發(fā),比如實時優(yōu)化和流分析,視頻分析,銀行、保險、零售、電信和公共運輸領域的加速器,社交媒體分析,以及情緒分析。業(yè)務流程管理流程— 來自分析層的洞察可供業(yè)務流程執(zhí)行語言 (BPEL) 流程、API 或其他業(yè)務流程使用,通過自動化上游和下游 IT 應用程序、人員和流程的功能,進一步獲取業(yè)務價值。實時監(jiān)視— 可以使用從分析中得出的數(shù)據(jù)來生成實時警告??梢詫⒕姘l(fā)送給感興趣的使用者和設備,比如智能電話和平板電腦。可以使用從分析組件生成的數(shù)據(jù)洞察,定義并監(jiān)視關鍵績效指標,以便確定操作有效性。實時數(shù)據(jù)可從各種來源以儀表板的形式向業(yè)務用戶公開,以便監(jiān)視系統(tǒng)的健康或度量營銷活動的有效性。報告引擎— 生成與傳統(tǒng)商業(yè)智能報告類似的報告的能力至關重要。用戶可基于從分析層中得到的洞察,創(chuàng)建臨時報告、計劃的報告或自助查詢和分析。推薦引擎— 基于來自分析層的分析結果,推薦引擎可向購物者提供實時的、相關的和個性化的推薦,提高電子商務交易中的轉換率和每個訂單的平均價值。該引擎實時處理可用信息并動態(tài)地響應每個用戶,響應基于用戶的實時活動、存儲在 CRM 系統(tǒng)中的注冊客戶信息,以及非注冊客戶的社交概況??梢暬桶l(fā)現(xiàn)— 數(shù)據(jù)可跨企業(yè)內外的各種聯(lián)邦的數(shù)據(jù)源進行導航。數(shù)據(jù)可能具有不同的內容和格式,所有數(shù)據(jù)(結構化、半結構化和非結構化)可組合來進行可視化并提供給用戶。此能力使得組織能夠將其傳統(tǒng)的企業(yè)內容(包含在企業(yè)內容管理系統(tǒng)和數(shù)據(jù)倉庫中)與新的社交內容(例如 tweet 和博客文章)組合到單個用戶界面中。垂直層影響邏輯層(大數(shù)據(jù)來源、數(shù)據(jù)改動和存儲、分析和使用層)的所有組件的各方面都包含在垂直層中: 信息集成 大數(shù)據(jù)治理 系統(tǒng)管理 服務質量信息集成大數(shù)據(jù)應用程序從各種數(shù)據(jù)起源、提供程序和數(shù)據(jù)源獲取數(shù)據(jù),并存儲在 HDFS、NoSQL 和 MongoDB 等數(shù)據(jù)存儲系統(tǒng)中。這個垂直層可供各種組件使用(例如數(shù)據(jù)獲取、數(shù)據(jù)整理、模型管理和交易攔截器),負責連接到各種數(shù)據(jù)源。集成將具有不同特征(例如協(xié)議和連接性)的數(shù)據(jù)源的信息,需要高質量的連接器和適配器??梢允褂眉铀倨鬟B接到大多數(shù)已知和廣泛使用的來源。這些加速器包括社交媒體適配器和天氣數(shù)據(jù)適配器。各種組件還可以使用這一層在大數(shù)據(jù)存儲中存儲信息,從大數(shù)據(jù)存儲中檢索信息,以便處理這些信息。大多數(shù)大數(shù)據(jù)存儲都提供了服務和 API 來存儲和檢索該信息。大數(shù)據(jù)治理數(shù)據(jù)治理涉及到定義指南來幫助企業(yè)制定有關數(shù)據(jù)的正確決策。大數(shù)據(jù)治理有助于處理企業(yè)內或從外部來源傳入的數(shù)據(jù)的復雜性、量和種類。在將數(shù)據(jù)傳入企業(yè)進行處理、存儲、分析和清除或歸檔時,需要強有力的指南和流程來監(jiān)視、構建、存儲和保護數(shù)據(jù)。除了正常的數(shù)據(jù)治理考慮因素之外,大數(shù)據(jù)治理還包含其他因素:管理各種格式的大量數(shù)據(jù)。持續(xù)培訓和管理必要的統(tǒng)計模型,以便對非結構化數(shù)據(jù)和分析進行預處理。請記住,設置處理非結構化數(shù)據(jù)時的重要一步。為外部數(shù)據(jù)設置有關其保留和使用的策略和合規(guī)性制度。定義數(shù)據(jù)歸檔和清除策略。創(chuàng)建如何跨各種系統(tǒng)復制數(shù)據(jù)的策略。設置數(shù)據(jù)加密策略。服務質量層此層復雜定義數(shù)據(jù)質量、圍繞隱私和安全性的策略、數(shù)據(jù)頻率、每次抓取的數(shù)據(jù)大小和數(shù)據(jù)過濾器:數(shù)據(jù)質量完整地識別所有必要的數(shù)據(jù)元素以可接受的新鮮度提供數(shù)據(jù)的時間軸依照數(shù)據(jù)準確性規(guī)則來驗證數(shù)據(jù)的準確性采用一種通用語言(數(shù)據(jù)元組滿足使用簡單業(yè)務語言所表達的需求)依據(jù)數(shù)據(jù)一致性規(guī)則驗證來自多個系統(tǒng)的數(shù)據(jù)一致性在滿足數(shù)據(jù)規(guī)范和信息架構指南基礎上的技術符合性圍繞隱私和安全的策略需要策略來保護敏感數(shù)據(jù)。從外部機構和提供程序獲取的數(shù)據(jù)可能包含敏感數(shù)據(jù)(比如 Facebook 用戶的聯(lián)系信息或產品定價信息)。數(shù)據(jù)可以來源于不同的地區(qū)和國家,但必須進行相應的處理。必須制定有關數(shù)據(jù)屏蔽和這類數(shù)據(jù)的存儲的決策??紤]以下數(shù)據(jù)訪問策略:A、數(shù)據(jù)可用性B、數(shù)據(jù)關鍵性C、數(shù)據(jù)真實性D、數(shù)據(jù)共享和發(fā)布E、數(shù)據(jù)存儲和保留,包括能否存儲外部數(shù)據(jù)等問題。如果能夠存儲數(shù)據(jù),數(shù)據(jù)可存儲多長時間?可存儲何種類型的數(shù)據(jù)?F、數(shù)據(jù)提供程序約束(政策、技術和地區(qū))G、社交媒體使用條款數(shù)據(jù)頻率提供新鮮數(shù)據(jù)的頻率是多少?它是按需、連續(xù)還是離線的?抓取的數(shù)據(jù)大小此屬性有助于定義可抓取的數(shù)據(jù)以及每次抓取后可使用的數(shù)據(jù)大小。過濾器標準過濾器會刪除不想要的數(shù)據(jù)和數(shù)據(jù)中的干擾數(shù)據(jù),僅留下分析所需的數(shù)據(jù)。系統(tǒng)管理系統(tǒng)管理對大數(shù)據(jù)至關重要,因為它涉及到跨企業(yè)集群和邊界的許多系統(tǒng)。對整個大數(shù)據(jù)生態(tài)系統(tǒng)的健康的監(jiān)視包括:A、管理系統(tǒng)日志、虛擬機、應用程序和其他設備B、關聯(lián)各種日志,幫助調查和監(jiān)視具體情形C、監(jiān)視實時警告和通知D、使用顯示各種參數(shù)的實時儀表板E、引用有關系統(tǒng)的報告和詳細分析F、設定和遵守服務水平協(xié)議G、管理存儲和容量G、歸檔和管理歸檔檢索I、執(zhí)行系統(tǒng)恢復、集群管理和網(wǎng)絡管理J、策略管理結束語對開發(fā)人員而言,層提供了一種對大數(shù)據(jù)解決方案必須執(zhí)行的功能進行分類的途徑,為組織建議必需執(zhí)行這些功能所需的代碼。但是,對于想要從大數(shù)據(jù)獲取洞察的業(yè)務用戶,考慮大數(shù)據(jù)需求和范圍通常會有所幫助。原子模式解決了訪問、處理、存儲和使用大數(shù)據(jù)的機制,為業(yè)務用戶提供了一種解決需求和范圍的途徑。下一篇文章將介紹用于此用途的原子模式。作者: Divakar等來源: DeveloperWorksEnd.大數(shù)據(jù)架構和模式(四)大數(shù)據(jù)解決方案的原子模式和復合模式???簡介本系列的 第 3 部分 介紹了大數(shù)據(jù)解決方案的邏輯層。這些層定義了各種組件,并對它們進行分類,這些組件必須處理某個給定業(yè)務用例的功能性和非功能性需求。本文基于層和組件的概念,介紹了解決方案中所用的典型原子模式和復合模式。通過將所提出的解決方案映射到此處提供的模式,讓用戶了解需要如何設計組件,以及從功能角度考慮,應該將它們放置在何處。模式有助于定義大數(shù)據(jù)解決方案的架構。利用原子模式和復合模式可以幫助進一步完善大數(shù)據(jù)解決方案的每個組件的角色和責任。本文介紹原子模式和復合模式。本系列的最后一篇文章將介紹解決方案模式。圖 1. 模式的類別該圖顯示了一下模式:原子模式、復合模式和解決方案模式原子模式對于大數(shù)據(jù)上下文中經(jīng)常出現(xiàn)的問題,原子模式 有助于識別數(shù)據(jù)如何是被使用、處理、存儲和訪問的。它們還有助于識別所需的組件。訪問、存儲和處理來自不同數(shù)據(jù)源的多種數(shù)據(jù)需要不同的方法。每種模式都用于滿足特定的需求:例如,可視化、歷史數(shù)據(jù)分析、社交媒體數(shù)據(jù)和非結構化數(shù)據(jù)的存儲??梢詫⒍喾N原子模式結合使用,組成一個復合模式。這些原子模式?jīng)]有進行分層或排序。例如,可視化模式可以與社交媒體的數(shù)據(jù)訪問模式直接交互,可視化模式還可以與高級分析處理模式進行交互。圖 2. 用于數(shù)據(jù)使用、處理、數(shù)據(jù)訪問和存儲的原子模式的示例該圖顯示了每種原子模式下的樣例模式的列表數(shù)據(jù)使用模式這種類型的模式處理使用數(shù)據(jù)分析結果的各種方式。本節(jié)包括的數(shù)據(jù)使用模式可以滿足幾個需求??梢暬J娇梢暬瘮?shù)據(jù)的傳統(tǒng)方式以圖表、儀表板和摘要報告為基礎。這些傳統(tǒng)的方法并不總是用來可視化數(shù)據(jù)的最佳方式。大數(shù)據(jù)可視化的典型需求(包括新出現(xiàn)的需求)如下所示:執(zhí)行流數(shù)據(jù)的實時分析和顯示基于上下文,以交互方式挖掘數(shù)據(jù)執(zhí)行高級搜索,并獲得建議并行可視化信息獲得先進的硬件,支持未來的可視化需求正在進行研究,以確定人類和機器如何使用大數(shù)據(jù)洞察。這些挑戰(zhàn)包括所涉及的數(shù)據(jù)量,并且需要將數(shù)據(jù)與上下文相關聯(lián)。必須在適當?shù)纳舷挛闹酗@示洞察??梢暬瘮?shù)據(jù)的目的是為了更容易、更直觀地使用數(shù)據(jù),因此報告和儀表板可能提供全高清的觀看效果和 3D 互動視頻,并且可以為用戶提供使用應用程序控制業(yè)務活動和結果的能力。即席發(fā)現(xiàn)模式創(chuàng)建滿足所有業(yè)務需求的標準報告往往是不可行的,因為企業(yè)的業(yè)務數(shù)據(jù)查詢會有不同的需求。用戶在查找特定信息時,可能需要獲得根據(jù)問題的上下文執(zhí)行即席查詢的能力。即席分析可以幫助數(shù)據(jù)科學家和關鍵業(yè)務用戶了解業(yè)務數(shù)據(jù)的行為。即席處理中涉及的復雜性來自多種因素:多個數(shù)據(jù)源可用于相同的域。單一的查詢可以有多個結果。輸出可以是靜態(tài)的,并具有多種格式(視頻、音頻、圖形和文本)。輸出可以是動態(tài)和交互式的。加強傳統(tǒng)的數(shù)據(jù)存儲在大數(shù)據(jù)的初步探索中,許多企業(yè)選擇使用現(xiàn)有的分析平臺來降低成本,并依賴于現(xiàn)有的技能。加強現(xiàn)有的數(shù)據(jù)存儲有助于拓寬可用于現(xiàn)有分析的數(shù)據(jù)的范圍,包括駐留在組織邊界內外的數(shù)據(jù),比如社交媒體數(shù)據(jù),它可以豐富主數(shù)據(jù)。通過拓寬數(shù)據(jù)范圍,使之包含現(xiàn)有存儲中的新事實表、維度和主數(shù)據(jù),并從社交媒體獲取客戶數(shù)據(jù),組織可以獲得更深入的客戶洞察。但要牢記的是,新的數(shù)據(jù)集通常比較大,而現(xiàn)有的提取、轉換和加載工具可能不足以處理它。您可能需要使用具有大規(guī)模并行處理能力的高級工具來解決數(shù)據(jù)的數(shù)量、多樣性、真實性和速度特征。通知模式大數(shù)據(jù)洞察使人類、企業(yè)和機器可以通過使用事件通知而立即采取行動。通知平臺必須能夠處理及時發(fā)送出去的預計數(shù)量的通知。這些通知與大量郵件或群發(fā)短信不同,因為內容一般是特定于使用者的。例如,推薦引擎可以提供有關世界各地的龐大客戶群的洞察,而且可以將通知發(fā)送給這樣的客戶。啟動一個自動響應模式從大數(shù)據(jù)獲得的業(yè)務洞察,可用于觸發(fā)或啟動其他業(yè)務流程或事務。處理模式無論數(shù)據(jù)是處于靜止狀態(tài)還是在運動中,都可以處理大數(shù)據(jù)。具體情況取決于分析的復雜性,有可能不需要對數(shù)據(jù)進行實時處理。這種模式解決了對大數(shù)據(jù)進行實時、近實時或批量處理的方式。以下高級的大數(shù)據(jù)處理類別適用于大多數(shù)分析。這些類別通常也適用于基于 RDBMS 的傳統(tǒng)系統(tǒng)。惟一的區(qū)別是龐大規(guī)模的數(shù)據(jù)、多樣性和速度。在處理大數(shù)據(jù)時,要使用機器學習、復雜事件處理、事件流處理、決策管理和統(tǒng)計模型管理等技術。歷史數(shù)據(jù)分析模式傳統(tǒng)的歷史數(shù)據(jù)分析僅限于預定義的數(shù)據(jù)時間段,這通常取決于數(shù)據(jù)保留策略。由于處理和存儲的限制,超出此時間段的數(shù)據(jù)通常會被歸檔或清除。基于 Hadoop 的系統(tǒng)和其他等效的系統(tǒng)可以克服這些限制,因為它們具有豐富的存儲以及分布式大規(guī)模并行處理能力。運營、業(yè)務和數(shù)據(jù)倉庫的數(shù)據(jù)被移動到大數(shù)據(jù)存儲,您通過使用大數(shù)據(jù)平臺功能對它們進行處理。歷史分析包括分析給定時間段、季節(jié)組合和產品的歷史趨勢,并與最新的可用數(shù)據(jù)進行比較。為了能夠存儲和處理如此龐大的數(shù)據(jù),您可以使用 HDFS、NoSQL、SPSS174。 和 InfoSphere174。 BigInsights?。高級分析模式大數(shù)據(jù)提供了很多實現(xiàn)創(chuàng)意洞察的機會。不同的數(shù)據(jù)集可以在多種上下文中存在關聯(lián)。發(fā)現(xiàn)這些關系需要創(chuàng)新的復雜算法和技術。高級分析包括預測、決策、推理過程、模擬、上下文信息標識和實體解析。高級分析的應用包括生物統(tǒng)計數(shù)據(jù)分析(例如,DNA 分析)、空間分析、基于位置的分析、科學分析、研究,等等。高級分析要求大量的計算來管理大量的數(shù)據(jù)。數(shù)據(jù)科學家可以指導您識別合適的技術、算法和數(shù)據(jù)集,以及在給定上下文中解決問題所需的數(shù)據(jù)源。比如 SPSS、InfoSphere Streams 和 InfoSphere BigInsights 等工具提供了這類功能。這些工具訪問存儲在大數(shù)據(jù)存儲系統(tǒng)(比如 BigTable、HBase,等等)中的非結構化數(shù)據(jù)和結構化數(shù)據(jù)(例如,JSON 數(shù)據(jù))。預處理原始數(shù)據(jù)模式大數(shù)據(jù)解決方案主要由基于 MapReduce 的 Hadoop 系統(tǒng)和技術組成,MapReduce 是開箱即用的分布式存儲和處理解決方案。然而,從非結構化數(shù)據(jù)提取數(shù)據(jù)(例如,圖像、音頻、視頻、二進制提要,甚至是文本)是一項復雜的任務,需要具有機器學習能力并掌握自然語言處理等技術。另一個主要挑戰(zhàn)是如何驗證這些技術和算法的輸出的準確度和正確性。
點擊復制文檔內容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1