freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

資料品質及資料凈化技術之探究-全文預覽

2025-08-21 04:12 上一頁面

下一頁面
  

【正文】 其中。(3). 由資料探勘和資料檢核專家(資訊技術人員)根據結構化歸納或資料偏差偵測結果,持續(xù)調整資料探勘演算法,直到令人滿意的評估結果產生。各個資料來源的資料量非常龐大,如果單靠人工方式來檢核,所要付出的代價是相當昂貴的,因此採用自動化機制進行檢核,可以加速效率。而資訊技術人員則根據業(yè)務分析人員所歸納出的業(yè)務知識與品質需求,發(fā)展相對應的程式模組及系統(tǒng)工具,用來發(fā)覺、偵測或是過濾可能發(fā)生的資料品質問題。 圖3說明一個公部門資訊整合加上資料品質管理平臺的架構及流程。政府部門應該以「民眾觀點」發(fā)展,提供主題導向(subjectoriented)的整合與服務,才能提昇為民服務的水準,然欲達成資訊基礎面的整合,尚有相當多課題待克服,但綜觀現行實務應用上,資料品質的課題是其中之一。4. 環(huán)保部門資訊整合之資料品質管控以下介紹我們所建議的環(huán)保部門資料品質管控程序,以往政府部門大都依個別機構的權責劃分資訊處理作業(yè),也就是從「政府觀點」發(fā)展,不論各政府機關間,或是機關內部各單位間,係以獨立方式進行業(yè)務電腦化流程,於是形成許多「煙囪式」(stovepiped)系統(tǒng)。圖2:資料品質定義之階層圖一般而言,資料品質的概念是屬於多維度的,而品質參數的訂定也最好要符合各種不同的資料型態(tài),來自各個不同的應用領域中,都有著共同的品質參數用以評估其資料品質的需求。匯入資料倉儲的資料量多寡應視應用為基準,而非將所有資訊源中的資料完全整合匯入系統(tǒng)中。因此在詮釋性層面中包含了資料格式(syntax)與資料語意(semantics)等兩個品質因子,用來定義資料項的屬性。乍看之下,資料的存取性與安全性考量在某些情形下是相衝突的,但若完全無法取得這些保密性資料,則分析人員將無法研究解決資料不適用的問題,資料的需求管理者也無法作出相關的決策。由這項定義繼續(xù)延伸,必須再明確推衍出使資料適於使用的基本要素,基於這項需求,可將資料品質再細分成四個層面(dimension)來討論分析[13],每個層面又可再細分為若干個資料品質參數(data quality parameter),資料品質參數的主要作用是讓使用者評估資料倉儲中的資料品質[14]。 2. 資料品質淨化規(guī)則與自動化作業(yè)工具尚待強化。3. 品質聲明(quality statement):這些聲明包含資料品質測量的結果以及採用何種方式來展現給終端使用者,例如階層式的自動化控制迴圈就可以聚集低階層的品質,再將結果以三種不同的顏色(綠色代表品質良好、黃色代表有部分瑕庛、紅色代表品質低劣)讓使用者很容易辨別以及了解。表1:結合資料品質的資料模型測站名稱懸浮固體(mg/L)大腸桿菌群(CFU/100ml)PH值輸入日期校核者大直橋中山橋 : :46::24000010::::2005120720051212 : :KevinRichard::attributes for data valueattributes for data quality但是這種方式會改變原始資料儲存方式,同時還要修改SQL的查詢語言結構使其包含對品質資料的處理,因此對品質因子的設定、儲存及擷取必須做進一步的處理,以免造成資料因新增或刪除所形成的異?,F象。附有品質因子的資料欄位可聯(lián)結至相關的品質資訊,其儲存結構改變了原始關聯(lián)資料庫中資料欄位值必須是單一值的限制,使每項有品質因子的資料欄位都以下列序對方式儲存資料。綜上論述,資料品質的優(yōu)劣不只是資料倉儲系統(tǒng)成敗的關鍵,更攸關國家人民的福祉,但是,在建置資料倉儲的過程中資料品質的維護與提升,通常需要耗費相當大的人力及時間成本,所以,發(fā)展自動化、有效率且極具正確性的資料品質管控系統(tǒng)及相關作業(yè)流程機制等,益顯重要。在實作及應用方面, Helfert and Herrmann以瑞士某家銀行的資料倉儲系統(tǒng)為例,提出一個維持高資料品質的方法(以詮釋資料為基礎之資料品質系統(tǒng))[4]。Jarke et al倡議一個以擴充性儲存庫為基礎的一種資料倉儲架構,但此架構主要專注在資料倉儲系統(tǒng)設計及建置階段的品質控管,相對的也較少注意到資料倉儲內的資料品質問題。本文第二節(jié)回顧資料品質相關文獻,第三節(jié)描述階層性資料品質模式,第四節(jié)以環(huán)保部門資訊整合之資料品質管控作為探討實例,第五節(jié)為結論。據估計約有六成以上的資料倉儲系統(tǒng)宣告失敗,其主要的原因是沒有充分的時間與努力來解決系統(tǒng)中的資料品質問題[9]。一般來說,資料倉儲可視為一種整合性的資料儲存體,其內部所儲存的資料是由多個分散式、自主性及異質性的資訊源中,萃取並整合而來的,由此相對地更突顯出資料倉儲中資料品質問題的重要性。在資料擷取的階段中,原有的資料必須經由檢視,找出其中問題或錯誤,並且儘可能解決這些問題。的一份調查報告顯示[8],美國企業(yè)因資料品質的問題,每年損失6千億美元。事實上,資料品質的問題在傳統(tǒng)資料庫與整合性資訊系統(tǒng)(或資料倉儲)有相當差異,在資料整合過程中,來源資料因為使用者輸入錯誤或組織環(huán)境隨著時間的推移而改變,這些都會影響所存放資料的品質。由於單一資料來源的資料品質控管程序與多個資料來源的控管程序差異甚大,現行資料倉儲相關技術可否有效提昇資料整合後的資料品質問題,頗值得探討。Data Warehousing Institute(Eliction, Transform, Load,ETL)作業(yè)程序,將各個不同來源的資料整合匯入資料倉儲。一個主要的因素是資料來源本身充滿了許多有問題的資料,是以如何有效地處理資料整合系統(tǒng)或是資料倉儲環(huán)境所衍生的資料品質問題,已是當前學術界與實務界亟為關注的課題。因此儲存在資料倉儲中的資料通常是歷史性資料,具有時序上的變化,是以資料品質的問題會
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1