freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘概念與技術(shù)(第三版)部分習(xí)題答案-預(yù)覽頁

2025-07-14 00:32 上一頁面

下一頁面
 

【正文】 在線翻譯 數(shù)據(jù)倉庫和數(shù)據(jù)庫有何不同?有哪些相似之處?答:區(qū)別:數(shù)據(jù)倉庫是面向主題的,集成的,不易更改且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策,數(shù)據(jù)庫由一組內(nèi)部相關(guān)的數(shù)據(jù)和一組管理和存取數(shù)據(jù)的軟件程序組成,是面向操作型的數(shù)據(jù)庫,是組成數(shù)據(jù)倉庫的源數(shù)據(jù)。翻譯結(jié)果重試抱歉,系統(tǒng)響應(yīng)超時,請稍后再試使用你熟悉的現(xiàn)實(shí)生活的數(shù)據(jù)庫,給出每種數(shù)據(jù)挖掘功能的例子。例如,具有高GPA 的學(xué)生的一般特性可被用來與具有低GPA 的一般特性比較。這個規(guī)則指出正在學(xué)習(xí)的學(xué)生,12%(支持度)主修計(jì)算機(jī)科學(xué)并且擁有一臺個人計(jì)算機(jī)。?? 聚類分析的數(shù)據(jù)對象不考慮已知的類標(biāo)號。?? 數(shù)據(jù)演變分析描述和模型化隨時間變化的對象的規(guī)律或趨勢,盡管這可能包括時間相關(guān)數(shù)據(jù)的特征化、區(qū)分、關(guān)聯(lián)和相關(guān)分析、分類、或預(yù)測,這種分析的明確特征包括時間序列數(shù)據(jù)分析、序列或周期模式匹配、和基于相似性的數(shù)據(jù)分析 假設(shè)給定的數(shù)據(jù)集的值已經(jīng)分組為區(qū)間。 ∴ median= 歲。(b) 該數(shù)據(jù)的眾數(shù)是什么?討論數(shù)據(jù)的峰(即雙峰、三峰等)。(d) 你能(粗略地)找出數(shù)據(jù)的第一個四分位數(shù)(Q1)和第三個四分位數(shù)(Q3)嗎?數(shù)據(jù)集的第一個四分位數(shù)應(yīng)發(fā)生在25%處,即在(N+1)/4=(27+1)/4=7 處。一個數(shù)據(jù)集的分布的5 數(shù)概括由最小值、第一個四分位數(shù)、中位數(shù)、第三個四分位數(shù)、和最大值構(gòu)成。這樣,他可以展示所有數(shù)的分位數(shù)信息,而為獨(dú)立變量測得的值(縱軸)相對于它們的分位數(shù)(橫軸)被描繪出來。落在該線以上的點(diǎn)表示在y 軸上顯示的值的分布比x 軸的相應(yīng)的等同分位數(shù)對應(yīng)的值的分布高。 給出的age 數(shù)據(jù)回答下列問題: (a) 使用分箱均值光滑對以上數(shù)據(jù)進(jìn)行光滑,箱的深度為3。解釋你的步驟。) 步驟2:將數(shù)據(jù)劃分到大小為3 的等頻箱中。落到簇的集外的值可以被視為離群點(diǎn)。作為選擇,等寬箱可被用來執(zhí)行任何分箱方式,其中每個箱中的數(shù)據(jù)范圍均是常量。值域是[new_min, new_max]。值域是(-,)。(d) 對于給定的數(shù)據(jù),你愿意使用哪種方法?陳述你的理由。 (c) 聚類。我們可以使用一種簡單的聚類技術(shù):用 2 個最大的間隙將數(shù)據(jù)分成 3 個箱。使用大小為 5 的樣本和層“青年”,“中年”和“老年”。和兩個度量:count和charge。l 沿時間(time)維從 day “上卷”到 year。答:SQL查詢語句如下:select doctor, SUM(charge) from feewhere year=2004group by doctor 假定 BigUniversity 的數(shù)據(jù)倉庫包含如下 4 個維:student(student_name,area_id , major, status, university) , course(course_name, department) , semester(semester, year) 和 instructor(dept, rank);2 個度量:count 和 avg_grade。(b) 由 基 本 方 體 [student, course, semester, instructor] 開 始 , 為 列 出 BigUniversity 每個學(xué)生的 CS 課程的平均成績,應(yīng)當(dāng)使用哪些特殊 的 OLAP 操作。這些特殊的聯(lián)機(jī)分析處理(OLAP )操作有:i. 沿課程(course)維從 course_id “上卷”到 department。c) 如果每維有 5 層(包括 all),如“studentmajorstatusuniversityall ”, 該立方體包含多少方體?這個立方體將包含 54=625 個方體。(a)畫出該數(shù)據(jù)倉庫的星形模式圖。l 沿時間(spectator)維從spectator_id “上卷”到 status 。 答:星形模式或雪花模式的相似點(diǎn)是它們包含一個事實(shí)表和一些維表。星型模式的優(yōu)點(diǎn)是簡單、這使得它更有效,但它需要更多的空間。(a)假定每維只有一層,畫出完整的立方體的格。 小計(jì): 1,001,100AB: 1,000,000*100=100,000,000。 答:順序計(jì)算,:計(jì)算二維平面需要的總主內(nèi)存空間是:總空間 = (1001,000) + (1,000,000 10) + (100 10,000) = 20,100,000 單元* 4字節(jié)/單元= 80,400,000 字節(jié) Apriori算法使用子集支持性質(zhì)的先驗(yàn)知識。(b) 證明項(xiàng)集s的任意非空子集s’的支持至少和s的支持度一樣大。在Apriori算法中產(chǎn)生候選是昂貴的(由于聯(lián)接),而FP增長不產(chǎn)生任何候選。給定最小支持度閥值25%,最小置信度閥值50%,該關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?答:根據(jù)規(guī)則, support = 2000/5000 = 40%, confidence = 2000/3000 = %. 該關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則.(b)根據(jù)給定的數(shù)據(jù),買 hot dogs獨(dú)立于買humburgers嗎?如果不是,二者之間存在何種相關(guān)聯(lián)系。 給定一個具有50個屬性(每個屬性包含100個不同值)的5GB的數(shù)據(jù)集,而你的臺式機(jī)有512M內(nèi)存。假設(shè)有C類標(biāo)簽。在并行計(jì)算時,我們可以通過計(jì)算avcset節(jié)點(diǎn)來減少同一水平上的掃描次數(shù),使用這種每節(jié)點(diǎn)小avcsets的方法,我們或許可以適應(yīng)內(nèi)存的水平。對于給定的行,count表示department,status,age和salary在該行具有給定值的元組數(shù)。該元組status的樸素貝葉斯分類是什么?(SVM)是一種具有高準(zhǔn)確率的
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1