【正文】
3分o o o o ?ABCD(多選題3分)得分:3分o o o o 25.《中共中央關(guān)于全面深化改革若干重大問題的決定》提出,要推進國家()和()現(xiàn)代化。 ()的方式,它會大大地節(jié)約網(wǎng)絡(luò)的成本,使得網(wǎng)絡(luò)將來越來越泛在、越來越普及,成本越來越低。 ()。 ,新興的網(wǎng)絡(luò)平臺提供了非常大的開放空間,讓人們更加有可能享有對信息的()等。 《關(guān)于推進農(nóng)業(yè)農(nóng)村大數(shù)據(jù)發(fā)展的實施意見》提出,到2020年底前,實現(xiàn)農(nóng)業(yè)農(nóng)村歷史資料的數(shù)據(jù)化、()。 ()。 ,高德交通信息服務(wù)覆蓋全國主干道路及其它()以上。 18.()年,部分計算機專家首次提出大數(shù)據(jù)概念。 ,位居第一位的是()C(單選題1分)分得分:1o o o o (單選題1分)D得分:1分 o o o o ,吳軍博士并沒有提到以下哪種方法?C(單選題1分)得分:1分o o o o ,指出網(wǎng)絡(luò)的價值在于網(wǎng)絡(luò)的互聯(lián),聯(lián)網(wǎng)的接點數(shù)與其價值呈現(xiàn)()的方式,聯(lián)網(wǎng)越多,系統(tǒng)的價值越大。貴州年貨節(jié)”,促進了貴州電子商務(wù)加快發(fā)展。 ,以下哪項不屬于數(shù)據(jù)挖掘的內(nèi)容?C(單選題1分)得分:1分o o o o C(單選題1分)得分:1分o o o o (單選題1分)得分:0分o o o o ?D(單選題1分)得分:1分o o o o data ,甲型H1N1流感在全球爆發(fā),谷歌(5000萬條歷史記錄,)測算出的數(shù)據(jù)與官方最后的數(shù)據(jù)相關(guān)性非常接近,達到了()。 ()為王的時代。 ()發(fā)明的?!康谒钠?017年大數(shù)據(jù)試題及答案通常離群點被作為“噪音”或異常被丟棄,但在欺詐檢測中卻可以通過對罕見事件進行離群點分析而得到結(jié)論。會計算各D方體有多少,總的方體個數(shù)有多少?2^n50.什么是離群點?離群點都需要刪除嗎?為什么?答:離群點:一些與數(shù)據(jù)的一般行為或模型不一致的孤立數(shù)據(jù)。答:模式分層、集合分組分層、操作導(dǎo)出的分層、基于規(guī)則的分層45.如何理解現(xiàn)實世界的數(shù)據(jù)是“骯臟的”?答:不完整的、含噪聲的、不一致的、重復(fù)的 46.多維數(shù)據(jù)倉庫有哪幾種概念模型?答:星形模式、雪花形模式或事實星座形模式。42.常用的四種興趣度的客觀度量。A 上卷 B 下鉆 C 切片 D 切塊37.通過不太詳細的數(shù)據(jù)得到更詳細的數(shù)據(jù),稱為____B____。33.解釋下列術(shù)語 34.翻譯下列術(shù)語Data Mining 數(shù)據(jù)挖掘Data warehousing 數(shù)據(jù)倉庫Data Mart 數(shù)據(jù)集市drilldown 下鉆rollup上卷OLAP 聯(lián)機分析處理Data cube 數(shù)據(jù)立方體 Association rule 關(guān)聯(lián)規(guī)則Data cleaning數(shù)據(jù)清理Data integration 數(shù)據(jù)集成 Data transformation數(shù)據(jù)變換Data reduction 數(shù)據(jù)歸約35.可以對按季度匯總的銷售數(shù)據(jù)進行___B___,來觀察按月匯總的數(shù)據(jù)。29.,使用小數(shù)定標規(guī)范化,30.從結(jié)構(gòu)角度來看,有哪三種數(shù)據(jù)倉庫模型。包括:光滑、聚集、數(shù)據(jù)泛化、規(guī)范化、屬性構(gòu)造 25. 數(shù)據(jù)歸約的策略包括哪些?答:數(shù)據(jù)立方體聚集、性子集選擇、維度歸約、數(shù)值歸約、離散化和概念分層產(chǎn)生 26.提高數(shù)據(jù)挖掘算法效率有哪幾種思路?答:減少對數(shù)據(jù)的掃描次數(shù);縮小產(chǎn)生的候選項集;改進對候選項集的支持度計算方法 27.假定屬性ine的最小值與最大值分別為12000和980到區(qū)間[,],根據(jù) minmax 規(guī)范化,ine的值73600將變?yōu)椋?631/551_。21.在數(shù)據(jù)挖掘系統(tǒng)中,為什么數(shù)據(jù)清理十分重要?答: 臟數(shù)據(jù)的普遍存在,使得在大型數(shù)據(jù)庫中維護數(shù)據(jù)的正確性和一致性成為一個極其困難的任務(wù)。其范圍限于選定的主題。它允許將各種應(yīng)用系統(tǒng)集成在一起,為統(tǒng)一的歷史數(shù)據(jù)分析提供堅實的平臺,對信息處理提供支持。這些屬性應(yīng)當排除。特征化:是目標類數(shù)據(jù)的一般特性或特征的匯總。(關(guān)聯(lián)規(guī)則反映一個事物與其它事物之間的相互依存性和關(guān)聯(lián)性,如果兩個事物或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個事物就能夠通過其他事物預(yù)測到。關(guān)聯(lián)規(guī)則是有趣的,如果滿足最小支持度閾值和最小置信度閾值。給定一個交易數(shù)據(jù)庫,其中每個事務(wù)(Transaction)t是I的非空子集,即,每一個交易都與一個唯一的標識符TID(Transaction ID)對應(yīng)。13.什么是關(guān)聯(lián)規(guī)則? 答:(關(guān)聯(lián)規(guī)則是形如X→Y的蘊涵式,其中且,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼。7. 什么是數(shù)據(jù)清理?答:填寫缺失的值,平滑噪聲數(shù)據(jù),識別、刪除離群點,解決不一致性 8. 什么是數(shù)據(jù)集成?答:集成多個數(shù)據(jù)庫、數(shù)據(jù)立方體或文件 9.什么是數(shù)據(jù)歸約?答:得到數(shù)據(jù)集的壓縮表示,它小得多,但可以得到相同或相近的結(jié)果 10.數(shù)據(jù)清理的內(nèi)容包括哪些?答:缺失值、噪聲數(shù)據(jù)、數(shù)據(jù)平滑、聚類、OLAP——online analytical processing DM——data miningKDD——knowledge discovery in databases OLTP——online transaction processingDBMS——database management system DWT——discrete wavelet transform(DMQL)--Data Mining Query Language 12.什么是數(shù)據(jù)挖掘?答:簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。A 嵩山生態(tài)區(qū)B 伏牛山地生態(tài)區(qū)C 太行山地生態(tài)區(qū)D平原生態(tài)涵養(yǎng)區(qū) :(BCD)A 新型農(nóng)業(yè)化B 農(nóng)業(yè)現(xiàn)代化C 網(wǎng)絡(luò)經(jīng)濟發(fā)展D 服務(wù)業(yè)現(xiàn)代化 (ACD)A 人口多B 貿(mào)易發(fā)達C 發(fā)展不平衡D 基礎(chǔ)弱第三篇:數(shù)據(jù)挖掘試題《數(shù)據(jù)挖掘》總復(fù)習(xí)題1.數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)什么標準進行分類?答:根據(jù)挖掘的數(shù)據(jù)庫類型分類、根據(jù)挖掘的知識類型分類、根據(jù)挖掘所用的技術(shù)分類、根據(jù)應(yīng)用分類2.知識發(fā)現(xiàn)過程包括哪些步驟?答:數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示3.什么是概念分層?答:一個映射序列,將低層概念映射到更一般的較高層概念。A 依法治污B 科學(xué)治污C 社會治污D 全民治污27.“四區(qū)三帶”區(qū)域生態(tài)網(wǎng)絡(luò)是河南推進生態(tài)省建設(shè),實施的山水林田湖生態(tài)保護與修復(fù)工程。A 綜合國力B 廣闊市場C 科技基礎(chǔ)D 文化氛圍,我省統(tǒng)籌推進了(BCD)改革,為推進供給側(cè)結(jié)構(gòu)性改革消除障礙。A 河南制造向河南創(chuàng)造的轉(zhuǎn)變B 河南速度向河南質(zhì)量的轉(zhuǎn)變C 河南產(chǎn)品向河南品牌的轉(zhuǎn)變D 河南工業(yè)向河南產(chǎn)業(yè)的轉(zhuǎn)變 (CD)之上。A 去產(chǎn)能B 去庫存C 去計劃D 去杠桿,中國(河南)自由貿(mào)易試驗區(qū)已經(jīng)規(guī)劃了(ACD)三個片區(qū)。A 選派整建隊伍B 吃透村(社區(qū))實情C 聯(lián)合“會診”定案D 開展集中整頓E 評估驗收問責F 建立持續(xù)機制 “三條紅線”指的是(ABC)。A增長速度換檔期B結(jié)構(gòu)調(diào)整陣痛期C前期刺激政策消化期D后期調(diào)整維護期“六步工作法”是指由蘭考縣探索并在全省推廣的整頓軟弱渙散基層黨組織的工作方法。A 高B 精C 尖D 缺“五大工程”是我省推動文藝繁榮發(fā)展的總要求和總抓手,所謂中原人文精神“五大工程”,指的是(ABCDE)。A擴需求B穩(wěn)工業(yè)C防風險D調(diào)結(jié)構(gòu),我?。–D)入選首批國家級專業(yè)化眾創(chuàng)空間。A 綜合國力B 廣闊市場C 科技基礎(chǔ)D 文化氛圍 (CD)之上。社會事業(yè)進步與經(jīng)濟發(fā)展水平同步提高 “三區(qū)”是指(ABD)A 產(chǎn)業(yè)集聚區(qū)B 中心商務(wù)區(qū)C 鄭東新區(qū)D 特色商業(yè)區(qū) (ABD)A 云臺山B 少林寺C 武當山D 龍門石窟,我省將著力打好(ACD)發(fā)展轉(zhuǎn)型“四大攻堅戰(zhàn)”。A.醫(yī)療衛(wèi)生水平與基礎(chǔ)教育水平同步提高B。下面哪一項不屬于這“四張牌”之列。A 雙一流B 985C 211D 雙名牌(B)A 哈