【正文】
在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行( 5 )。A. 數(shù)據(jù)信息 B. 專業(yè)化處理 D. 內(nèi)容處理3) 隨著谷歌( 6 )和( 7 )的發(fā)布,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的 ( 8 )。A. 降水 B. 水滴 C. 水庫 D. 陽光8) 尿布啤酒是大數(shù)據(jù)分析的( 17 )A. A/B測試 B. 分類 C. 關(guān)聯(lián)規(guī)則挖掘 D. 數(shù)據(jù)聚類9) 在GAPMINDER的Wealth amp。 A. 有線數(shù)據(jù)通信 B. 無線數(shù)據(jù)通信 C. RFID D. 互聯(lián)網(wǎng)12) 數(shù)據(jù)挖掘工作的四個階段,數(shù)據(jù)挖掘占總時間的百分比%( 25 ),對于成功重要性的百分比%( 26 )A. 50 B. 20 D. 6013) MapReduce的Map函數(shù)產(chǎn)生很多的( 27 )A. key B. value C. key,value D. Hash14) PageRank是一個函數(shù),它對Web中的每個網(wǎng)頁賦予一個實數(shù)值。 B. 每次點擊計費 D. 每瀏覽一次計費17) 協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的( 31 )用戶,綜合這些用戶對某一信息的評價,形成系統(tǒng)對該指定用戶對此信息的喜好程度( 32 ),并將這些用戶喜歡的項推薦給有相似興趣的用戶。該計劃的目標是改進現(xiàn)有人們從海量和復雜的數(shù)據(jù)中獲取知識的能力,從而加速美國在科學與工程領(lǐng)域發(fā)明的步伐,增強國家安全,轉(zhuǎn)變現(xiàn)有的教學和學習方式。A. 大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運營過程 B. 規(guī)劃建設(shè)運營管理C. 規(guī)律和驗證 D. 發(fā)現(xiàn)和驗證26) 大數(shù)據(jù)科學關(guān)注大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運營過程中( 43 )大數(shù)據(jù)的規(guī)律及其與自然和社會活動之間的關(guān)系。 C. 民事訴訟 D. 手術(shù)費用32) 《數(shù)據(jù)新聞學手冊》的作者們認為,通過數(shù)據(jù)的使用,記者工作的重點從“第一個報道者”轉(zhuǎn)化成為對特定事件的影響的( 50 )。A. 置信度 C. 興趣度 D. 支持度37) 如果一個匹配中,任何一個節(jié)點都不同時是兩條或多條邊的端點,也稱作( 57 )A. 極大匹配 C完美匹配 38) 國防部高級研究計劃局(DARPA)的網(wǎng)絡(luò)內(nèi)部威脅(CINDER)計劃,旨在開發(fā)新的方法來檢測軍事計算機網(wǎng)絡(luò)與( 58 )。 D. 電子商務(wù)網(wǎng)站二、多選題41) 大數(shù)據(jù)的治理包括( 1 )A. 容量問題 B. 延遲問題 C. 安全問題 D. 成本問題42) Hadoop項目包括( 2 )A. Hadoop Distributed File System(HDFS) B. HadoopMapReduce編程模型C. HadoopStreaming D. Hadoop Common43) 基于“3A5步”動態(tài)路線圖,IBM提出了“大數(shù)據(jù)平臺”架構(gòu)。目前人們談?wù)撟疃嗟氖谴髷?shù)據(jù)技術(shù)和大數(shù)據(jù)應(yīng)用。 D. 數(shù)量59) 為充分獲取大數(shù)據(jù)潛力必須解決的主要問題是數(shù)據(jù)政策、技術(shù)和技能以及(