freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

太原理工大學數(shù)據(jù)挖掘考試題庫(參考版)

2024-08-16 05:20本頁面
  

【正文】 。l 采集:依靠各種傳感器并A/D或D/A轉(zhuǎn)換;l 傳輸:485串口通訊、有線或無線網(wǎng)絡(IPV4或IPV6)等;l 存儲:關(guān)系數(shù)據(jù)庫、實時數(shù)據(jù)庫、云存儲等;l 處理:統(tǒng)計、融合、分類、聚類等數(shù)據(jù)挖掘/機器學習/人工智能方法。33 物聯(lián)網(wǎng)數(shù)據(jù)特征異構(gòu)多樣化結(jié)構(gòu),來源廣,表現(xiàn)方式不同,結(jié)構(gòu)形式差異;高增長,隨著物聯(lián)網(wǎng)的發(fā)展,各種信息量幾何級增長;有噪聲,數(shù)據(jù)的多樣性對于具體的應用當然是噪聲極大,利用前需要進行分揀。xiv. 使用場合不同:文本挖掘是比信息檢索更高層次的技術(shù),可用于信息檢索技術(shù)不能解決的許多場合。xiii. 評價方法不同:信息檢索用查準率和查全率來評價其性能。xi. 著眼點不同:信息檢索著重于文檔中字、詞和鏈接;而文本挖掘在于理解文本的內(nèi)容和結(jié)構(gòu)。文本挖掘是從大量文本數(shù)據(jù)中提取以前未知的、有用的、可理解的、可操作的知識的過程。步驟:vi. 任意選擇k個對象作為初始的簇中心;vii. 計算其它對象與這k個中心的距離,然后把每個對象歸入離它“最近”的簇;viii. 計算各簇中對象的平均值,然后重新選擇簇中心(離平均值“最近”的對象值);ix. 重復第2第3步直到簇中心不再變化為止。輸入:簇的數(shù)目k和包含n個對象的數(shù)據(jù)集。v) 遺傳算法與傳統(tǒng)尋優(yōu)算法相比有什么特點?i. 遺傳算法為群體搜索,有利于尋找到全局最優(yōu)解;ii. 遺傳算法采用高效有方向的隨機搜索,搜索效率高;iii. 遺傳算法處理的對象是個體而不是參變量,具有廣泛的應用領域;iv. 遺傳算法使用適應值信息評估個體,不需要導數(shù)或其他輔助信息,運算速度快,適應性好;v. 遺傳算法具有隱含并行性,具有更高的運行效率?;咎卣鳎孩俣噍斎?、單輸出;②突觸兼有興奮和抑制兩種性能;③可時間加權(quán)和空間加權(quán);④可產(chǎn)生脈沖;⑤脈沖可進行傳遞;⑥非線性,有閾值。建樹算法的具體步驟如下:①對當前例子集合,計算各特征的互信息;②選擇互信息最大的特征Ak;③把在Ak處取值相同的例子歸于同一子集,Ak取幾個值就得幾個子集;④對既含正例又含反例的子集,遞歸調(diào)用建樹算法;⑤若子集僅含正例或反例,對應分枝標上P或N,返回調(diào)用處。首先找出最有判別力的因素,然后把數(shù)據(jù)分成多個子集,每個子集又選擇最有判別力的因素進一步劃分,一直進行到所有子集僅包含同一類型的數(shù)據(jù)為止。主算法包括如下幾步:①從訓練集中隨機選擇一個既含正例又含反例的子集(稱為窗口);②用“建樹算法”對當前窗口形成一棵決策樹;③對訓練集(窗口除外)中例子用所得決策樹進行類別判定,找出錯判的例子;④若存在錯判的例子,把它們插入窗口,重復步驟②,否則結(jié)束。首先找出最有判別力的因素,然后把數(shù)據(jù)分成多個子集,每個子集又選擇最有判別力的因素進一步劃分,一直進行到所有子集僅包含同一類型的數(shù)據(jù)為止。決策樹方法是數(shù)據(jù)挖掘中非常有效的分類方法。決策樹的葉結(jié)點是樣本的類別值。決策樹的根結(jié)點是所有樣本中信息量最大的屬性。r) 什么是決策樹?如何用決策樹進行分類?決策樹是用樣本的屬性作為結(jié)點,用屬性的取值作為分支的樹結(jié)構(gòu)。如下所示:q) 分類知識的發(fā)現(xiàn)方法主要有哪些?分類過程通常包括哪兩個步驟?分類規(guī)則的挖掘方法通常有:決策樹法、貝葉斯法、人工神經(jīng)網(wǎng)絡法、粗糙集法和遺傳算法。相異度矩陣是用于存儲所有對象兩兩之間相異度的矩陣,為一個nn維的單模矩陣。聚類分析是一種數(shù)據(jù)簡化技術(shù),它把基于相似數(shù)據(jù)特征的變量或個案組合在一起。③WEB文檔分類④其他:如地球觀測數(shù)據(jù)庫中相似地區(qū)的確定;各類保險投保人的分組;一個城市中不同類型、價值、地理位置房子的分組等。①商業(yè):幫助市場分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且用不同的購買模式描述不同客戶群的特征。聚類與分類不同,聚類要劃分的類是未知的,分類則可按已知規(guī)則進行;聚類是一種無指導學習,它不依賴預先定義的類和帶類標號的訓練實例,屬于觀察式學習,分類則屬于有指導的學習,是示例式學習。規(guī)范化的常用方法有:1. 最大-最小規(guī)范化:2. 零-均值規(guī)范化:3. 小數(shù)定標規(guī)范化:x=x0/10αm
點擊復制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1