【導讀】使用決策樹進行分類?;谟柧毤纬梢粋€模型,訓練集中的類標簽是已知的。對連續(xù)性字段進行建模和預測。模型可以用分類規(guī)則,決策樹,或者數(shù)學方程的形式。估計模型的準確率。測試集和訓練集是獨立的。有監(jiān)督學習(分類). 無監(jiān)督學習(聚集). 提供一組屬性,然后尋找出訓練集中存在類別。對數(shù)據(jù)進行預處理,消除噪音和丟失值。去掉不相關或者冗余的屬性。對磁盤駐留數(shù)據(jù)的處理能力。對模型的可理解程度。每個分叉都是分割的一個部分。決策樹生成算法分成兩個步驟。按照決策樹上采用的分割屬性逐層往下,直到一個葉子節(jié)點。自上而下分而治之的方法。所有記錄用所選屬性遞