freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

適用于大規(guī)模文本處理的動(dòng)態(tài)密度聚類算法-資料下載頁

2025-07-17 13:00本頁面
  

【正文】 法與 SNN算法在聚類精度和聚類時(shí)間上的差異,文章分別在 Reuters21578來自 5個(gè)類別的7000篇英文語料和搜狗來自 5個(gè)類別 9950篇中文語料上進(jìn)行了聚類對(duì)比,實(shí)驗(yàn)中 SNN算法的參數(shù)設(shè)置為k=2,eps=0,minpts=2,DDBCA算法的參數(shù)設(shè)置為k=6,TSDDBCA算法的參數(shù)設(shè)置為 r=2EX,k=3。 DDBCA,TSDDBCA,SNN算法對(duì)比 數(shù)據(jù)集 聚類簇個(gè)數(shù) (單位個(gè) ) 聚類精度 執(zhí)行時(shí)間 (單位秒 ) SNN DDBCA TSDDBCA SNN DDBCA TSDDBCA SNN DDBCA TSDDBCA Reuters21578 1000 355 421 6 3000 1167 1280 15 5000 1948 2145 15 7000 2793 2906 19 平均 1565 1688 13 搜狗語料 1000 355 382 11 3000 1070 1170 13 5000 1803 2089 17 7000 2736 2957 18 9000 3520 3823 25 平均 1896 2084 16 結(jié)論 ?提出了一種能夠識(shí)別密度變化的動(dòng)態(tài)密度聚類算法DDBCA,并考慮到算法的實(shí)際應(yīng)用性,對(duì) DDBCA算法進(jìn)行了擴(kuò)充和改進(jìn),得到兩階段動(dòng)態(tài)密度聚類算法 TSDDBCA。在中英文文本語料上的實(shí)驗(yàn)結(jié)果表明, TSDDBCA算法輸入?yún)?shù)簡單,同時(shí)隨著聚類文本的規(guī)模逐漸增加,聚類簇的大小趨于穩(wěn)定,能較好的識(shí)別不均勻密度的簇類,并且 TSDDBCA具有近似線性時(shí)間效率,適用于海量文本的聚類處理。 ?實(shí)驗(yàn)是建立在上限為 9000篇的文本語料上,后續(xù)將在更大的數(shù)據(jù)上進(jìn)行測試,并考慮該算法的實(shí)際應(yīng)用性。 謝 謝!
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1