freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

主題型網頁發(fā)現以及網頁內信息塊發(fā)現(已改無錯字)

2022-11-24 12:49:16 本頁面
  

【正文】 中通過文字描述了一件或多件事物,是有一定主題的;如一張具體的新聞網頁就是典型的有主題網頁。 ? PlainText: 最終在瀏覽器中顯示的文本,而且這些文本不是錨文本。 ? AnchorText: 錨文本,這些文本也會在瀏覽器中顯示,但是這些文本也是跳往其他網頁的鏈接。 二、主題型網頁特點 ? 主題型網頁通常包含利用大量的文本來介紹,而且這部分文本中絕大部分都是 PlainText。 ? 將網頁以樹( Tree)的形式表現, HTML標簽以及標簽內的文本都作為樹的( Tree)節(jié)點存在于該樹中。 – HTML( HTML)成為這棵樹的根節(jié)點 – 大部分的葉子節(jié)點都是文本節(jié)點 ? 主題型網頁的噪音信息可以分成是兩種: – 一種是廣告(錨文本) – 另外一種是網頁聲明 三、主題信息塊的發(fā)現與提?。? ? 目標:為了找到主題信息的起始位置和長度,最有效的辦法就是找到這樣一個節(jié)點 p,節(jié)點 p滿足下面的條件: 假設給定的 HTML中,主題信息對應的葉子節(jié)點集合為 L,對于 L中的任何一個節(jié)點leaf都是 p的子節(jié)點。而對于 p的任何一個子節(jié)點 pc, L中都存在節(jié)點,該節(jié)點不是 pc的子節(jié)點。 算 法 ? 1. 集合 L 為樹中所有的葉子節(jié)點,并且節(jié)點不為 a標記 的子節(jié)點 ? 2. 對于 L 中的任意節(jié)點 leaf , if(! isPlainText(leaf)) L=Lleaf ? 3. averageLength=calAverageLength(L)。// 平均長度 任意節(jié)點 leaf 屬于 L, calLe
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1