正文內(nèi)容

htmlparser使用說(shuō)明書(shū)-文庫(kù)吧資料

2025-06-04 22:30本頁(yè)面

　　

【正文】 am args */ public static void main(String[] args) { try { URL ur = new URL(:8083/injs100/)。import 。import 。import 。import 。package parser。4. 入口方法main：該方法初始化HTMLParser并注冊(cè)新的節(jié)點(diǎn)解析器，解析文檔并打印運(yùn)行結(jié)果。這個(gè)方法的必要性在于HTML對(duì)格式的要求很不嚴(yán)格，在很多的HTML文檔中的一些標(biāo)簽經(jīng)常是有開(kāi)始標(biāo)識(shí)，但是沒(méi)有結(jié)束標(biāo)識(shí)，由于瀏覽器的超強(qiáng)適應(yīng)能力使這種情況出現(xiàn)的很頻繁，因此HTMLParser利用這個(gè)方法來(lái)輔助判斷一個(gè)標(biāo)簽是否已經(jīng)結(jié)束。從上圖可清楚看出，復(fù)合標(biāo)簽事實(shí)上是對(duì)簡(jiǎn)單標(biāo)簽的擴(kuò)展，HTMLParser在處理一個(gè)復(fù)合標(biāo)簽時(shí)需要知道該標(biāo)簽的起始標(biāo)識(shí)以及結(jié)束標(biāo)識(shí)，也就是我們?cè)谇懊娼o出的源碼中的兩個(gè)方法getIds和getEnders，一般來(lái)講，標(biāo)簽出現(xiàn)都是成對(duì)的，因此這兩個(gè)方法一般返回相同的值。而像a href=xxxxHome/a這種類型的標(biāo)簽，因?yàn)闃?biāo)簽會(huì)嵌套文本或者其他標(biāo)簽的稱為復(fù)合標(biāo)簽，也就是對(duì)應(yīng)著CompositeTag這個(gè)類。我們先看看下面這個(gè)HTMLParser的節(jié)點(diǎn)類層次圖：如上圖所示，HTMLParser將一個(gè)文檔分成三種節(jié)點(diǎn)分別是：Remark（注釋）；Text（文本）；Tag（標(biāo)簽）。在這個(gè)例子中我們僅需要提取鏈接標(biāo)簽以及我們自定義的一個(gè)GO標(biāo)簽。2. 靜態(tài)屬性lnkFilter：這是一個(gè)NodeFilter的匿名類所構(gòu)造的實(shí)例。}public String getMethod(){(method)。}public String[] getEndTagEnders (){return (mEndTagEnders)。public String[] getIds (){return (mIds)。/*** WML文檔的GO標(biāo)簽解析器* author Winter Lau*/staticclass WmlGoTag extends CompositeTag {privatestaticfinal String[] mIds = new String[] {GO}。returnfalse。}/*** 解析出所有的鏈接，包括行為a與go*/static NodeFilter lnkFilter = new NodeFilter() {publicboolean accept(Node node) {if(node instanceof WmlGoTag)returntrue。}while(true)。if(()0)(\r\n)。do{String line = ()。BufferedReader in = new BufferedReader(new FileReader(f))。}}}/*** 獲取測(cè)試的WML腳本內(nèi)容* return* throws Exception*/static String getWmlContent() throws Exception{URL url = (/demo/htmlparser/)。}elseif(node instanceof WmlGoTag){WmlGoTag go = (WmlGoTag)node。if(node instanceof LinkTag){LinkTag link = (LinkTag)node。i()。//遍歷符合條件的所有節(jié)點(diǎn)NodeList nlist = (lnkFilter)。(new WmlGoTag ())。(getWmlContent())。/*** 用來(lái)遍歷WML文檔中的所有超鏈接* author Winter Lau*/publicclass HyperLinkTrace {publicstaticvoid main(String[] args) throws Exception {//初始化HTMLParserParser parser = new Parser()。import 。import 。import 。import 。import ?；仨?yè)首2. package 。下面我們先給出一個(gè)簡(jiǎn)單的例子，然后再敘述其中的道理。a href=?cat_id=1Java自由人/a或者：anchorJava自由人go href= method=getpostfield name=cat_id value=1//go/anchor（更多的時(shí)候使用 anchor 的鏈接用來(lái)提交一個(gè)表單。還有就是你同樣可以用 HTMLParser 來(lái)處理 XML 文檔，而 XML 文檔中所有的標(biāo)簽都是你自己定義的。首先我們先解釋一下什么叫自定義標(biāo)簽，我把所有不是 HTML 腳本語(yǔ)言中定義的標(biāo)簽稱之為自定義標(biāo)簽，比如可以是scriptlet、book等等，這是我們自己創(chuàng)造出來(lái)的標(biāo)簽。HTMLParser 的強(qiáng)大功能還體現(xiàn)在你可以修改每個(gè)標(biāo)簽的屬性或者它所包含的文本內(nèi)容并生成新的 HTML 文檔，比如你可以文檔中的鏈接地址偷偷的改成你自己的地址等等。如果是 HTML 文檔，那么用 HTMLParser 已經(jīng)差不多可以滿足你至少 90％的需求?，F(xiàn)在該項(xiàng)目的最新版本是 Integration Build ，與之前版本的差別在于代碼結(jié)構(gòu)的調(diào)整、當(dāng)然也有一些功能的提升以及 BugFix，同時(shí)對(duì)字符集的處理也更加自動(dòng)了。HTMLParser 是一個(gè)用來(lái)解析 HTML 文檔的開(kāi)放源碼項(xiàng)目，它具有小巧、快速、使用簡(jiǎn)單的特點(diǎn)以及擁有強(qiáng)大的功能。筆者個(gè)人的感覺(jué)是沒(méi)什么用處，如果你需要什么特定的功能，還不如自己寫(xiě)一個(gè)，想在這些里面找到適合你需要的，化的時(shí)間可能更多。其他VisitorHTMLParser還定義了幾個(gè)其他的Visitor。想讓它們都出來(lái)，只需要NodeVisitor visitor = new NodeVisitor( true, true) {輸出結(jié)果：beginParsingThis is Tag:!DOCTYPE html PUBLIC //W3C//DTD XHTML Transitional//ENThis is Text:Txt (121[0,121],123[1,0]): \nThis is Tag:headThis is Tag:meta equiv=ContentType content=text/html。我們?cè)儆孟旅娴姆椒ㄕ{(diào)用看看：NodeVisitor visitor = new NodeVisitor( true, false) {輸出結(jié)果：beginParsingThis is Tag:!DOCTYPE html PUBLIC //W3C//DTD XHTML Transitional//ENThis is Text:Txt (121[0,121],123[1,0]): \nThis is Tag:meta equiv=ContentType content=text/html。我們先把recurseSelf設(shè)置成true，看看會(huì)發(fā)生什么。因?yàn)槲以O(shè)置的 recurseChildren和recurseSelf都是false，所以Visitor沒(méi)有訪問(wèn)子節(jié)點(diǎn)也沒(méi)有訪問(wèn)根節(jié)點(diǎn)的內(nèi)容。}catch( Exception e ) {()。}}。}publicvoid visitEndTag (Tag tag){message(visitEndTag:+())。}publicvoid visitRemarkNode (Remark remark) {message(This is Remark:+())。NodeVisitor visitor = new NodeVisitor( false, false ) {publicvoid visitTag(Tag tag) {message(This is Tag:+())。下面是一個(gè)最常見(jiàn)的NodeVisitro的例子。Visitor則是遍歷內(nèi)容樹(shù)的每一個(gè)節(jié)點(diǎn)，對(duì)于符合條件的節(jié)點(diǎn)進(jìn)行處理。下面介紹使用Visitor訪問(wèn)內(nèi)容的方法。HTMLParser訪問(wèn)結(jié)果內(nèi)容的方法有兩種。這個(gè)不在本文的討論范圍以內(nèi)，大家可以自己實(shí)驗(yàn)一下。NodeList nodes = (filter)。 LinkStringFilter這個(gè)Filter用于判斷鏈接中是否包含某個(gè)特定的字符串，可以用來(lái)過(guò)濾出指向某個(gè)特定網(wǎng)站的鏈接。NodeList nodes = (filter)。注意是可顯示的字符串，不可顯示的字符串中的內(nèi)容（例如注釋，鏈接等等）不會(huì)被顯示。NodeList nodes = (filter)。在HTMLParser使用入門(mén)（2） Node內(nèi)容中我們已經(jīng)了解了Node的不同類型，這個(gè)Filter就可以針對(duì)類型進(jìn)行過(guò)濾。NodeFilter filter = new XorFilter(filterID, filterChild)。 XorFilter把前面的AndFilter換成NotFilter測(cè)試代碼：NodeFilter filterID = new HasAttributeFilter( id )。NodeFilter filterChild = new HasChildFilter(filterA)。NodeFilter filter = new OrFilter(filterID, filterChild)。輸出結(jié)果：getText:div id=logoindex================================================= OrFilter把前面的AndFilter換成OrFilter測(cè)試代碼：NodeFilter filterID = new HasAttributeFilter( id )。NodeFilter filterChild = new HasChildFilter(filterA)。 AndFilterAndFilter可以把兩種Filter進(jìn)行組合，只有同時(shí)滿足條件的Node才會(huì)被過(guò)濾。HTMLParser支持對(duì)于簡(jiǎn)單類型的Filter進(jìn)行組合，從而實(shí)現(xiàn)復(fù)雜的條件。}不需要過(guò)多說(shuō)明了。IsEqualFilter的構(gòu)造函數(shù)參數(shù)是一個(gè)Node：public IsEqualFilter (Node node) {mNode = node。輸出結(jié)果：getText:div id=logoindex=================================================很簡(jiǎn)單吧。輸出結(jié)果：getText:div id=top_main=================================================getText:div id=logoindex=================================================調(diào)用方法3:NodeFilter filter = new HasAttributeFilter( id, logoindex )。調(diào)用方法2:NodeFilter filter = new HasAttributeFilter( id )。NodeList nodes = (filter)。還是用例子說(shuō)明比較容易。public HasAttributeFilter (String attribute, String value)。 HasAttributeFilterHasAttributeFilter有3個(gè)構(gòu)造函數(shù)：public HasAttributeFilter ()。如果我們用下面的方法調(diào)用：NodeFilter filter = new HasChildFilter( innerFilter, true )。注意HasChildFilter還有一個(gè)構(gòu)造函數(shù)：public HasChildFilter (NodeFilter filter, boolean recursive)如果recursive是false，則只對(duì)第一級(jí)子節(jié)點(diǎn)進(jìn)行過(guò)濾。輸出結(jié)果：getText:body=================================================getText:div id=top_main=================================================可以看到，輸出的是兩個(gè)有DIV子Tag的Tag節(jié)點(diǎn)。NodeFilter filter = new HasChildFilter(innerFilter)。呵呵。缺省的構(gòu)造函數(shù)雖然可以初始化，但是由于子節(jié)點(diǎn)的Filter是null，所以使用的時(shí)候發(fā)生了Exception。的時(shí)候HasChildFilter內(nèi)部直接發(fā)生NullPointerException。直接初始化了一個(gè)NodeFilter filter = new HasChildFilter()。下面可以針對(duì)這兩個(gè)DIV節(jié)

點(diǎn)擊復(fù)制文檔內(nèi)容

教學(xué)教案相關(guān)推薦

用戶使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】用戶使用說(shuō)明書(shū)注意事項(xiàng)·本使用說(shuō)明書(shū)專門(mén)用于指導(dǎo)您使用手機(jī)的功能?！け竟咀裱掷m(xù)發(fā)展戰(zhàn)略，因此保留對(duì)產(chǎn)品的功能、界面和外形進(jìn)行修改而不通知用戶的權(quán)利?！ひ虍a(chǎn)品軟件版本升級(jí)等因素，描述如和實(shí)際產(chǎn)品有出入，則以實(shí)際產(chǎn)品為準(zhǔn)?！ふ?qǐng)按照正常的步驟關(guān)機(jī)，開(kāi)機(jī)狀態(tài)下或正在充電時(shí)請(qǐng)不要隨意卸取電池，以防引起數(shù)據(jù)丟失等不良結(jié)果。請(qǐng)按照正確的方向

2024-08-17 04:32

住宅使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：住宅使用說(shuō)明書(shū) 房條件:《建筑工程竣工備案表》《住宅質(zhì)量保證書(shū)》和《住宅使用說(shuō)明書(shū)》及配套設(shè)施驗(yàn)收合格證交房條件的法律規(guī)定對(duì)于交房的標(biāo)準(zhǔn)，法律規(guī)定比較零散，各地不盡一致。但是，從相關(guān)...

2024-10-25 15:26

雨燕使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：雨燕使用說(shuō)明書(shū) 篇一：雨燕保養(yǎng)使用手冊(cè)2013雨燕車(chē)主保養(yǎng)使用手冊(cè) 時(shí)尚外形的小車(chē)可以說(shuō)是日系車(chē)中的擅長(zhǎng)領(lǐng)域，Swift雨燕便是于2004年巴黎車(chē)展中正式亮相的小型車(chē)款。自04年11月日本...

2024-10-28 16:34

冰柜使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：冰柜使用說(shuō)明書(shū) 冰柜使用說(shuō)明書(shū) 1、冰箱在搬運(yùn)、放置過(guò)程中傾斜角不要超過(guò)45度。長(zhǎng)途運(yùn)輸?shù)睦涔駪?yīng)放置2小時(shí)后方可通電使用，以防止系統(tǒng)壓力過(guò)高而損壞。第一次使用應(yīng)當(dāng)先讓空柜運(yùn)行1小時(shí)，當(dāng)箱內(nèi)...

2024-11-02 04:41

地毯使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：地毯使用說(shuō)明書(shū) 使用說(shuō)明書(shū) 新的地毯使用初期會(huì)有輕微伏毛出現(xiàn)，屬正?，F(xiàn)象。整個(gè)使用過(guò)程中，應(yīng)注意的是地毯的清洗。清洗地毯規(guī)范及操作一、水抽清洗地毯（可適于化纖地毯）使用設(shè)備：地毯刷...

2024-11-04 22:10

老婆使用說(shuō)明書(shū)：-文庫(kù)吧資料

【摘要】第一篇：老婆使用說(shuō)明書(shū)：老婆使用說(shuō)明書(shū)：品名：民間俗稱老婆，正式場(chǎng)合可稱妻子或內(nèi)人；現(xiàn)亦叫達(dá)令化學(xué)名稱：woman 成分：水、血液和脂肪類碳水化合物，氣味幽香。理化性質(zhì)：性質(zhì)活潑，根...

2024-11-05 02:32

老婆使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：老婆使用說(shuō)明書(shū) 老婆使用說(shuō)明書(shū) 【品名】妻子- 【俗稱】媳婦兒- 【通用名】老婆- 【英文名】wife- 【化學(xué)名稱】已婚女性- 【成分】水、蛋白質(zhì)、脂肪、核糖核酸、碳水化合物以...

2024-11-05 02:23

生命使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：生命使用說(shuō)明書(shū) 生命使用說(shuō)明書(shū) 第一、做自我分析我是一個(gè)開(kāi)朗，善良，有愛(ài)心，樂(lè)于幫助他人的人。業(yè)余時(shí)間，我喜歡聽(tīng)歌、攝影、打羽毛球......以后我可能是一名會(huì)計(jì)，也可能是一名銀行職員...

2024-10-28 14:36

漆包線使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】第一篇：漆包線使用說(shuō)明書(shū) 漆包線產(chǎn)品儲(chǔ)存、防護(hù)及使用注意事項(xiàng) 一、產(chǎn)品儲(chǔ)存基本要求 1、漆包線包裝箱應(yīng)成板堆放，堆碼高度不宜超過(guò)4箱，線軸碼放最高不要超過(guò)5軸。 2、漆包線應(yīng)遠(yuǎn)離塵埃（含金屬粉...

2024-11-05 00:59

冷庫(kù)使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】......冷庫(kù)系列使用說(shuō)明書(shū)上?？系聶C(jī)電設(shè)備有限公司冷庫(kù)使用說(shuō)明書(shū)冷庫(kù)建筑的特點(diǎn)和要求　　冷庫(kù)主要用于食品的冷凍加工及冷藏，它通過(guò)人工制冷，使室內(nèi)保持一定的低溫。冷庫(kù)的墻壁、地板及平頂都敷設(shè)有一定厚

2025-07-26 10:43

房屋使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】......日喀則市藏興房地產(chǎn)開(kāi)發(fā)有限公司房屋使用說(shuō)明書(shū)二О一六年五月房屋使用說(shuō)明書(shū)（示范文本）使用說(shuō)明1、本使用說(shuō)明書(shū)為示范文本；本示范文本中相關(guān)條款后都有空白行，供開(kāi)發(fā)建設(shè)單位根據(jù)實(shí)際情況對(duì)文本條款的內(nèi)容進(jìn)行選擇、修改、增補(bǔ)或刪減。2、本示范文本是根據(jù)國(guó)務(wù)院《城市房地產(chǎn)開(kāi)發(fā)經(jīng)營(yíng)管理?xiàng)l

2025-07-26 00:56

住宅使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】住宅使用說(shuō)明書(shū)（修訂版）海南省住房和城鄉(xiāng)建設(shè)廳制版編號(hào)：感謝您購(gòu)買(mǎi)本公司開(kāi)發(fā)的商品房。為使您安全、方便、舒適使用，請(qǐng)認(rèn)真閱讀《住宅使用說(shuō)明書(shū)》說(shuō)明及全文，并妥善保存。矚慫潤(rùn)厲釤瘞睞櫪廡賴賃軔。說(shuō)明一、本《住宅使用說(shuō)明書(shū)》是根據(jù)國(guó)務(wù)院《城市房地產(chǎn)開(kāi)發(fā)經(jīng)營(yíng)管理?xiàng)l例》第三十一條和建設(shè)部《商品住宅實(shí)行住宅質(zhì)量保證書(shū)和住宅使用說(shuō)明書(shū)制度的規(guī)定》及我省商品房住宅使用的實(shí)際情況

2024-08-14 18:40

用戶使用說(shuō)明書(shū)-文庫(kù)吧資料

【摘要】用戶使用說(shuō)明書(shū)注意事項(xiàng)·本使用說(shuō)明書(shū)專門(mén)用于指導(dǎo)您使用手機(jī)的功能。·本公司遵循持續(xù)發(fā)展戰(zhàn)略，因此保留對(duì)產(chǎn)品的功能、界面和外形進(jìn)行修改而不通知用戶的權(quán)利?！ひ虍a(chǎn)品軟件版本升級(jí)等因素，描述如和實(shí)際產(chǎn)品有出入，則以實(shí)際產(chǎn)品為準(zhǔn)?！ふ?qǐng)按照正常的步驟關(guān)機(jī)，開(kāi)

2024-08-17 03:44

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

htmlparser使用說(shuō)明書(shū)-文庫(kù)吧資料

用戶使用說(shuō)明書(shū)-文庫(kù)吧資料

住宅使用說(shuō)明書(shū)-文庫(kù)吧資料

雨燕使用說(shuō)明書(shū)-文庫(kù)吧資料

冰柜使用說(shuō)明書(shū)-文庫(kù)吧資料

地毯使用說(shuō)明書(shū)-文庫(kù)吧資料

老婆使用說(shuō)明書(shū)：-文庫(kù)吧資料

老婆使用說(shuō)明書(shū)-文庫(kù)吧資料

生命使用說(shuō)明書(shū)-文庫(kù)吧資料

漆包線使用說(shuō)明書(shū)-文庫(kù)吧資料

冷庫(kù)使用說(shuō)明書(shū)-文庫(kù)吧資料

房屋使用說(shuō)明書(shū)-文庫(kù)吧資料

住宅使用說(shuō)明書(shū)-文庫(kù)吧資料

用戶使用說(shuō)明書(shū)-文庫(kù)吧資料

sigmapc使用說(shuō)明書(shū)-文庫(kù)吧資料

冷干機(jī)使用說(shuō)明書(shū)-文庫(kù)吧資料

htmlparser使用說(shuō)明書(shū)(已修改)

htmlparser使用說(shuō)明書(shū)(編輯修改稿)

htmlparser使用說(shuō)明書(shū)-wenkub.com

htmlparser使用說(shuō)明書(shū)(已改無(wú)錯(cuò)字)

htmlparser使用說(shuō)明書(shū)-資料下載頁(yè)