freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

網(wǎng)上新聞資源自動采集系統(tǒng)(編輯修改稿)

2024-09-01 10:18 本頁面
 

【文章內容簡介】 到服務器的。你只要看一下請求的標題,而不需要看主體內容。訪問記錄應該在稱作Cookie的標題區(qū)被發(fā)送。也許會有很多種這樣的cookie,而其它的cookie也會被發(fā)送。檢查來自服務器的回復信息:你有另外一個訪問記錄嗎?你不應該擁有另外一個訪問記錄。如果你有一個跟以前相同的session,服務器會表現(xiàn)異常,但那不構成問題。如果你有一個新的訪問記錄,那么服務器不會從你的請求中識別出這個session。通常這都發(fā)生在請求不包含訪問記錄的情況下。但是服務器也會使用其它方法去追查session,或是檢測session是否被盜用。如果訪問記錄沒有在請求中發(fā)送,兩個中的一個就出錯。要么就是這個cookie在之前的回復里沒有被檢測到,要么就是這個cookie沒有被選中與這個新的請求一起發(fā)送。HttpClient自動地解析回復中發(fā)送的cookie,并把它們放到一個cookie貯存器里。HttpClient用一個可配置的cookie結構決定來自服務器的cookie是否正確。系統(tǒng)預置的結構是嚴格遵守RFC2109的,但是很多服務器都不是這樣的。根據(jù)cookie結構來執(zhí)行,直到這個cookie被接納并被存到cookie儲存器里。如查這個cookie是從之前的回復中被接納的,但仍然沒有同新的請求一起發(fā)送,那么要去確認一下HttpClient是否用的同一個cookie儲存目標。如果你使用全用同一個HttpClient目標去執(zhí)行這兩個請求,那么這將會成為一個阻礙,除非你明確地掌握了cookie儲存目標。如果這個cookie仍然沒有跟請求一起發(fā)送,去確認一直你所請求的URL是否在這個cookie范圍內。Cookie只會被發(fā)送到cookie scope所規(guī)定的區(qū)域和路徑。主機的cookie不會被發(fā)送到主機。一個區(qū)域名為.的cookie可以發(fā)送到上面兩個地方。一個開頭沒有圓點的的cookie是不會被發(fā)送到的。這種情況可以靠在開頭增加圓點而解決。有些服務器不能檢測到單獨標題塊里發(fā)送過來的多個cookie。那么可以建議HttpClient將有的cookie放到一個單獨的標題塊。如果這樣都沒用的話,那麻煩就來了。服務器會用另外的方法去追蹤session,比如說被稱為Referer的標題區(qū)。將這塊區(qū)聯(lián)接到之前請求中的URL。如果這樣也沒用的話,你就要將應用軟件程序里的請求同服務器產生的相應的請求比較一下。在第5步里POST請求的指示也同樣適用于GET請求。這個對GET來說甚至更簡單,因為你沒有實體部分。分析格式現(xiàn)在應該來分析一下網(wǎng)頁里HTML標記所闡釋的格式。HTML里的格式是一系列的名值對,稱作參數(shù)。這里的一部分數(shù)值可以輸入到瀏覽器中。用分析HTML標記的方法可以讓你了解哪些參數(shù)需要你去闡釋,以及如何將它們發(fā)送到服務器。在網(wǎng)頁的頁面上查找這個form標簽。也許在這個頁面上會有很多的格式,但是這些格式都是不能輸入東西的。查找你想要提交的格式,然后查找相關的form標簽。我們從這個form標簽的屬性開始:Method=這個標簽定義了提交格式所用的方法。如果是GET或是未定義的類型,你需要創(chuàng)造一個GET請求。具體做法是在鏈接上增加一個詢問字符串參數(shù),把這些參數(shù)放入請求實體中,讓它們成為請求的一部分。做法已經(jīng)在步驟5中論述過了。action=這個標簽定義請求所要傳遞到的鏈接地址。不要試著從瀏覽器的地址塊里得到這個鏈接地址。瀏覽器會自動重新定向而且只會顯示最后的鏈接地址,和這個定義的地址是完全不同的。包含請求字符串的鏈接地址可以定義一些參數(shù)。如果是這樣的話,請記住這些參數(shù)。enctype=這個標簽定義請求實體中的MIME類型。兩種常見情況是鏈接編碼(默認)和多部分MIME類型。請注意這些條款是非正式的,準確的參數(shù)值會在別的地方被定義。這個地方的定義只能用在POST方法中。如果用GET方法,參數(shù)將一直使用url編碼,但不是在實體中。acceptcharset=這個標簽定義瀏覽器允許使用者輸入的數(shù)據(jù)類型。這里不討論這個問題但如果你經(jīng)歷過字符集相關的問題的話,你會自然考慮用什么參數(shù)值。除了行動定義的詢問參數(shù)之外,形式參數(shù)還可以被HTML中form和/form之間的標簽定義。以下是一張可以定義參數(shù)的標簽表。除非在別的地方被定義過,否則它們就可以定義參數(shù)的名稱。參數(shù)值通常需要使用者的輸入。input type=text name=...input type=password name=...定義一個單行輸入?yún)^(qū)域。在這個區(qū)域中按下回車鍵將會返回所輸入的數(shù)據(jù)。所以這個參數(shù)值就是使用者單行輸入的數(shù)據(jù)。input type=text readonly name=... value=...input type=hidden name=... value=...定義不可被使用者修改的參數(shù),參數(shù)值會被直接定義。input type=radio name=... value=...input type=checkbox name=... value=...定義一個可以被包含或省略的參數(shù)。通常有兩個標簽的名稱會相同。比如無線電按鈕,只能有一個選項,一個參數(shù)值。對于檢查箱,可以有更多選項。對于一個選項,每一個被選中的檢查箱都會是相同的名字。input type=submit name=... value=...button type=submit name=... value=...定義提交按鈕。只有這個按鈕被激活后參數(shù)才會被傳遞到格式里。如果另一個按鈕被使用,或者參數(shù)是用回車鍵決定提交,參數(shù)就不會成為數(shù)據(jù)提交部分。如果名稱定義也缺失,將不會有任何參數(shù)通過這個按鈕被提交到格式中。textarea name=”…”textarea value=”…” readonly定義一個多行的輸入?yún)^(qū)域。在只讀的情況下,這個參數(shù)值就是textarea和/textarea標簽之間的內容。select name=”…” multiple}}}option value=”…”…/option}}}option value=”…”…/option}}}…/select定義一個選擇欄或是一個下拉菜單。如果多個屬性不能顯現(xiàn),那么只能選一個。每個被選項都有一個名值對。如果沒有值屬性,那么這個選項的值就是option和/option之間的內容。input type=”image” name=”…”定義一個圖像,當點擊它時,可以提交格式。如果點擊這個圖像提交格式,格式數(shù)據(jù)里會增加兩個參數(shù)。它的名稱屬性里會后綴上”.X”和”.Y”。這些參數(shù)值是跟你點擊時鼠標指針指在圖像上時相一致的。如果名稱屬性丟失了,那么格式數(shù)據(jù)里就不能增加參數(shù)。input type=”file” name=”…”定義一個文件選擇夾。用戶可以選擇一個必須作為格式數(shù)據(jù)的一部分而發(fā)送的文件。只有當這個編碼是多型標頭規(guī)格的時候才有可能。不像其它的參數(shù),這個文件不僅僅是劃為一個簡單名值對。上傳文件不適合初學者做。標簽被用來闡釋靜態(tài)的HTML上的參數(shù)。而在活動的HTML上,用特殊的JavaScript,可以在格式提交前將參數(shù)值改變。再次分析格式在你決定用哪個URL和格式的名值對后,你應該退出你之前用來獲取HTML資料的程序,重新開始這個程序,并且在新的網(wǎng)頁上重復這個分析。這兩個網(wǎng)頁的大部分參數(shù)是一樣的。但是有些參數(shù),尤其是那些來自隱藏的輸入?yún)^(qū)的參數(shù),會隨著session的變化而改變,甚至會隨著每次請求的變化而改變。URL也是一樣的。保持一致的參數(shù)可以硬編碼到你的程序里。如果參數(shù)改變了(除了用戶輸入的),那么你的應用軟件程序就要用格式去請求頁面,并在其運行的時候提取那些活動的參數(shù)。如果你夠幸運的話,你只需要用簡單的字符串就可以找到它們。但是如果不走運的話,你就要用HTML解析器來分析這個頁面了。要注意的是服務器上格式的重置可能會在任何時刻中止你的應用程序。當發(fā)生這種情況的時候,就要靠服務器發(fā)送回的重置后的新格式來重新進行分析,并相應地更改你的應用程序。分析過此格式后,應創(chuàng)建一個和瀏覽器所生成匹配的請求。如果采用GET的話,對于參數(shù)來說,只需給字符串添加名稱值對。如果采用POST,就會復雜些。這取決于服務器跟你所匹配的瀏覽器行為有多近。例如,一個servelet不會區(qū)分字符串里的參數(shù)以及實體參數(shù)的網(wǎng)址編碼參數(shù)。但是其它伺服務器端的碼可能會區(qū)分。安全方法是總是和瀏覽器行為匹配精確。HttpClient支持編碼類型和網(wǎng)址編碼,以及新的多型標頭規(guī)格。發(fā)出網(wǎng)址編碼參數(shù),得用POST請求,且在那直接添加參數(shù)。用新的多型標頭規(guī)格發(fā)出參數(shù),得在搜集多編碼請求中搜集參數(shù),且添加POST請求。你將會在多文件包中發(fā)現(xiàn)文件上傳支持。注意,這些技術是互斥的,它們不可以互相連接。用網(wǎng)絡字符串定義的參數(shù)可以保留在那。發(fā)送請求。發(fā)現(xiàn)服務器回復:得到一個狀態(tài)碼303或者307嗎?那個稱作重定向。按著重定向一直到最終頁,發(fā)現(xiàn)如此回復。見下面重定向步驟六。你得到你期待的頁面嗎?如果服務器回復你POST請求,則表示出現(xiàn)一個問題,試著加強或減弱期望的持續(xù)信號交換,或者把通訊協(xié)定轉到HTTP/。如果不行的話…觀察你發(fā)送的請求對于一個瀏覽器的請求來說,有沒有顯著的差異?有很多程序可以用以發(fā)送瀏覽器請求。有些已在郵寄單上的回復提及。問題的可能是錯過的參數(shù)或者是錯的參數(shù),且在標題字段有差異。參數(shù)取決于你。標題字段的一般規(guī)定是,你的發(fā)送須跟瀏覽器所發(fā)送的相同。字段順序無規(guī)定。但是需要警戒的是:有些標題字段是由HttpClient控制的,不能明確設置。其它標題字段用以表示瀏覽器的性能,但是你的應用軟件程序并非有。這樣的話,你應用軟件的請求應該且必須不同。以下是標題所需特殊要求的不完全列表:Host由HttpClient控制。值通常是從你接的網(wǎng)址獲取。有可能設一個不同的值,“虛擬主機”。ContentType:ContentLength:TransferEncoding:由HttpClient控制。值通常是從請求獲取。Connection:通常由HttpClient來控制,來解決鏈接存活。把它放在一邊,或者將值設定為“關”。ContentEncoding:用以說明處理壓縮回復的能力。除非你已經(jīng)準備好還原了,否則不要設定這個。按照重新輸入指令行使服務器在回復POST請求時用303或307狀況代碼答復是很常見的。這些重新輸入指令說明你的應用程序必須重新發(fā)送一個請求來取回當初發(fā)送POST請求這個操作所產生的真實結果。HttpClient可以設置使其自動地按照重新輸入指令行使。我們要確定這個HttpClient與其要求是相符的,但是我們不能阻止你在你的程序里執(zhí)行一個不同的操作。要注意的是可能會連著不止一個重輸入指令出現(xiàn)。那么你的程序就得照著一個個的重輸入指令去操作,但是要先搞清楚你沒有進入一個無限循環(huán)下去的狀態(tài)。如果發(fā)現(xiàn)有連著兩個以上的重輸入指令出現(xiàn),這樣就有可能出問題了。退出你的應用程序可以發(fā)送盡可能多的GET和POST請求,也能按照多個重輸入指令去操作。但是要記住有個session是被服務器追蹤的。一旦你的程序完成了,如果網(wǎng)頁提供了一個退出的鏈接,那么你還需發(fā)送最后一個請求以便退出。這就是通知服務器那些session可以丟棄了。如果服務器阻止同一個用戶ID多次登陸,而你的程序又必須反復地運行,那么你就只能退出程序了。Client HTTP Programming PrimerAboutThis document has evolved from discussions on the HttpClient mailing lists. Although it refers to HttpClient, the concepts described here apply equally to HttpComponents or SUN39。s HttpURLConnection or any other HTTP munication library for any programming language. So you might find it useful even if you39。re not using Java and HttpClient.CaveatA web site can be redesigned at any point in time. The server then sends different documents and a browser will display the new content. The user easily adjusts to click the appropriate links, and the browser municates via HTTP as specified by the new documents from the server. Your application that only mimicks a browser will simply break.If you want to implement a solid application, you should use only published APIs. For example, to check for new mail on your webmail account, you should ask the webmail provider for POP or IMAP access. These are standardized protocols supported my most EMail client applications. If you want to have a newsticker, look for RSS feeds from the provider and applications that
點擊復制文檔內容
法律信息相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1