freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

統(tǒng)計(jì)學(xué)-二十一世紀(jì)的挑戰(zhàn)和機(jī)遇(doc31)-統(tǒng)計(jì)學(xué)-資料下載頁(yè)

2025-08-07 19:28本頁(yè)面

【導(dǎo)讀】為2020年的5月6日至8日。大約由50位來(lái)自世界各地的統(tǒng)計(jì)學(xué)家參加。目的是確認(rèn)統(tǒng)計(jì)學(xué)今后的挑戰(zhàn)和機(jī)遇。它主要集中于科學(xué)研究,但也涉及重要的相關(guān)領(lǐng)。域,如統(tǒng)計(jì)教育,基礎(chǔ)結(jié)構(gòu),國(guó)際前景和長(zhǎng)期目標(biāo)。該科學(xué)委員會(huì)負(fù)責(zé)起草出這份報(bào)告,在明年的這一過(guò)程中,還將收到來(lái)自該委員會(huì)其他成員和專業(yè)統(tǒng)計(jì)組織負(fù)責(zé)人的意見(jiàn)。這個(gè)報(bào)告試圖反映出這些意見(jiàn)的一個(gè)綜合觀念。統(tǒng)計(jì)本身是一門科學(xué)——從數(shù)據(jù)中學(xué)習(xí)的科學(xué),它扎根于繼續(xù)增長(zhǎng)的知識(shí)核心。表明它的根是概率論和數(shù)學(xué),同時(shí)也受到更現(xiàn)代的計(jì)算機(jī)科學(xué)的影響。統(tǒng)計(jì)也是一個(gè)不多見(jiàn)的學(xué)科交叉領(lǐng)域。應(yīng)用是它的原動(dòng)力。在為認(rèn)可的技術(shù)提供有價(jià)值的市場(chǎng)時(shí)它們激發(fā)了關(guān)于新理論和新方。假如面對(duì)廣大的聽(tīng)眾演講,委員會(huì)感到有必要來(lái)闡述科學(xué)中的統(tǒng)計(jì)角色。該問(wèn)題在研討過(guò)程中被反復(fù)提及。被選擇的這些領(lǐng)域大體上對(duì)應(yīng)于(美國(guó))國(guó)家科學(xué)基金資助的不同的方向。但社會(huì)和經(jīng)濟(jì)科學(xué)必須被不幸地排除。

  

【正文】 室效應(yīng)和 ENSO 后的 估計(jì)趨勢(shì)(實(shí)曲線),來(lái)自 Smith 等 (2020) 關(guān)于海洋表面風(fēng)速最近工作的作者們闡述了統(tǒng)計(jì)和確定性模型方法結(jié)合的另一個(gè)方法,他們是國(guó)家大氣研究中心 (NCAR)的 地球物理統(tǒng)計(jì)項(xiàng)目 相關(guān)的統(tǒng)計(jì)學(xué)家和一個(gè)海洋學(xué)者。 數(shù)據(jù)從兩個(gè)來(lái)源獲得。一個(gè)是來(lái)自美國(guó)國(guó)家 航空和宇宙航行局 (NASA)散射儀 (NSCAT)的衛(wèi)星數(shù)據(jù),這些數(shù)據(jù)有很高的空間分辨率但空間覆蓋很窄。第二個(gè)來(lái)源于所謂的國(guó)家環(huán)境預(yù)報(bào)中心 (NCFP)的全球范圍數(shù)值天氣預(yù)報(bào)模型的分析。從每 6 小時(shí)觀測(cè)值覆蓋了整個(gè)區(qū)域的意義上來(lái)說(shuō),這些數(shù)據(jù)是完全的,但是與 NSCAT 的測(cè)量相比空間分辨率低得多。 這些數(shù)據(jù)的統(tǒng)計(jì)分析所需要的技術(shù)超過(guò)了標(biāo)準(zhǔn)空間統(tǒng)計(jì)和時(shí)空統(tǒng)計(jì)。除了時(shí)間和空間的因素外,統(tǒng)計(jì)分析必須協(xié)調(diào)數(shù)個(gè)分辨率和覆蓋率不一樣的數(shù)據(jù)源,目標(biāo)是每 6 小時(shí)在整個(gè)區(qū)域提供可信賴的風(fēng)速狀態(tài)。 相關(guān)聯(lián)的數(shù)據(jù)和環(huán)境趨勢(shì) 許多環(huán)境問(wèn)題涉 及到在一段時(shí)間內(nèi)變化的識(shí)別和估計(jì)。例如一個(gè)環(huán)境監(jiān)測(cè)機(jī)構(gòu),如 EPA,用趨勢(shì)估計(jì)來(lái)評(píng)估污染控制項(xiàng)目的成功以及識(shí)別哪兒更迫切需要控制。在氣候建模中,主要的當(dāng)務(wù)之急是確定數(shù)據(jù)是否具有總體趨勢(shì),這不僅對(duì)被廣泛研究的變量如全球平均溫度,而且包括許多其它的后果不太清楚的變量。 對(duì)統(tǒng)計(jì)學(xué)家而言,估計(jì)具有相關(guān)誤差的趨勢(shì)因素長(zhǎng)期以來(lái)一直是個(gè)問(wèn)題,大部分工作涉及到統(tǒng)計(jì)學(xué)家與地球物理學(xué)家和環(huán)境科學(xué)家之間的交流。例如,以對(duì)時(shí)間序列分析做出諸多貢獻(xiàn),尤其以 YuleWalker 方程聞名的 Gilbert Walker 爵士,也是一位著名的 氣象學(xué)者,他大量的工作是在厄爾尼諾 南半球擺動(dòng) (ENSO)現(xiàn)象上,這些貢獻(xiàn)大量地是同一研究的結(jié)果。 統(tǒng)計(jì)學(xué)家和地球物理學(xué)家的長(zhǎng)期合作產(chǎn)生了一系列的關(guān)于同溫層變化識(shí)別的論文,這些論文中的大多數(shù)模型都考慮了相關(guān)誤差。這些研究論文,大多數(shù)由統(tǒng)計(jì)學(xué)家作為第一作者但發(fā)表在主流統(tǒng)計(jì)領(lǐng)域以外的雜志上,是對(duì)統(tǒng)計(jì)學(xué)外延進(jìn)入其他科學(xué)領(lǐng)域的出色的描述。 許多研究大氣科學(xué)問(wèn)題的作者也考慮了模型的相關(guān)誤差,特別檢驗(yàn)了氣候變化的結(jié)論是如何隨著假定不同的誤差過(guò)程而變化的。這些假設(shè)包括具有長(zhǎng)程相依性的時(shí)間序列模型和由大氣模型動(dòng)力學(xué)導(dǎo)出的頻 譜模型。其他的研究工作者已經(jīng)給出了另一種方法,它用長(zhǎng)程相依過(guò)程的小波表示,這個(gè)領(lǐng)域持續(xù)的工作描述了氣候變化的重要科學(xué)問(wèn)題的考慮對(duì)研究環(huán)境過(guò)程新的統(tǒng)計(jì)表示的反饋。最近,由統(tǒng)計(jì)學(xué)家撰寫但發(fā)表在氣象文獻(xiàn)中的工作已經(jīng)采用了長(zhǎng)程相依過(guò)程的統(tǒng)計(jì)模型,這些模型大部分是在經(jīng)濟(jì)學(xué)問(wèn)題的分析中發(fā)展起來(lái),并被應(yīng)用于風(fēng)速和風(fēng)向。這描述了從一個(gè)學(xué)科(在本例中,經(jīng)濟(jì)學(xué))到另一個(gè)學(xué)科(氣象學(xué))在方法論的轉(zhuǎn)換中統(tǒng)計(jì)的角色, 要不然第二個(gè)學(xué)科也許仍然沒(méi)有意識(shí)到它可應(yīng)用于該學(xué)科中的問(wèn)題。 統(tǒng)計(jì)建模和科學(xué)的概念化 在統(tǒng)計(jì)框架下環(huán)境數(shù) 據(jù)記錄的變化被概念化為信號(hào)加噪聲是常見(jiàn)的。 事實(shí)上,這是我們上面討論過(guò)的許多模型中的一個(gè),其中對(duì)模型中的信號(hào)(或系統(tǒng))和噪聲(或誤差)成分賦予各種形式以便更好地表達(dá)研究中的過(guò)程。在水化學(xué)變量的分析中信號(hào)加噪音結(jié)構(gòu)的考慮導(dǎo)致許多湖泊學(xué)家得出這樣的結(jié)論:觀察到的數(shù)據(jù)記錄里大部分是噪聲,只有少量的信號(hào)。 但是這個(gè)概念可能導(dǎo)出麻煩,就像在考慮美國(guó)華盛頓湖賽克 (Secci)深度(水透明度的一種度量)的記錄時(shí)所展現(xiàn)的一樣。圖 表示的是從 1980- 1981 這一相對(duì)短的時(shí)間間隔中的 Secci 深度。左圖顯示了有明顯增加趨勢(shì) 的一列值。但是當(dāng)這些觀測(cè)值被嵌入到右圖中稍長(zhǎng)一點(diǎn)的觀察序列時(shí),我們可以看到在決定湖的特性是否有實(shí)質(zhì)性改變時(shí)這個(gè)變化是不顯著的。 然而,要接受 1980年中期到 1981 早期的數(shù)據(jù)僅僅是噪音分量的一個(gè)實(shí)現(xiàn)這一事實(shí)是困難的。在這個(gè)例子里,感興趣的環(huán)境過(guò)程也許最好被概念化為有許多層過(guò)程組成,每個(gè)過(guò)程都包含了它自己的噪音分量。 圖 華盛頓湖的 Secci 深度值。左邊的圖被嵌入為右邊圖的實(shí)線部分 這種情況下的模型已被表達(dá)為貝葉斯動(dòng)態(tài)模型的一種擴(kuò)展。這個(gè)模型由三個(gè)概念上的過(guò)程組成:一個(gè)觀察過(guò)程,一個(gè)當(dāng)前的條件過(guò) 程和一個(gè)湖功能過(guò)程,這是在監(jiān)測(cè)水的質(zhì)量時(shí)最感興趣的過(guò)程。這個(gè)模型顯示可以清楚地識(shí)別華盛頓湖從 1960 到 1990 的三個(gè)時(shí)段中湖功能過(guò)程的變化;這些時(shí)段對(duì)應(yīng)于三個(gè)已知事件,它們影響了華盛頓湖的基本特性。 這里,統(tǒng)計(jì)方法有助于環(huán)境狀況的概念化,對(duì)環(huán)境狀況而言過(guò)程模型的研究是極其復(fù)雜的。也就是,在動(dòng)態(tài)模型中所用的三個(gè)過(guò)程沒(méi)有對(duì)應(yīng)于物理或者化學(xué)機(jī)理,而是環(huán)境過(guò)程的科學(xué)概念化,類似于湖營(yíng)養(yǎng)狀況的基本湖泊學(xué)概念。 另外一個(gè)統(tǒng)計(jì)有助于科學(xué)思想發(fā)展的例子是加拿大山貓和雪靴兔種群的周期分析,對(duì)此已有大量的研究論文發(fā)表在 Proceeding of the National Academy of Science(國(guó)家科學(xué)院院報(bào))和 Science 上。這里統(tǒng)計(jì)學(xué)家和生態(tài)學(xué)家的合作導(dǎo)致了科學(xué)理論的加強(qiáng)。通過(guò)這項(xiàng)研究,發(fā)展了許多概念,包括統(tǒng)計(jì)模型自回歸的階和物種之間(如山貓和兔)反饋系統(tǒng)的復(fù)雜性的關(guān)系,以及種群周期可能展現(xiàn)出空間同步性這一想法。 特別,研究者分析了從 1821 年到 1990 年代這段時(shí)間山貓種群的 21 個(gè)時(shí)間序列。他們采用非線性 2階自回歸過(guò)程,并通過(guò)隨機(jī)系數(shù)和經(jīng)驗(yàn)貝葉斯估計(jì)來(lái)組合序列。他們?cè)谥鸩酵晟脐P(guān)于觀察數(shù)據(jù)的好的統(tǒng)計(jì)描述后給出了 理論種群生態(tài)學(xué)的純數(shù)學(xué)模型的等價(jià)形式。 根據(jù)我們的看法,種群動(dòng)態(tài)學(xué)的數(shù)學(xué)模型賦予了所用統(tǒng)計(jì)模型的意義,或者說(shuō)統(tǒng)計(jì)模型有助于引導(dǎo)種群理論描述的研究。這個(gè)工作可以作為在種群周期中密度相依和(空間)相位相依的相互關(guān)系的一個(gè)例證。 其它方向和將來(lái)的可能性 大量數(shù)據(jù)的收集和處理是地球物理學(xué)和環(huán)境科學(xué)中許多主要分支的特性,例如氣象學(xué)、海洋學(xué)、地震學(xué)、氣候變化的特性和檢測(cè)、污染物在大氣層中的散布。 在所有這些領(lǐng)域里統(tǒng)計(jì)學(xué)家已經(jīng)積極參與活動(dòng),由于統(tǒng)計(jì)方法已經(jīng)進(jìn)展到包括諸如時(shí)空數(shù)據(jù)的復(fù)雜模型和相關(guān)聯(lián)的計(jì)算方法,所以統(tǒng)計(jì)學(xué) 家與地球物理學(xué)家和環(huán)境科學(xué)家之間直接交流的可能性大大增加了。傳統(tǒng)的多元分析和空間統(tǒng)計(jì)方法過(guò)分依賴于矩陣計(jì)算,然而在高維的情形這已經(jīng)是不可行的;這導(dǎo)致了尋找在高維情形下可行的并且能有效地計(jì)算大量數(shù)據(jù)的方法。 近來(lái)多數(shù)統(tǒng)計(jì)工作致力于發(fā)展適合大規(guī)模時(shí)空數(shù)據(jù)分析的模型和方法;在前面描述的海洋風(fēng)速數(shù)據(jù)模型僅僅是回應(yīng)這些問(wèn)題的新的統(tǒng)計(jì)方法的一個(gè)例子。正在研發(fā)的適合這種情況的建模方法包括分級(jí)地理統(tǒng)計(jì)模型和基于格點(diǎn)結(jié)構(gòu)的一般混合模型。 另一個(gè)重要研究領(lǐng)域是關(guān)于非平穩(wěn)的空間模型的研究,包括用能導(dǎo)致平穩(wěn)性的變形空間表示一個(gè)非平 穩(wěn)過(guò)程的方法,由一個(gè)底隨機(jī)場(chǎng)的光滑核定義的模型,由多分辨率基(multiresolution)定義的模型。 監(jiān)測(cè)網(wǎng)絡(luò)的設(shè)計(jì)是另一個(gè)有大量文獻(xiàn)的領(lǐng)域。設(shè)計(jì)問(wèn)題也與數(shù)據(jù)同化的背景有關(guān),例如有可能從一個(gè)大而復(fù)雜的系統(tǒng)中僅進(jìn)行少量的測(cè)量,此時(shí)的關(guān)鍵是要考慮被抽取樣本的位置。 我們期望在數(shù)字環(huán)境模型的數(shù)據(jù)分析中能看到巨大的增長(zhǎng)以及在這種模型的研發(fā)中應(yīng)用數(shù)學(xué)家和物質(zhì)領(lǐng)域科學(xué)家的直接交流。以上我們正在考慮的模型出現(xiàn)在氣候?qū)W和數(shù)字天氣預(yù)報(bào),空氣污染建模和多孔滲水介質(zhì)建模中。這個(gè)課題是 2020 年統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)科學(xué)研究院 (SAMSI)即將執(zhí)行的計(jì)劃的一個(gè)主題,似乎也是將來(lái)研究的一個(gè)大課題。 盡管在生態(tài)學(xué)分析中的基本統(tǒng)計(jì)問(wèn)題明顯少于時(shí)空環(huán)境過(guò)程建模,統(tǒng)計(jì)學(xué)家也一直活躍在生態(tài)學(xué)關(guān)心的問(wèn)題上。因此統(tǒng)計(jì)的貢獻(xiàn)傾向于更分散,并且很少有統(tǒng)計(jì)學(xué)家和生態(tài)學(xué)家長(zhǎng)期合作的隊(duì)伍。 歷史上,統(tǒng)計(jì)學(xué)家對(duì)生態(tài)學(xué)領(lǐng)域研究的抽樣問(wèn)題做了許多工作,如群體估計(jì)的評(píng)估和群體成分的分析。但是生態(tài)學(xué)研究的基金分配上,生態(tài)學(xué)中統(tǒng)計(jì)研發(fā)可用的基金也一直少于大氣過(guò)程和污染領(lǐng)域的分析中統(tǒng)計(jì)研發(fā)可用的基金。 隨著對(duì)生物多樣性具有科學(xué)和社會(huì)內(nèi)涵認(rèn)識(shí)的日益增加,在該領(lǐng)域中要應(yīng)用統(tǒng) 計(jì)和需要開(kāi)展統(tǒng)計(jì)研究?jī)煞矫娑家殉墒臁5孛采鷳B(tài)學(xué)的出現(xiàn)拓寬了生態(tài)問(wèn)題所考慮的空間范圍,同樣在該領(lǐng)域?qū)y(tǒng)計(jì)的介入有很大的需求和機(jī)會(huì)。 信息技術(shù) 計(jì)算技術(shù)和大規(guī)模數(shù)據(jù)存儲(chǔ)的高速增長(zhǎng)已經(jīng)影響到人們的許多行為,有時(shí)候以深刻的方式影響我們。在與信息技術(shù) (IT)相關(guān)領(lǐng)域工作的統(tǒng)計(jì)學(xué)家從來(lái)沒(méi)有象現(xiàn)在這樣令人激動(dòng)。 網(wǎng)絡(luò)的發(fā)展和計(jì)算機(jī)系統(tǒng)指數(shù)增長(zhǎng)的容量已經(jīng)打開(kāi)了難以想象的信息交流的可能性,收集和分析來(lái)自不同來(lái)源不同性質(zhì)的極大規(guī)模數(shù)據(jù)的能力,以及交流結(jié)果的能力。公開(kāi)資源軟件的發(fā)展擴(kuò)大了研究者施展才華和思想的能力。 從數(shù)據(jù)中建立和獲得統(tǒng)計(jì)模型的新的挑戰(zhàn)非常多。統(tǒng)計(jì)學(xué)家和受過(guò)統(tǒng)計(jì)訓(xùn)練的科學(xué)家的努力已經(jīng)對(duì)科學(xué)技術(shù)的所有領(lǐng)域產(chǎn)生了重要影響,從天文學(xué)、生物學(xué)、氣象學(xué)、通信學(xué)、工程學(xué)到智能學(xué),這還僅僅是列舉了一部分。與其他科學(xué)領(lǐng)域人們的接觸總是增加機(jī)會(huì)來(lái)發(fā)展新方法以便表達(dá),建模和 幫助解釋他們的實(shí)驗(yàn) /觀察 /模擬數(shù)據(jù),以及在試驗(yàn)設(shè)計(jì)和數(shù)據(jù)收集中發(fā)展的新方法。 這一節(jié)的剩余部分有選擇地強(qiáng)調(diào)了一些高影響領(lǐng)域。 通訊 每天每分鐘都會(huì)產(chǎn)生大量的通信記錄。每個(gè)無(wú)線與有線的呼叫產(chǎn)生一個(gè)記錄,誰(shuí)撥打了這個(gè)呼叫,誰(shuí)接收了這個(gè)呼叫,什么人什么時(shí)間打 的,延續(xù)有多長(zhǎng),化了多少錢。每個(gè)用戶要求從因特網(wǎng)上下載一個(gè)文件都記錄在一個(gè)日志文件里。公共論壇在線聊天的每個(gè)貼子也都記錄在案。 網(wǎng)絡(luò)工程師對(duì)這些通訊記錄感興趣,他們必須設(shè)計(jì)網(wǎng)絡(luò)、開(kāi)發(fā)新設(shè)備;引起社會(huì)學(xué)家的興趣,他們關(guān)心人們?nèi)绾谓涣?、如何組成社團(tuán);也引起服務(wù)供應(yīng)商的興趣,他們需要盡快搜索出欺詐行為;還引起執(zhí)法機(jī)構(gòu)和安全 部門的興趣,他們尋找犯罪和恐怖行為。 在數(shù)據(jù)財(cái)富轉(zhuǎn)換成信息財(cái)富之前必須面對(duì)大量的有挑戰(zhàn)性的統(tǒng)計(jì)問(wèn)題。這些問(wèn)題包括刻畫描述產(chǎn)生這些記錄的上百萬(wàn)人們當(dāng)前行為的概率分布,當(dāng)記錄傳送時(shí)更新每個(gè)人的被估行為,盡快區(qū)分出為數(shù)不多的有“異?!毙袨榈娜恕R苍S令人驚訝的是,這些本來(lái)是小樣本問(wèn)題,由于大多數(shù)人不產(chǎn)生大量的記錄,由于受到計(jì)算時(shí)間和空間的嚴(yán)格限制而復(fù)雜化了。統(tǒng)計(jì)學(xué)家對(duì)解決這些問(wèn)題可以做很多的貢獻(xiàn)。 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘研究(最初是在計(jì)算科學(xué)系研究的)與非參數(shù)估計(jì)研究(開(kāi)始是在統(tǒng)計(jì)系進(jìn)行的)之間的界限正日益變得模糊不清。事實(shí)上,“機(jī)械學(xué)習(xí)”和“數(shù)據(jù)挖掘”的標(biāo)簽正越來(lái)越多地被統(tǒng)計(jì)學(xué)家使用。在統(tǒng)計(jì)系研究非?;钴S的主要領(lǐng)域包括分類 、聚類、預(yù)測(cè)建模的新方法。統(tǒng)計(jì)學(xué)家開(kāi)發(fā)分類工具已經(jīng)有很長(zhǎng)時(shí)間了, 隨著 當(dāng)前的研究成果的應(yīng)用,計(jì)算能力的迅速提高已經(jīng)導(dǎo)致了一些重大進(jìn)步。 綜合這些優(yōu)勢(shì)后,在分類方面這樣的一個(gè)新進(jìn)展是支持向量機(jī) (Support Vector Machine)。這一方法在計(jì)算機(jī)科學(xué)機(jī)器學(xué)習(xí)協(xié)會(huì)中高度普及,而且由于統(tǒng)計(jì)學(xué)家的介入已經(jīng)大受裨益,統(tǒng)計(jì)學(xué)家的貢獻(xiàn)在于以重要方式來(lái)理解該方法的性質(zhì)。盡管如此,關(guān)于該方法的理論基礎(chǔ)的研究以及開(kāi)發(fā)有效的應(yīng)用方法上仍有許多重要的機(jī)會(huì)。 目前支持向量機(jī)的應(yīng)用包括:微陣基因芯片的疾病分類,根據(jù)天氣和當(dāng)前云層的類型對(duì)衛(wèi)星雷達(dá)剖面圖的分類。 非參數(shù)風(fēng)險(xiǎn)因子建模的一個(gè)例子 是諸多風(fēng)險(xiǎn)因子的聯(lián)合復(fù)雜的相互作用對(duì)于醫(yī)學(xué)表型產(chǎn)生的作用。在一個(gè)更為探索的水平上,通過(guò)混合建模的 mRNA 信號(hào)聚類有助于研究者理解這些數(shù)據(jù)中子總體的數(shù)量和性質(zhì)。 隨著高速計(jì)算的出現(xiàn),對(duì)極大數(shù)據(jù)集以及有許多潛在預(yù)測(cè)變量和特征變量的數(shù)據(jù),統(tǒng)計(jì)學(xué)家能更好地建立和試驗(yàn)更復(fù)雜更精細(xì)的模型 (即可以用更現(xiàn)實(shí)和更容易理解的方式來(lái)處理的模型 )。重要的是把這些模型建立在堅(jiān)實(shí)的理論和計(jì)算基礎(chǔ)上以便來(lái)指導(dǎo)應(yīng)用。 網(wǎng)絡(luò) 對(duì)因特網(wǎng)流量的研究大體分為流量測(cè)量和建模,網(wǎng)絡(luò)拓?fù)浜途W(wǎng)絡(luò)斷層掃描 ( work tomography)。所有這 些領(lǐng)域都表現(xiàn)出大量的統(tǒng)計(jì)挑戰(zhàn)。 測(cè)量和建模的進(jìn)一步研究源自提高服務(wù)質(zhì)量和效率的需求。當(dāng)前提高服務(wù)質(zhì)量的方法是對(duì)資源的大量和過(guò)量供應(yīng),這既是浪費(fèi)的,也不完全有效,因?yàn)猷]件爆炸的部分原因是不適當(dāng)?shù)膮f(xié)議和郵件路由。為解決這些問(wèn)題已經(jīng)提出了許多想法,因此關(guān)鍵是比較這些方法,現(xiàn)在主要是由模擬來(lái)實(shí)現(xiàn)的。這需要建模和認(rèn)真尋找擬合優(yōu)度的統(tǒng)計(jì)問(wèn)題。 特別,中心的問(wèn)題是:“我們?cè)趺粗肋@些工作象真實(shí)的信息流?”這些問(wèn)題對(duì)統(tǒng)計(jì)和概率專家提出了許多新的挑戰(zhàn)。古典的統(tǒng)計(jì)方法和技術(shù)顯得不切實(shí)際,因?yàn)樵S多地方呈遞出重尾分布(經(jīng)常使得諸如 方差和相關(guān)這些標(biāo)準(zhǔn)方法無(wú)效)以及長(zhǎng)相依和不平穩(wěn)(超出了經(jīng)典時(shí)間序列的基本假設(shè))。盡管如此,了解變化和對(duì)變化建模仍然十分重要,所以這一領(lǐng)域?qū)τ诎l(fā)展新的統(tǒng)計(jì)方法有著十分廣闊的天地。 網(wǎng)絡(luò)拓?fù)湔宫F(xiàn)出不同類型的統(tǒng)計(jì)問(wèn)題。這里的目標(biāo)是了解因特網(wǎng)的連通結(jié)構(gòu)。該領(lǐng)域中的重大進(jìn)展需要圖論概念,隨機(jī)過(guò)程和抽樣理論。 網(wǎng)絡(luò)斷層掃描是僅僅根據(jù)通過(guò)它發(fā)送的信號(hào)工作情況來(lái)推斷因特網(wǎng)的結(jié)構(gòu)。正確了解、分析包含在這一過(guò)程中復(fù)雜的不確定性以及對(duì)它建模對(duì)于該領(lǐng)域的發(fā)展是重要的。 數(shù)據(jù)流 對(duì)大規(guī)模數(shù)據(jù)集的統(tǒng)計(jì)分析經(jīng)常以批量模式執(zhí)行。這種數(shù)據(jù) 集可能需要數(shù)年的收集和準(zhǔn)備,相應(yīng)的統(tǒng)計(jì)分析可以在類似的時(shí)段中進(jìn)行。盡管如此, 就象在處理實(shí)時(shí)計(jì)算和控制的計(jì)算機(jī)編程中存在一個(gè)重要的合適環(huán)境一樣,對(duì)統(tǒng)計(jì)學(xué)家處理實(shí)時(shí)數(shù)據(jù)挖掘也存在一個(gè)快速增長(zhǎng)的合適環(huán)境問(wèn)題。例如,軌道衛(wèi)星和地面站之間的有限帶寬遙感信號(hào)妨礙了所有原始數(shù)據(jù)的傳輸,這種情況會(huì)出現(xiàn)。第二個(gè)例子是像航空機(jī)票預(yù)定服務(wù)系統(tǒng)這樣的商業(yè)網(wǎng)站,確認(rèn)或放棄的詳細(xì)擊鍵數(shù)據(jù)系列未被存儲(chǔ),也會(huì)出現(xiàn)這種情況。 這些數(shù)據(jù)流的離線統(tǒng)計(jì)分析是不可能的,因?yàn)檫@些原始數(shù)據(jù)完全得不到。盡管如此,可以把一個(gè)統(tǒng)計(jì)裝置直接放進(jìn)數(shù)據(jù)流來(lái)實(shí)時(shí)檢 測(cè)和量化當(dāng)前數(shù)據(jù)挖掘的典型結(jié)果。挑戰(zhàn)性在
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1