freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

大數(shù)據(jù)的介紹及案例分享-資料下載頁(yè)

2025-05-12 00:48本頁(yè)面
  

【正文】 、收入估計(jì)等。通過(guò)利用相關(guān)關(guān)系,保險(xiǎn)公司可以在每人身上節(jié)省125美元,然而這個(gè)純數(shù)據(jù)分析法只需要花費(fèi)5美元。有些人可能會(huì)覺(jué)得這種方法聽起來(lái)很恐怖,這些公司似乎可以利用任何網(wǎng)絡(luò)上的信息。這會(huì)讓人們下次登陸極限運(yùn)動(dòng)網(wǎng)站和坐到電視機(jī)前觀看幽默情景劇前三思而后行,因?yàn)椴幌胍虼酥Ц陡嗟谋kU(xiǎn)費(fèi)用。讓我們?cè)诮佑|任何信息的時(shí)候(同時(shí)也產(chǎn)生可能被分析的數(shù)據(jù))都膽戰(zhàn)心驚是一件非常糟糕的事情。但另一方面,這個(gè)系統(tǒng)有助于更多的人得到保險(xiǎn),這對(duì)于社會(huì)和保險(xiǎn)公司都是有好處的。VISA&MasterCard與商戶推薦相對(duì)地,像VISA和MasterCard這樣的信用卡發(fā)行商和其他大銀行就站在了信息價(jià)值鏈最好的位置上。通過(guò)為小銀行和商家提供服務(wù),它們能夠從自己的服務(wù)網(wǎng)獲取更多的交易信息和顧客的消費(fèi)信息。它們的商業(yè)模式從單純的處理支付行為轉(zhuǎn)變成了收集數(shù)據(jù)。接下來(lái)的問(wèn)題就是,如何使用收集到的數(shù)據(jù)。就像ITA一樣,MasterCard也可以把這些數(shù)據(jù)授權(quán)給第三方使用,但是它更傾向于自己分析、挖掘數(shù)據(jù)的價(jià)值。一個(gè)稱為MasterCard Advisors的部門收集和分析了來(lái)自210個(gè)國(guó)家的15億信用卡用戶的650億條交易記錄,用來(lái)預(yù)測(cè)商業(yè)發(fā)展和客戶的消費(fèi)趨勢(shì)。然后,它把這些分析結(jié)果賣給其他公司。它發(fā)現(xiàn),如果一個(gè)人在下午四點(diǎn)左右給汽車加油的話,他很可能在接下來(lái)的一個(gè)小時(shí)內(nèi)要去購(gòu)物或者去餐館吃飯,而這一個(gè)小時(shí)的花費(fèi)大概在35~50美元之間。商家可能正需要這樣的信息,因?yàn)檫@樣它們就能在這個(gè)時(shí)間段的加油小票背面附上加油站附近商店的優(yōu)惠券。處于這個(gè)數(shù)據(jù)鏈的中心,MasterCard占據(jù)了收集數(shù)據(jù)和挖掘數(shù)據(jù)價(jià)值的黃金位置。我們可以想象,未來(lái)的信用卡公司不會(huì)再對(duì)交易收取傭金,而是免費(fèi)提供支付服務(wù)。作為回報(bào),它們會(huì)獲得更多的數(shù)據(jù),而對(duì)這些數(shù)據(jù)進(jìn)行復(fù)雜的分析之后,它們又可以賣掉分析結(jié)果以取得利潤(rùn)。Xoom與跨境匯款異常交易報(bào)警Xoom是一個(gè)專門從事跨境匯款業(yè)務(wù)的公司,它得到了很多擁有大數(shù)據(jù)的大公司的支持。它會(huì)分析一筆交易的所有相關(guān)數(shù)據(jù),一旦發(fā)現(xiàn)用“發(fā)現(xiàn)卡”從新澤西州匯款的交易比平常多的話,系統(tǒng)就會(huì)報(bào)警。Xoom公司的首席執(zhí)行官約翰孔澤(JohnKunze)解釋說(shuō):“這個(gè)系統(tǒng)關(guān)注的是不應(yīng)該出現(xiàn)的情況?!眴为?dú)來(lái)看,每筆交易都是合法的,但是事實(shí)證明這是一個(gè)犯罪集團(tuán)在試圖詐騙。而發(fā)現(xiàn)異常的唯一方法就是,重新檢查所有的數(shù)據(jù),找出樣本分析法錯(cuò)過(guò)的信息。無(wú)所不包的谷歌翻譯系統(tǒng)2006年,谷歌公司也開始涉足機(jī)器翻譯。這被當(dāng)作實(shí)現(xiàn)“收集全世界的數(shù)據(jù)資源,并讓人人都可享受這些資源”這個(gè)目標(biāo)的一個(gè)步驟。谷歌翻譯開始利用一個(gè)更大更繁雜的數(shù)據(jù)庫(kù),也就是全球的互聯(lián)網(wǎng),而不再只利用兩種語(yǔ)言之間的文本翻譯。谷歌翻譯系統(tǒng)為了訓(xùn)練計(jì)算機(jī),會(huì)吸收它能找到的所有翻譯。它會(huì)從各種各樣語(yǔ)言的公司網(wǎng)站上去尋找聯(lián)合國(guó)和歐洲委員會(huì)這些國(guó)際組織發(fā)布的官方文件和報(bào)告的譯本。它甚至?xí)账僮x項(xiàng)目中的書籍翻譯。谷歌翻譯部的負(fù)責(zé)人弗朗茲奧齊(FranzOch)是機(jī)器翻譯界的權(quán)威,他指出,“谷歌的翻譯系統(tǒng)不會(huì)像Candide一樣只是仔細(xì)地翻譯300萬(wàn)句話,它會(huì)掌握用不同語(yǔ)言翻譯的質(zhì)量參差不齊的數(shù)十億頁(yè)的文檔?!辈豢紤]翻譯質(zhì)量的話,上萬(wàn)億的語(yǔ)料庫(kù)就相當(dāng)于950億句英語(yǔ)。盡管其輸入源很混亂,但較其他翻譯系統(tǒng)而言,谷歌的翻譯質(zhì)量相對(duì)而言還是最好的,而且可翻譯的內(nèi)容更多。到2012年年中,谷歌數(shù)據(jù)庫(kù)涵蓋了60多種語(yǔ)言,甚至能夠接受14種語(yǔ)言的語(yǔ)音輸入,并有很流利的對(duì)等翻譯。之所以能做到這些,是因?yàn)樗鼘⒄Z(yǔ)言視為能夠判別可能性的數(shù)據(jù),而不是語(yǔ)言本身。如果要將印度語(yǔ)譯成加泰羅尼亞語(yǔ),谷歌就會(huì)把英語(yǔ)作為中介語(yǔ)言。因?yàn)樵诜g的時(shí)候它能適當(dāng)增減詞匯,所以谷歌的翻譯比其他系統(tǒng)的翻譯靈活很多。谷歌的翻譯之所以更好并不是因?yàn)樗鼡碛幸粋€(gè)更好的算法機(jī)制。和微軟的班科和布里爾一樣,這是因?yàn)楣雀璺g增加了很多各種各樣的數(shù)據(jù)。從谷歌的例子來(lái)看,它之所以能比IBM的Candide系統(tǒng)多利用成千上萬(wàn)的數(shù)據(jù),是因?yàn)樗邮芰擞绣e(cuò)誤的數(shù)據(jù)。2006年,谷歌發(fā)布的上萬(wàn)億的語(yǔ)料庫(kù),就是來(lái)自于互聯(lián)網(wǎng)的一些廢棄內(nèi)容。這就是“訓(xùn)練集”,可以正確地推算出英語(yǔ)詞匯搭配在一起的可能性。“從某種意義上,谷歌的語(yǔ)料庫(kù)是有很多不足的。因?yàn)楣雀枵Z(yǔ)料庫(kù)的內(nèi)容來(lái)自于未經(jīng)過(guò)濾的網(wǎng)頁(yè)內(nèi)容,所以會(huì)包含一些不完整的句子、拼寫錯(cuò)誤、語(yǔ)法錯(cuò)誤以及其他各種錯(cuò)誤。況且,它也沒(méi)有詳細(xì)的人工糾錯(cuò)后的注解。但是,谷歌語(yǔ)料庫(kù)是其他語(yǔ)料庫(kù)的好幾百萬(wàn)倍大,這樣的優(yōu)勢(shì)完全壓倒了缺點(diǎn)。”微軟與谷歌的拼寫檢查在過(guò)去的20多年中,微軟為其Word軟件開發(fā)出了一個(gè)強(qiáng)大的拼寫檢查程序,通過(guò)與頻繁更新的字典正確拼寫相比較來(lái)對(duì)用戶鍵入的字符流進(jìn)行判斷。字典囊括了所有已知詞匯,系統(tǒng)將拼寫相似但字典中沒(méi)有的詞匯判斷為拼寫錯(cuò)誤,并對(duì)其進(jìn)行糾正。由于需要不斷編譯和更新字典,微軟Word的拼寫檢查僅適用于最常用的語(yǔ)言,且每年需要花費(fèi)數(shù)百萬(wàn)美元的創(chuàng)建和維護(hù)費(fèi)用?,F(xiàn)在再來(lái)看看谷歌是怎么做的吧??梢哉f(shuō),谷歌擁有世界上最完整的拼寫檢查器,基本上涵蓋了世界上的每一種語(yǔ)言。這個(gè)系統(tǒng)一直在不斷地完善和增加新的詞匯,這是人們每天使用搜索引擎的附加結(jié)果。你輸錯(cuò)了iPad嗎?不要緊,它在那兒呢;Obamacare是什么?哦,明白了。而且,谷歌幾乎是“免費(fèi)”地獲得了這種拼寫檢查,它依據(jù)的是其每天處理的30億查詢中輸入搜索框中的錯(cuò)誤拼寫。一個(gè)巧妙的反饋循環(huán)可以將用戶實(shí)際想輸入的內(nèi)容告知系統(tǒng)。當(dāng)搜索結(jié)果頁(yè)面的頂部顯示“你要找的是不是:流行病學(xué)”時(shí),用戶可以通過(guò)點(diǎn)擊正確的術(shù)語(yǔ)明確地“告訴”谷歌自己需要重新查詢的內(nèi)容。或者,直接在用戶訪問(wèn)的頁(yè)面上顯示正確拼寫的結(jié)果,因?yàn)樗芸赡芘c正確的拼寫高度相關(guān)。(這實(shí)際上比看上去更有意義,因?yàn)殡S著谷歌拼寫檢查系統(tǒng)的不斷完善,人們即使沒(méi)有完全精確地輸入查詢內(nèi)容也能夠獲得正確的查詢結(jié)果。)谷歌的拼寫檢查系統(tǒng)顯示,那些“不合標(biāo)準(zhǔn)”、“不正確”或“有缺陷”的數(shù)據(jù)也是非常有用的。一個(gè)用來(lái)描述人們?cè)诰W(wǎng)上留下的數(shù)字軌跡的藝術(shù)詞匯出現(xiàn)了,這就是“數(shù)據(jù)廢氣”。它是用戶在線交互的副產(chǎn)品,包括瀏覽了哪些頁(yè)面、停留了多久、鼠標(biāo)光標(biāo)停留的位置、輸入了什么信息等。許多公司因此對(duì)系統(tǒng)進(jìn)行了設(shè)計(jì),使自己能夠得到數(shù)據(jù)廢氣并循環(huán)利用,以改善現(xiàn)有的服務(wù)或開發(fā)新服務(wù)。毋庸置疑,谷歌是這方面的領(lǐng)導(dǎo)者,它將不斷地“從數(shù)據(jù)中學(xué)習(xí)”這個(gè)原則應(yīng)用到許多服務(wù)中。用戶執(zhí)行的每一個(gè)動(dòng)作都被認(rèn)為是一個(gè)“信號(hào)”,谷歌對(duì)其進(jìn)行分析并反饋給系統(tǒng)。谷歌,從大的“噪音”數(shù)據(jù)中受益例如,谷歌敏銳地注意到,人們經(jīng)常搜索某個(gè)詞及其相關(guān)詞,點(diǎn)擊進(jìn)入后卻未能找到想要的信息,于是又返回到搜索頁(yè)面繼續(xù)搜索。它知道人們點(diǎn)擊的是第1頁(yè)的第8個(gè)鏈接還是第8頁(yè)的第1個(gè)鏈接,或者是干脆放棄了所有搜索點(diǎn)擊。谷歌不是第一個(gè)洞察到這一點(diǎn)的公司,但它利用這一點(diǎn)并取得了非凡的成果。這些信息是非常有價(jià)值的。如果許多用戶都點(diǎn)擊搜索結(jié)果頁(yè)底部的鏈接,就表明這個(gè)結(jié)果更加具有相關(guān)性,谷歌的排名算法就會(huì)自動(dòng)地在隨后的搜索中將它提到頁(yè)面中比較靠前的位置(廣告也是如此)。一位谷歌的員工說(shuō):“我們喜歡從大的‘噪音’數(shù)據(jù)集中吸取教訓(xùn)。”數(shù)據(jù)廢氣是許多電腦化服務(wù)背后的機(jī)制,如語(yǔ)音識(shí)別、垃圾郵件過(guò)濾、翻譯等。當(dāng)用戶指出語(yǔ)音識(shí)別程序誤解了他們的意思時(shí),他們實(shí)際上有效地“訓(xùn)練”了這個(gè)系統(tǒng),讓它變得更好。很多企業(yè)都開始設(shè)計(jì)他們的系統(tǒng),以這種方式收集和使用信息。在Facebook的早期,數(shù)據(jù)科學(xué)家們研究了數(shù)據(jù)廢氣的豐富信息,發(fā)現(xiàn)人們會(huì)采取某種行動(dòng)(如回帖、點(diǎn)擊圖標(biāo)等)的最重要的預(yù)測(cè)指標(biāo)就是他們看到了周圍的朋友也在這么做。緊接著,F(xiàn)acebook重新設(shè)計(jì)了它的系統(tǒng),使每個(gè)用戶的活動(dòng)變得可見并廣播出去,這為網(wǎng)站的良性循環(huán)做出了新的貢獻(xiàn)。逐漸地,這個(gè)想法從互聯(lián)網(wǎng)行業(yè)傳播至可以收集用戶反饋的任何公司。IBM,電動(dòng)汽車動(dòng)力與電力供應(yīng)系統(tǒng)優(yōu)化預(yù)測(cè)在2012年進(jìn)行的一項(xiàng)試驗(yàn)中,IBM曾與加利福尼亞州的太平洋天然氣與電氣公司以及汽車制造商本田合作,收集了大量信息來(lái)回答關(guān)于電動(dòng)汽車應(yīng)在何時(shí)何地獲取動(dòng)力及其對(duì)電力供應(yīng)的影響等基本問(wèn)題。基于大量的信息輸入,如汽車的電池電量、汽車的位置、一天中的時(shí)間以及附近充電站的可用插槽等,IBM開發(fā)了一套復(fù)雜的預(yù)測(cè)模型。它將這些數(shù)據(jù)與電網(wǎng)的電流消耗以及歷史功率使用模式相結(jié)合。通過(guò)分析來(lái)自多個(gè)數(shù)據(jù)源的巨大實(shí)時(shí)數(shù)據(jù)流和歷史數(shù)據(jù),能夠確定司機(jī)為汽車電池充電的最佳時(shí)間和地點(diǎn),并揭示充電站的最佳設(shè)置點(diǎn)。最后,系統(tǒng)需要考慮附近充電站的價(jià)格差異,即使是天氣預(yù)報(bào),也要考慮到。例如,如果是晴天,附近的太陽(yáng)能供電站會(huì)充滿電,但如果預(yù)報(bào)未來(lái)一周都會(huì)下雨,那么太陽(yáng)能電池板將會(huì)被閑置。系統(tǒng)采用了為某個(gè)特定目的而生成的數(shù)據(jù),并將其重新用于另一個(gè)目的,換言之,數(shù)據(jù)從其基本用途移動(dòng)到了二級(jí)用途。這使得它隨著時(shí)間的推移變得更有價(jià)值。汽車的電池電量指示器告訴司機(jī)應(yīng)當(dāng)何時(shí)充電,電網(wǎng)的使用數(shù)據(jù)可以通過(guò)設(shè)備收集到,從而管理電網(wǎng)的穩(wěn)定性。這些都是一些基本的用途。這兩組數(shù)據(jù)都可以找到二級(jí)用途,即新的價(jià)值。它們可以應(yīng)用于另一個(gè)完全不同的目的:確定何時(shí)何地充電以及電子汽車服務(wù)站的設(shè)置點(diǎn)。在此之上,新的輔助信息也將納入其中,如汽車的位置和電網(wǎng)的歷史使用情況。而且,這些數(shù)據(jù)不只會(huì)使用一次,而是隨著電子汽車的能耗和電網(wǎng)壓力狀況的不斷更新,一次又一次地為IBM所用。25 / 25
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1