freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

領(lǐng)域應(yīng)用知識(shí)圖譜的技術(shù)與應(yīng)用(編輯修改稿)

2025-07-21 00:24 本頁面
 

【文章內(nèi)容簡介】 3. 知識(shí)圖譜的設(shè)計(jì) 4. 把數(shù)據(jù)存入知識(shí)圖譜 5. 上層應(yīng)用的開發(fā),以及系統(tǒng)的評(píng)估。下面我們就按照這個(gè)流程來講一下每個(gè)步驟所需要做的事情以及需要思考的問題。 定義具體的業(yè)務(wù)問題在P2P網(wǎng)貸環(huán)境下,最核心的問題是風(fēng)控,也就是怎么去評(píng)估一個(gè)借款人的風(fēng)險(xiǎn)。在線上的環(huán)境下,欺詐風(fēng)險(xiǎn)尤其為嚴(yán)重,而且很多這種風(fēng)險(xiǎn)隱藏在復(fù)雜的關(guān)系網(wǎng)絡(luò)之中,而且知識(shí)圖譜正好是為這類問題所設(shè)計(jì)的,所以我們“有可能”期待它能在欺詐,這個(gè)問題上帶來一些價(jià)值。在進(jìn)入下一個(gè)話題的討論之前,要明確的一點(diǎn)是,對(duì)于自身的業(yè)務(wù)問題到底需不需要知識(shí)圖譜系統(tǒng)的支持。因?yàn)樵诤芏嗟膶?shí)際場景,即使對(duì)關(guān)系的分析有一定的需求,實(shí)際上也可以利用傳統(tǒng)數(shù)據(jù)庫來完成分析的。所以為了避免使用知識(shí)圖譜而選擇知識(shí)圖譜,以及更好的技術(shù)選型,以下給出了幾點(diǎn)總結(jié),供參考。 數(shù)據(jù)收集 amp。 預(yù)處理下一步就是要確定數(shù)據(jù)源以及做必要的數(shù)據(jù)預(yù)處理。針對(duì)于數(shù)據(jù)源,我們需要考慮以下幾點(diǎn):1. 我們已經(jīng)有哪些數(shù)據(jù)? 2. 雖然現(xiàn)在沒有,但有可能拿到哪些數(shù)據(jù)? 3. 其中哪部分?jǐn)?shù)據(jù)可以用來降低風(fēng)險(xiǎn)? 4. 哪部分?jǐn)?shù)據(jù)可以用來構(gòu)建知識(shí)圖譜?在這里需要說明的一點(diǎn)是,并不是所有跟反欺詐相關(guān)的數(shù)據(jù)都必須要進(jìn)入知識(shí)圖譜,對(duì)于這部分的一些決策原則在接下來的部分會(huì)有比較詳細(xì)的介紹。對(duì)于反欺詐,有幾個(gè)數(shù)據(jù)源是我們很容易想得到的,包括用戶的基本信息、行為數(shù)據(jù)、運(yùn)營商數(shù)據(jù)、網(wǎng)絡(luò)上的公開信息等等。假設(shè)我們已經(jīng)有了一個(gè)數(shù)據(jù)源的列表清單,則下一步就要看哪些數(shù)據(jù)需要進(jìn)一步的處理,比如對(duì)于非結(jié)構(gòu)化數(shù)據(jù)我們或多或少都需要用到跟自然語言處理相關(guān)的技術(shù)。 用戶填寫的基本信息基本上會(huì)存儲(chǔ)在業(yè)務(wù)表里,除了個(gè)別字段需要進(jìn)一步處理,很多字段則直接可以用于建?;蛘咛砑拥街R(shí)圖譜系統(tǒng)里。對(duì)于行為數(shù)據(jù)來說,我們則需要通過一些簡單的處理,并從中提取有效的信息比如“用戶在某個(gè)頁面停留時(shí)長”等等。 對(duì)于網(wǎng)絡(luò)上公開的網(wǎng)頁數(shù)據(jù),則需要一些信息抽取相關(guān)的技術(shù)。舉個(gè)例子,對(duì)于用戶的基本信息,我們很可能需要如下的操作。一方面,用戶信息比如姓名、年齡、學(xué)歷等字段可以直接從結(jié)構(gòu)化數(shù)據(jù)庫中提取并使用。但另一方面,對(duì)于填寫的公司名來說,我們有可能需要做進(jìn)一步的處理。比如部分用戶填寫“北京貪心科技有限公司”,另外一部分用戶填寫“北京望京貪心科技有限公司”,其實(shí)指向的都是同一家公司。所以,這時(shí)候我們需要做公司名的對(duì)齊,用到的技術(shù)細(xì)節(jié)可以參考前面講到的實(shí)體對(duì)齊技術(shù)。 知識(shí)圖譜的設(shè)計(jì)圖譜的設(shè)計(jì)是一門藝術(shù),不僅要對(duì)業(yè)務(wù)有很深的理解、也需要對(duì)未來業(yè)務(wù)可能的變化有一定預(yù)估,從而設(shè)計(jì)出最貼近現(xiàn)狀并且性能高效的系統(tǒng)。在知識(shí)圖譜設(shè)計(jì)的問題上,我們肯定會(huì)面臨以下幾個(gè)常見的問題:1. 需要哪些實(shí)體、關(guān)系和屬性? 2. 哪些屬性可以做為實(shí)體,哪些實(shí)體可以作為屬性? 3. 哪些信息不需要放在知識(shí)圖譜中?基于這些常見的問題,我們從以往的設(shè)計(jì)經(jīng)驗(yàn)中抽象出了一系列的設(shè)計(jì)原則。這些設(shè)計(jì)原則就類似于傳統(tǒng)數(shù)據(jù)庫設(shè)計(jì)中的范式,來引導(dǎo)相關(guān)人員設(shè)計(jì)出更合理的知識(shí)圖譜系統(tǒng),同時(shí)保證系統(tǒng)的高效性。接下來,我們舉幾個(gè)簡單的例子來說明其中的一些原則。 首先是,業(yè)務(wù)原則(Business Principle),它的含義是 “一切要從業(yè)務(wù)邏輯出發(fā),并且通過觀察知識(shí)圖譜的設(shè)計(jì)也很容易推測其背后業(yè)務(wù)的邏輯,而且設(shè)計(jì)時(shí)也要想好未來業(yè)務(wù)可能的變化”。舉個(gè)例子,可以觀察一下下面這個(gè)圖譜,并試問自己背后的業(yè)務(wù)邏輯是什么。通過一番觀察,其實(shí)也很難看出到底業(yè)務(wù)流程是什么樣的。做個(gè)簡單的解釋,這里的實(shí)體“申請”意思就是application,如果對(duì)這個(gè)領(lǐng)域有所了解,其實(shí)就是進(jìn)件實(shí)體。在下面的圖中,申請和電話實(shí)體之間的“has_phone”,“parent phone”是什么意思呢?接下來再看一下下面的圖,跟之前的區(qū)別在于我們把申請人從原有的屬性中抽取出來并設(shè)置成了一個(gè)單獨(dú)的實(shí)體。在這種情況下,整個(gè)業(yè)務(wù)邏輯就變得很清晰,我們很容易看出張三申請了兩個(gè)貸款,而且張三擁有兩個(gè)手機(jī)號(hào),在申請其中一個(gè)貸款的時(shí)候他填寫了父母的電話號(hào)。總而言之,一個(gè)好的設(shè)計(jì)很容易讓人看到業(yè)務(wù)本身的邏輯。接下來再看一個(gè)原則叫做效率原則(Efficiency Principle)。 效率原則讓知識(shí)圖譜盡量輕量化、并決定哪些數(shù)據(jù)放在知識(shí)圖譜,哪些數(shù)據(jù)不需要放在知識(shí)圖譜。在這里舉一個(gè)簡單的類比,在經(jīng)典的計(jì)算機(jī)存儲(chǔ)系統(tǒng)中,我們經(jīng)常會(huì)談?wù)摰絻?nèi)存和硬盤,內(nèi)存作為高效的訪問載體,作為所有程序運(yùn)行的關(guān)鍵。這種存儲(chǔ)上的層次結(jié)構(gòu)設(shè)計(jì)源于數(shù)據(jù)的局部性“l(fā)ocality”,也就是說經(jīng)常被訪問到的數(shù)據(jù)集中在某一個(gè)區(qū)塊上,所以這部分?jǐn)?shù)據(jù)可以放到內(nèi)存中來提升訪問的效率。 類似的邏輯也可以應(yīng)用到知識(shí)圖譜的設(shè)計(jì)上:我們把常用的信息存放在知識(shí)圖譜中,把那些訪問
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1