【正文】
掘算法。一類是將多維數(shù)據(jù)與路徑數(shù)據(jù)合并整體挖掘;另一類是分別挖掘多維數(shù)據(jù)和路徑數(shù)據(jù)。主要?jiǎng)?chuàng)新點(diǎn)如下: 1)基于傳統(tǒng)的頻繁模式挖掘和序列模式挖掘方法不能有效解決 RFID 頻繁路徑挖掘的問(wèn)題,本文在充分研究 RFID 路徑數(shù)據(jù)特點(diǎn)的情況下,將 RFID 路徑數(shù)據(jù)分成若干序列數(shù)據(jù),在現(xiàn)有的頻繁模式和序列模式挖掘方法基礎(chǔ)上,提出了面向 RFID 的高效頻繁路徑挖掘算法。我們對(duì)路徑數(shù)據(jù)挖掘技術(shù)作了深入的研究,挖掘出現(xiàn)頻率較高的路徑,為用戶了解物品的移動(dòng)規(guī)律和趨勢(shì),優(yōu)化供應(yīng)鏈,發(fā)現(xiàn)異常移動(dòng)等提供有用的信息。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)和發(fā)展為人們解決了這一難題,通過(guò)數(shù)據(jù)挖掘技術(shù)及其分析工具可以從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取潛在有用的信息和知識(shí)。 RFID 標(biāo)簽價(jià)格進(jìn)一步下降,人們可以在單個(gè)商品上粘貼標(biāo)簽,跟蹤供應(yīng)鏈中單個(gè)物品的移動(dòng)軌跡,如何管理和組織 RFID 系統(tǒng)收集的海量數(shù)據(jù)將成為研究利用 RFID 技術(shù)管理供應(yīng)鏈的重點(diǎn)。隨著 RFID 技術(shù)的發(fā)展,生產(chǎn)商、分銷(xiāo)商、零售商能夠?qū)?yīng)鏈中的單個(gè)物品的移動(dòng)進(jìn)行跟蹤。由于不斷加入數(shù)據(jù),會(huì)造成存儲(chǔ)空間消耗過(guò)大,本文研究利用路徑編碼的方法,來(lái)壓縮路徑數(shù)據(jù)。 4) RFID 系統(tǒng)不斷收集移動(dòng)物品的數(shù)據(jù),需要先對(duì)數(shù)據(jù)庫(kù)更新后,再挖掘用戶需要的準(zhǔn)確信息。本文利用各個(gè)站點(diǎn)挖掘頻繁路徑,再將結(jié)果存儲(chǔ)在路徑語(yǔ)法樹(shù)中,在 站點(diǎn)之間傳輸路徑語(yǔ)法樹(shù)來(lái)合并全局頻繁路徑。因?yàn)楣?yīng)鏈?zhǔn)欠植嫉模?RFID 系統(tǒng)也是分布的。這兩類算法適用于不同的數(shù)據(jù)集,可以有效提高 RFID 多維路徑挖掘的性能。 2)以本文的 RFID 頻繁路徑挖掘算法為基礎(chǔ),結(jié)合多維序列模式挖掘思想,提出兩類 RFID 多維路徑挖掘算法。在研究現(xiàn)有 RFID 數(shù)據(jù)挖掘方法的基礎(chǔ)上,本文主要在單機(jī)環(huán)境下 RFID 頻繁路徑挖掘、 RFID 多維頻繁路徑挖掘、分布環(huán)境下的 RFID頻繁路徑挖掘等幾方面做了深入的研究。 RFID 技術(shù)用來(lái)跟蹤供應(yīng)鏈中的移動(dòng)物品, RFID 數(shù)據(jù)中最重要的部分就是物品的移動(dòng)數(shù)據(jù),又稱路徑數(shù)據(jù)或者痕跡數(shù)據(jù), RFID 數(shù)據(jù)挖掘主要工作就是路徑數(shù)據(jù)挖掘。這些海量數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)中,面對(duì)這種 “ 數(shù)據(jù)爆炸 ” 的現(xiàn)實(shí),如何從海量數(shù)據(jù)中提取有價(jià)值的信息已顯得尤為重要。大型零售商如 Walmart、 Target 和 Albertsons 已經(jīng)開(kāi)始在它們的倉(cāng)庫(kù)和物流中心部署 RFID 系統(tǒng),并要求供應(yīng)商在商品的小包裝上粘貼 RFID 標(biāo)簽。計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)畢業(yè)論文 [精品論文 ] 面向 RFID 海量數(shù)據(jù)的若干數(shù)據(jù)挖掘技術(shù)研究 關(guān)鍵詞:數(shù)據(jù)庫(kù)理論 射頻識(shí)別技術(shù) 海量數(shù)據(jù) 數(shù)據(jù)挖掘技術(shù) 摘要:近年來(lái),射頻識(shí)別 (Radio Frequency Identification, RFID)技術(shù)快速發(fā)展,閱讀器與標(biāo)簽成本不斷下降,標(biāo)簽識(shí)別的準(zhǔn)確率不斷提高。隨著 RFID 技術(shù)的發(fā)展,生產(chǎn)商、分銷(xiāo)商、零售商能夠?qū)?yīng)鏈中的單個(gè)物品的移動(dòng)進(jìn)行跟蹤。 RFID 標(biāo)簽價(jià)格進(jìn)一步下降,人們可以在單個(gè)商品上粘貼標(biāo)簽,跟蹤供應(yīng)鏈中單個(gè)物品的移動(dòng)軌跡,如何管理和組織 RFID 系統(tǒng)收集的海量數(shù)據(jù)將成為研究利用 RFID 技術(shù)管理供 應(yīng)鏈的重點(diǎn)。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)和發(fā)展為人們解決了這一難題,通過(guò)數(shù)據(jù)挖掘技術(shù)及其分析工具可以從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取潛在有用的信息和知識(shí)。我們對(duì)路徑數(shù)據(jù)挖掘技術(shù)作了深入的研究,挖掘出現(xiàn)頻率較高的路 徑,為用戶了解物品的移動(dòng)規(guī)律和趨勢(shì),優(yōu)化供應(yīng)鏈,發(fā)現(xiàn)異常移動(dòng)等提供有用的信息。主要?jiǎng)?chuàng)新點(diǎn)如下: 1)基于傳統(tǒng)的頻繁模式挖掘和序列模式挖掘方法不能有效解決 RFID 頻繁路徑挖掘的問(wèn)題,本文在充分研究 RFID 路徑數(shù)據(jù)特點(diǎn)的情況下,將 RFID 路徑數(shù)據(jù)分成若干序列數(shù)據(jù),在現(xiàn)有的頻繁模式和序列模式挖掘方法基礎(chǔ)上,提出了面向 RFID 的高效頻繁路徑挖掘算法。一類是將多維數(shù)據(jù)與路徑數(shù)據(jù)合并整體挖掘;另一類是分別挖掘多維數(shù)據(jù)和路徑數(shù)據(jù)。 3)提出了一種分布環(huán)境下的 RFID 頻繁路徑挖掘算法。若將所有的數(shù)據(jù)集中到單個(gè)站點(diǎn)再用單機(jī)環(huán)境下的算法挖掘,將會(huì)造成大量數(shù)據(jù)傳輸和站點(diǎn)資源浪費(fèi)。這樣,不僅可以減少網(wǎng)絡(luò)數(shù)據(jù)傳輸量,也可以充分利用所有站點(diǎn)的計(jì)算能力,提高全局的挖掘速度。為了解決這一問(wèn)題,本文提出了更新挖掘算法。 正文內(nèi)容 近年來(lái),射頻識(shí)別 (Radio Frequency Identification, RFID)技術(shù)快速發(fā)展,閱讀器與標(biāo)簽成本不斷下降,標(biāo) 簽識(shí)別的準(zhǔn)確率不斷提高。大型零售商如 Walmart、 Target 和 Albertsons 已經(jīng)開(kāi)始在它們的倉(cāng)庫(kù)和物流中心部署 RFID 系統(tǒng),并要求供應(yīng)商在商品的小包裝上粘貼 RFID 標(biāo)簽。這些海量數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)中,面對(duì)這種 “ 數(shù)據(jù)爆炸 ”的現(xiàn)實(shí),如 何從海量數(shù)據(jù)中提取有價(jià)值的信息已顯得尤為重要。 RFID 技術(shù)用來(lái)跟蹤供應(yīng)鏈中的移動(dòng)物品, RFID 數(shù)據(jù)中最重要的部分就是物品的移動(dòng)數(shù)據(jù),又稱路徑數(shù)據(jù)或者痕跡數(shù)據(jù), RFID 數(shù)據(jù)挖掘主要工作就是路徑數(shù)據(jù)挖掘。在研 究現(xiàn)有 RFID 數(shù)據(jù)挖掘方法的基礎(chǔ)上,本文主要在單機(jī)環(huán)境下 RFID 頻繁路徑挖掘、 RFID 多維頻繁路徑挖掘、分布環(huán)境下的 RFID 頻繁路徑挖掘等幾方面做了深入的研究。 2)以本文的 RFID 頻繁路徑挖掘算法為基礎(chǔ),結(jié)合多維序列模式挖掘思想,提出兩 類 RFID 多維路徑挖掘算法。這兩類算法適用于不同的數(shù)據(jù)集,可以有效提高 RFID 多維路徑挖掘的性能。因?yàn)楣?yīng)鏈?zhǔn)欠植嫉?,所?RFID 系統(tǒng)也是分布的。本文利用各個(gè)站點(diǎn)挖掘頻繁路徑,再將結(jié)果存儲(chǔ)在路徑語(yǔ)法樹(shù)中,在站點(diǎn)之間傳輸路徑語(yǔ)法樹(shù)來(lái)合并全局頻繁路徑。 4) RFID系統(tǒng)不斷收集移動(dòng)物品的數(shù)據(jù),需要先對(duì)數(shù)據(jù)庫(kù)更新后,再挖掘用戶需要的準(zhǔn)確信息。由于不斷加入數(shù)據(jù),會(huì)造成存儲(chǔ)空間消耗過(guò)大,本文研究利用路徑編碼的方法,來(lái)壓縮路徑數(shù)據(jù)。隨著 RFID 技術(shù)的發(fā)展,生產(chǎn)商、分銷(xiāo)商、零售商能夠?qū)?yīng)鏈中的單個(gè)物品的移動(dòng)進(jìn)行跟 蹤。 RFID 標(biāo)簽價(jià)格進(jìn)一步下降,人們可以在單個(gè)商品上粘貼標(biāo)簽,跟蹤供應(yīng)鏈中單個(gè)物品的移動(dòng)軌跡,如何管理和組織 RFID系統(tǒng)收集的海量數(shù)據(jù)將成為研究利用 RFID技術(shù)管理供應(yīng)鏈的重點(diǎn)。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)和發(fā)展為人們解決了這一難題,通過(guò)數(shù)據(jù)挖掘技 術(shù)及其分析工具可以從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取潛在有用的信息和知識(shí)。我們對(duì)路徑數(shù)據(jù)挖掘技術(shù)作了深入的研究,挖掘出現(xiàn)頻率較高的路徑,為用戶了解物品的移動(dòng)規(guī)律和趨勢(shì),優(yōu)化供應(yīng)鏈,發(fā)現(xiàn)異常移動(dòng)等提供有用的信息。主要?jiǎng)?chuàng)新點(diǎn)如下: 1)基于傳統(tǒng)的頻繁模式挖掘和序列模式挖掘方法不能有效解決 RFID 頻繁路徑挖掘的問(wèn)題,本文在充分研究RFID 路徑數(shù)據(jù)特點(diǎn)的情況下,將 RFID 路徑數(shù)據(jù)分成若干序列數(shù)據(jù),在現(xiàn)有的頻繁模式和序列模式挖掘方法基礎(chǔ)上,提出了面向 RFID 的高效頻繁路徑挖掘算法。一類是將多維數(shù)據(jù)與路徑數(shù)據(jù)合并整體挖掘;另一類是分別挖掘多維數(shù)據(jù)和路徑數(shù)據(jù)。 3)提出了一種分布環(huán)境下的 RFID 頻繁路徑挖掘算法。若將所有的數(shù)據(jù)