freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

碩士學(xué)位論文基于sas系統(tǒng)的稅務(wù)數(shù)據(jù)挖掘研究(編輯修改稿)

2024-12-13 05:14 本頁面
 

【文章內(nèi)容簡介】 的信息,為各級領(lǐng)導(dǎo)決策提供科學(xué)合理的依據(jù)、 提高經(jīng)濟稅源的分析能力、強化稅收征收管理的精細化管理水平,也成為目前 稅務(wù)體統(tǒng)中亟待解決的問題。與此同時,隨著數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的發(fā)展, 對這些數(shù)據(jù)開發(fā)利用成為可能。 1. 2.國內(nèi)外研究與應(yīng)用現(xiàn)狀 目前國內(nèi)外數(shù)據(jù)挖掘 DM 的主要研究內(nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù) 據(jù)倉庫、可視化技術(shù)、定性定量互換模型、知識表示方法、發(fā)現(xiàn)知識的維護和 再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。數(shù)據(jù)挖 掘所發(fā)現(xiàn)的知識通常有五類:一是描述性知識,主要指類別特征的概括性描述, 根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其普遍性的,具有較高概念層次的、微觀和宏觀的知 識,主要通過數(shù)據(jù)立方體 或 OLAP 、面向?qū)傩缘囊?guī)約 類 SQL 語言 等技術(shù) 實現(xiàn);二是關(guān)聯(lián)知識,是指反映某一事件與其它事件的關(guān)聯(lián)或依賴知識,主要 通過 Apdori 等關(guān)聯(lián)規(guī)則算法實現(xiàn);三是分類型知識,主要是通過基于決策樹的 分類算法、基于統(tǒng)計的線性回歸和線性辨別分析方法、粗糙集等方法,發(fā)現(xiàn)同 類事物之間的共同特征和不同事物之間的差異特征,以達 到分類的目的;四是 預(yù)測型知識,以時間為關(guān)鍵屬性,由歷史的和當(dāng)前的數(shù)據(jù)預(yù)測未來的數(shù)據(jù),實 現(xiàn)技術(shù)主要有基于統(tǒng)計的隨機模型、神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)等,如回歸模型、自 回歸滑動平均模型和季節(jié)調(diào)整模型;五是偏差型知識,描述差異和極端特例, 揭示事物偏離常規(guī)的異?,F(xiàn)象,如比較常用的離群點監(jiān)測技術(shù)??v觀數(shù)據(jù)挖掘 的實現(xiàn)技術(shù)和挖掘知識的類型,無不深刻揭示了數(shù)據(jù)挖掘通過預(yù)測未來趨勢及 行為,做出前攝的、基于知識的決策的功能。 在目前經(jīng)濟和信息全球化的時代,每個企業(yè)每天都會產(chǎn)生大量的數(shù)據(jù),這 些數(shù)據(jù)來自不同的數(shù)據(jù)源,對數(shù)據(jù)的高效利用成為企業(yè)增強競爭力的主要體現(xiàn)。 數(shù)據(jù)挖掘是對大量的原始數(shù)據(jù)進行選擇、分析和建模,從中發(fā)現(xiàn)以前沒有發(fā)現(xiàn) 2 l 引論 的趨勢和模式。數(shù)據(jù)挖掘的應(yīng)用非常廣泛,只要一個產(chǎn)業(yè)有分析的價值和需求 的數(shù)據(jù)倉庫或數(shù)據(jù)庫,都可以利用數(shù)據(jù)挖掘工具進行有目的的挖掘分析 n羽。常 見的應(yīng)用案例多發(fā)生在作業(yè)成本管理、法規(guī)依從、客戶關(guān)系管理 n 羽 、財務(wù)智能、 績效管理、盈利能力管理等方面,其中比較典型的是: 1 反洗錢法規(guī)要求一自動發(fā)現(xiàn)可疑活動并對活動進行分類和顯示,這樣, 企業(yè)就能滿足嚴格的政府法規(guī)要求,確保股東信心和良好的社會評價;對市場、 信用和運營風(fēng)險衡量標準進行計算和總結(jié),在最大限度上減少風(fēng)險管理的工作 量和投資。 2 隨著財務(wù)部門的戰(zhàn)略重要性不斷提高,數(shù)據(jù)對企業(yè)的成功變得非常重 要。 然而發(fā)現(xiàn)企業(yè)數(shù)據(jù)背后隱藏的價值卻是擺在企業(yè)面前的一個挑戰(zhàn)。 許多 財務(wù)部門仍然通過手動、復(fù)雜而且不 準確的報表工具來查看數(shù)據(jù),整個企業(yè)的 財務(wù)流程很難保持統(tǒng)一。 目前國內(nèi)很多公司在數(shù)據(jù)挖掘應(yīng)用方面取得的顯著成果,彰顯了數(shù)據(jù)挖掘 強大的生命力:中國海關(guān)使用 EAS 系統(tǒng)對目前關(guān)稅中存在的偷稅漏稅行為進行 檢測、對走私犯罪行為進行嚴厲打擊。部署利用基于 SAS 的執(zhí)法評估系統(tǒng)EAS, 可以輕松發(fā)現(xiàn)隱藏的管理風(fēng)險,在使用執(zhí)法評估系統(tǒng)兩年,在 37 個直屬海關(guān)部 署了這一系統(tǒng), 2020 年補繳的關(guān)稅達 2020 萬美元 1700 萬歐元 ,目前還在研發(fā) 更先進的新系統(tǒng);上海通用汽車有限公司是目前 國內(nèi)最大的轎車生產(chǎn)商,利用 SAS 提供的保修分析解決方法,該公司建立了質(zhì)量預(yù)警系統(tǒng),對問題原因的及 時發(fā)現(xiàn)能力,較之前有很大提高。同時在 2020 年,通用公司利用 SAS 提供的數(shù) 據(jù)挖掘軟件,發(fā)現(xiàn)了很多問題,所有這些如果沒有利用數(shù)據(jù)挖掘技術(shù)和軟件, 是不可能在早期被發(fā)現(xiàn)的,在時間上較之前提前了 3 個月,同時對保修的分析 周期也同比下降了 70%,僅此幾項業(yè)務(wù),為通用節(jié)省了將近 900 萬的保修成本。 利用該數(shù)據(jù)挖掘方案不僅大大降低了成本,而且實現(xiàn)了預(yù)期目標。 1. 3.研究內(nèi)容 由 于數(shù)據(jù)挖掘工作在稅務(wù)數(shù)據(jù)方面的運用國內(nèi)是首次開展,尚無比較多的 經(jīng)驗可以借鑒,我們僅能從以前的數(shù)據(jù)挖掘工作中尋找規(guī)律同時結(jié)合業(yè)務(wù)人員 的經(jīng)驗進行探索性分析,初步確定選擇兩個課題進行實驗性研究。 3 1 引論 重點選取了兩個方向,第一個是開展預(yù)測分析工作,具體內(nèi)容是使用SAS 工具的建模和挖掘功能,運用各種數(shù)據(jù)分析方法對各項稅收數(shù)據(jù)的分析,同時 運用決策樹、回歸等建模方法建立一般納稅人增值稅走逃風(fēng)險評級模型,對一 般納稅人的走逃風(fēng)險進行評估和分級,為加強一般納稅人管理、避免一般納稅 人走逃提供依據(jù);第二個是通過運用 SAS 工具對一般納稅人專用發(fā)票的上下游 關(guān)聯(lián)分析,建立企業(yè)交易網(wǎng)格,同時通過聚類分析、孤立點分析等統(tǒng)計學(xué)的分 析方法建立模型.企業(yè)接受虛抵模型,初步確定可能接受虛開的企業(yè),同時配合 運用關(guān)聯(lián)分析等建立企業(yè)交易網(wǎng)格,同過對企業(yè)之間交易的可信度、行業(yè)置信 度等的分析,精確定位虛開的票據(jù),從而為加強增值稅專用發(fā)票的管理提 供依 據(jù),同時對可能存在的發(fā)票虛開虛抵行為進行預(yù)警。 1. 4.研究意義 本文只是利用 SAS 工具進行稅務(wù)數(shù)據(jù)分析的一個探索,課題選取了“走 逃 和“虛開 ,探索成功后,還可以以 SAS 工具為基礎(chǔ)做其他方面的縱深分析。 例如,一般納稅人增值稅走逃風(fēng)險評級項目,可以進一步做企業(yè)風(fēng)險級別管理 分析,精細化企業(yè)管理,針對走逃風(fēng)險級別不同的企業(yè)采取不同的管理措施, 更深層次地分析企業(yè)流失,相應(yīng)地做政策性護稅。還可以做成品油行業(yè)虛抵, 運費虛抵等課題,深入挖掘企業(yè)虛開等領(lǐng)域。稅務(wù) 數(shù)據(jù)有大量的深度分析課題, 通過 SAS 工具的深度挖掘和分析,至力于提升稅務(wù)信息化管理水平。 帶動數(shù)據(jù)質(zhì)量工作,提升數(shù)據(jù)質(zhì)量,數(shù)據(jù)質(zhì)量的提升反過來會提高深度分 析的準確性。在用 SAS 工具對數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)進行提取、計算和加工的過 程中,發(fā)現(xiàn)部分數(shù)據(jù)質(zhì)量問題,而且最后訓(xùn)練的模型也能反映出數(shù)據(jù)質(zhì)量方面 的問題。通過及時修改發(fā)現(xiàn)的問題提高數(shù)據(jù)質(zhì)量,促進業(yè)務(wù)和操作的規(guī)范性, 推動稅收管理,強化薄弱環(huán)節(jié)。通過該模型還可以對各地稅務(wù)機關(guān)的一般納稅 人管理水平進行量化評價,有利于稅務(wù)機 關(guān)內(nèi)部的管理水平的提升。 1. 5.論文的組織結(jié)構(gòu) 論文各章節(jié)的組織結(jié)構(gòu)如下: 4 1 引論 第一章引論。作為論文的緒論部分,本章主要對本次數(shù)據(jù)挖掘工作的業(yè)務(wù) 背景、技術(shù)背景以及國內(nèi)外目前的數(shù)據(jù)挖掘應(yīng)用情況進行了簡要介紹,同時對 本文的主要研究內(nèi)容、研究意義進行了簡單描述。 第二章相關(guān)挖掘技術(shù)概述。本章作為論文的技術(shù)基礎(chǔ) ,主要對目前數(shù)據(jù)挖 掘的前景和數(shù)據(jù)挖掘在稅務(wù)行業(yè)的主要應(yīng)用方向和相關(guān)技術(shù)進行了介紹。同時 對本次數(shù)據(jù)挖掘工作所涉及到的數(shù)據(jù)挖掘算法 logistic 回歸、系統(tǒng)聚類和聚類相 關(guān)的統(tǒng)計量進行了詳細描述。 第三章 SAS/ EM 數(shù)據(jù)挖掘方法論。本章主要對本次數(shù)據(jù)挖掘工作所采用的工 具 SAS 系統(tǒng)進行了簡單介紹,同時對 SAS 所采用的方法論同時也是本次挖掘工 作流程的 SAS/ EM 進行了詳細介紹,作為本次挖掘工作的科學(xué)根據(jù)。 第四章挖掘建模。作為論文的核心部分,本章主要對本次數(shù)據(jù)挖掘 建模工 作的工作過程進行了詳細介紹,包括需求分析、系統(tǒng)架構(gòu)和程序流程等。同時 對建模結(jié)果進行了詳細分析,比較各種模型的優(yōu)劣,結(jié)合實際應(yīng)用,得出最優(yōu) 模型。 第五章結(jié)論和展望。在文章的最后,重點對本次工作的內(nèi)容和主要成果進 行了總結(jié)分析,對影響數(shù)據(jù)挖掘結(jié)果的因素進行了歸納。同時對數(shù)據(jù)挖掘在稅 務(wù)行業(yè)未來可能的應(yīng)用方向進行了探索。 5 2 相關(guān)挖掘技術(shù) 概述 2.相關(guān)挖掘技術(shù)概述 數(shù)據(jù)挖掘 Data Mining 就是從大量的、隨機的、有噪聲的、不完整的、 模糊的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在 有用的信息和知識的過程 H1。是現(xiàn)代社會信息的需要而發(fā)展起來的新學(xué)科,建立 在數(shù)據(jù)庫、統(tǒng)計學(xué)、模式識別、機器學(xué)習(xí)、人工智能等學(xué)科的基礎(chǔ)之上嘲。它與 以往的數(shù)據(jù)分析的區(qū)別主要是數(shù)據(jù)挖掘是在沒有明確假設(shè)的情況下去挖掘信 息、發(fā)現(xiàn)規(guī)則,它所挖掘到得信息有預(yù)先未知、 實用、有效等特性。本章作為 整篇論文的理論基礎(chǔ),重點從以下幾個方面進行重點介紹。首先依照數(shù)據(jù)挖掘 技術(shù)在稅務(wù)系統(tǒng)中的應(yīng)用對算法進行分類,然后就本次數(shù)據(jù)挖掘過程中用到的 數(shù)據(jù)挖掘方法進行簡單介紹,主要有 logistic 回歸、系統(tǒng)聚類、常用統(tǒng)計量、關(guān)聯(lián) 規(guī)則等。 2. 1.?dāng)?shù)據(jù)挖掘方法分類 目前的數(shù)據(jù)挖掘分類依據(jù)多種多樣,常見的主要有兩種 H 蝴,分別是依據(jù)數(shù) 據(jù)挖掘的目的或數(shù)據(jù)挖掘內(nèi)容來進行劃分。前者是根據(jù)挖掘目的是否明確,即 有無目標變量的前提下,將數(shù)據(jù)挖掘方法分為有監(jiān)督 的挖掘和無監(jiān)督的挖掘; 后者是根據(jù)數(shù)據(jù)挖掘的具體內(nèi)容進行劃分的啪 1,主要分為分類分析乜168。、聚類分 析、關(guān)聯(lián)分析、序列模式與孤立點分析等。不管是依據(jù)挖掘目的還是挖掘內(nèi)容 來劃分,都過于偏頗。在實際應(yīng)用中,通常是綜合考慮,不能單一的予以判定乜羽, 根據(jù)本次稅務(wù)數(shù)據(jù)挖掘研究的不同應(yīng)用,將數(shù)據(jù)挖掘算法進行分類,具體如表 2. 1 所示。 1 決策樹 決策樹算法作為決策支持系統(tǒng)的基礎(chǔ)與核心,由于其將建模結(jié)果通過一系 列規(guī)則合集的形式進行展現(xiàn),使模型簡單易懂,從而受到廣 大決策者和業(yè)務(wù)人 員的青睞。在稅務(wù)系統(tǒng)中,決策樹模型主要針對不熟悉數(shù)據(jù)挖掘技術(shù)的稅收業(yè) 務(wù)人員的,稅收業(yè)務(wù)人員利用決策樹的一系列規(guī)則來初步判斷納稅人員的增值 稅票票面額度、每月發(fā)放的增值稅票數(shù)、稅員流失的可能性以及潛在的納稅人 員,保證稅收政策的有效實施。 6 2 相關(guān)挖掘技術(shù)概述 2 聚類 聚類作為群體劃分的重要方法,在 稅務(wù)系統(tǒng)中有廣泛的應(yīng)用。主要有利用 聚類分析識別不同納稅人員潛在的相似特征,同時區(qū)分不同的納稅群體特性, 對不同群體的納稅人實施不同的稅收政策,從而實現(xiàn)納稅人細分。聚類分析作 為數(shù)據(jù)挖掘工作的基礎(chǔ),與其它挖掘算法結(jié)合使用。例如在建模前,通常先對 所有的變量進行聚類,在挖掘建模前將具有相似效用的變量剔除,避免由此引 發(fā)的模型效果的膨脹;在進行關(guān)聯(lián)規(guī)則挖掘之前,通常將不同納稅人按照不同 行業(yè)進行聚類,達到凸顯規(guī)則的效果,使得在此基礎(chǔ)上進行的關(guān)聯(lián)規(guī)則挖掘工 作更快速、便捷、有效。 表 2. 1 數(shù)據(jù)挖掘方法應(yīng)用分類 算法 商業(yè)問題 決策樹 預(yù)測對象所屬的類別,如納稅人員流失、潛在
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1