freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

碩士學位論文基于sas系統(tǒng)的稅務數(shù)據(jù)挖掘研究(完整版)

2024-12-25 05:14上一頁面

下一頁面
  

【正文】 數(shù)據(jù)公告,我們可以推想 會有多少國家稅款流失。 在目前經(jīng)濟和信息全球化的時代,每個企業(yè)每天都會產(chǎn)生大量的數(shù)據(jù),這 些數(shù)據(jù)來自不同的數(shù)據(jù)源,對數(shù)據(jù)的高效利用成為企業(yè)增強競爭力的主要體現(xiàn)。部署利用基于 SAS 的執(zhí)法評估系統(tǒng)EAS, 可以輕松發(fā)現(xiàn)隱藏的管理風險,在使用執(zhí)法評估系統(tǒng)兩年,在 37 個直屬海關部 署了這一系統(tǒng), 2020 年補繳的關稅達 2020 萬美元 1700 萬歐元 ,目前還在研發(fā) 更先進的新系統(tǒng);上海通用汽車有限公司是目前 國內(nèi)最大的轎車生產(chǎn)商,利用 SAS 提供的保修分析解決方法,該公司建立了質(zhì)量預警系統(tǒng),對問題原因的及 時發(fā)現(xiàn)能力,較之前有很大提高。稅務 數(shù)據(jù)有大量的深度分析課題, 通過 SAS 工具的深度挖掘和分析,至力于提升稅務信息化管理水平。本章作為論文的技術基礎 ,主要對目前數(shù)據(jù)挖 掘的前景和數(shù)據(jù)挖掘在稅務行業(yè)的主要應用方向和相關技術進行了介紹。在文章的最后,重點對本次工作的內(nèi)容和主要成果進 行了總結(jié)分析,對影響數(shù)據(jù)挖掘結(jié)果的因素進行了歸納。前者是根據(jù)挖掘目的是否明確,即 有無目標變量的前提下,將數(shù)據(jù)挖掘方法分為有監(jiān)督 的挖掘和無監(jiān)督的挖掘; 后者是根據(jù)數(shù)據(jù)挖掘的具體內(nèi)容進行劃分的啪 1,主要分為分類分析乜168。聚類分析作 為數(shù)據(jù)挖掘工作的基礎,與其它挖掘算法結(jié)合使用。 5 神經(jīng)網(wǎng)絡 神經(jīng)網(wǎng)絡是一種模仿人工神經(jīng)元來進行建模的方法,它是利用一定的規(guī)則迭 代改變連接權(quán)值矩陣的值來達到自學習的目的。從模型的可解釋性、準確度、建立速度以及建模數(shù)據(jù)的特點等方面 考慮,在本文中的兩個數(shù)據(jù)挖掘?qū)n}中,一般納稅人增值稅走逃風險評級模型 由于有目標變量且屬于分類型挖掘,所以模型的建立采用決策樹、回歸的方法; 而增值稅專票的虛開模型由于沒有目標變量,所以采用聚類和關聯(lián)規(guī)則進行建 模。但是多元回歸的方法很可能得到一個負 值,或大于 1 的值,這很難解釋。 另外在參數(shù)估計上, logistic 回歸模型估計是采用 MLE 方法來估計參數(shù)。隨著科學的 進步,時代的發(fā)展,人們對分類準確性的要求也越來越高,導致有時候僅靠專 業(yè)知識和經(jīng)驗很難確切地進行分類,此時聚類分析技術應運而生。此外,在模糊聚類中,每個對象不再僅屬于單個聚 類,而是以不同的隸屬度屬于多個聚類。這種 連續(xù)合并類的過程可以用聚 類譜系圖來表示,俗稱樹狀圖,與數(shù)據(jù)結(jié)構(gòu)里經(jīng)常 見到的樹狀圖形很相似。 D 決定類的個數(shù),及各類包含的樣品數(shù),并對類最出解釋。實際應用中,對這 類問題的解決,主要是依據(jù)統(tǒng)計學中方差分析的思想 I 刪,用統(tǒng)計量的方法進 行 估計。但是,顯然分類越多, R2 越大,所以我們只能 取 G 使得 R2 足夠大,但 G 本身比較小,而且 R2 不再大幅度增加。偽F 統(tǒng)計 量可以作為確定類個數(shù)的有用指標,但不具有像隨機變量 F 那樣的分布。本文中虛開模型 就是這方面的一個典型應用。目前為止, SAS 的行業(yè)解決方案已在全球超過 40, 000 家的企業(yè)中使用, 其中包括全球財富 500 強 90%以上的企業(yè),客戶分布在金融服務業(yè)、保險業(yè)、 電信業(yè)、制造業(yè)、零售業(yè)、醫(yī)藥、能源、政府和教育等領域。特征 ;叫 I‘口晰 缸幻f.一 C螂; fI‘ l 幸矗宰圭化 端 IB ∞ lB 函 婦■ 嵫一 .嗣 蠡螺身段 5% 5 5 5 ∞ 鼙鋸蔓輯 1 啷 10 10 10 文車文件 瑞 ∞ ∞ I 據(jù) H 葺 1 魄 IO IO lO 。―’ 1 潮一“曩鬈’ ^“.世’。 15 3SAS/ EM 數(shù)據(jù)挖掘方法論 3. SAS/ EM 數(shù)據(jù)挖掘方法論 目前在市場上最為流行的三大數(shù)據(jù)挖掘軟件 l 刪有 SAS 公司的Enterprise Miner、 IBM 公司的 Intelligent 在澳大利亞稅務局、堪薩斯州 稅務局等地方稅務數(shù)據(jù)方面的成功運用,及SAS 科學的數(shù)據(jù)挖掘方法論 SEMMA,本次數(shù)據(jù)挖掘選用 SAS 作為挖掘工具。經(jīng)常把聚類分析作為其他數(shù)據(jù)挖掘工作 的基礎,然后利用變量間的相似性分層次進行聚類。 。假設某一步把類 ck 和類 cI 合并為下一水平的類cM, 兩個觀測之間的距離或非相似性測度, DKL 為 G 水平的類 Ck 和類 CL 之間的距離或 非相似性測度。國外很多研究大多數(shù)給出具有綜 合特性的聚類方法是類平均法和 Wards 最小方差法,最差的則是最短距離。 Gp 與 Gq 合并為一類,記為 Gr Gp, Gq ;利用遞推公式計算新類與其它類之間的 距離。同時也是本次數(shù)據(jù)挖掘工作進行聚類分析所采用的方法。如果數(shù)據(jù)集合 x 中有 N 個對象實例墨 f l?Ⅳ 。 但是 MLE 還有一些與 LSE 不同的假設: 1 自變量 Y 是分類變量,研究的興趣是在 X 發(fā)生時事件發(fā)生的條件概率。 致,但兩者有本質(zhì)區(qū)別。下面以 logistic 回歸為例,簡要介紹其理論。 6 時序關聯(lián) 時序關聯(lián)是一種以時間為關鍵屬性來發(fā)現(xiàn)序列模式的方法,用于預測未來的 變化趨勢。 7 2 相關挖掘技術概述 4 回歸分析 決策樹方法雖然對于模型的解釋具有良好的效用,但是如果作為建模的方 法,由于其在大多數(shù)情況下對數(shù)據(jù)的過度擬合造成決策樹模型的驗證效果往往 不是很好。 1 決策樹 決策樹算法作為決策支持系統(tǒng)的基礎與核心,由于其將建模結(jié)果通過一系 列規(guī)則合集的形式進行展現(xiàn),使模型簡單易懂,從而受到廣 大決策者和業(yè)務人 員的青睞。它與 以往的數(shù)據(jù)分析的區(qū)別主要是數(shù)據(jù)挖掘是在沒有明確假設的情況下去挖掘信 息、發(fā)現(xiàn)規(guī)則,它所挖掘到得信息有預先未知、 實用、有效等特性。 第四章挖掘建模。通過該模型還可以對各地稅務機關的一般納稅 人管理水平進行量化評價,有利于稅務機 關內(nèi)部的管理水平的提升。 3 1 引論 重點選取了兩個方向,第一個是開展預測分析工作,具體內(nèi)容是使用SAS 工具的建模和挖掘功能,運用各種數(shù)據(jù)分析方法對各項稅收數(shù)據(jù)的分析,同時 運用決策樹、回歸等建模方法建立一般納稅人增值稅走逃風險評級模型,對一 般納稅人的走逃風險進行評估和分級,為加強一般納稅人管理、避免一般納稅 人走逃提供依據(jù);第二個是通過運用 SAS 工具對一般納稅人專用發(fā)票的上下游 關聯(lián)分析,建立企業(yè)交易網(wǎng)格,同時通過聚類分析、孤立點分析等統(tǒng)計學的分 析方法建立模型.企業(yè)接受虛抵模型,初步確定可能接受虛開的企業(yè),同時配合 運用關聯(lián)分析等建立企業(yè)交易網(wǎng)格,同過對企業(yè)之間交易的可信度、行業(yè)置信 度等的分析,精確定位虛開的票據(jù),從而為加強增值稅專用發(fā)票的管理提 供依 據(jù),同時對可能存在的發(fā)票虛開虛抵行為進行預警。 2 隨著財務部門的戰(zhàn)略重要性不斷提高,數(shù)據(jù)對企業(yè)的成功變得非常重 要。與此同時,隨著數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的發(fā)展, 對這些數(shù)據(jù)開發(fā)利用成為可能。 本文的主要目的是通過應用數(shù)據(jù)挖掘,對國稅系統(tǒng)的 數(shù)據(jù)進行深度分析, 提升數(shù)據(jù)分析的價值,深入挖掘數(shù)據(jù)的價值,將“數(shù)據(jù)提升 提升為“信息支 撐 ;提升稅收征管的工作效率和優(yōu)化其業(yè)務流程;逐步豐富數(shù)據(jù)分析知識庫, 有力支撐精細化管理和信息管稅。 21 4 . 1 一般納稅人增值稅走逃風險模型?????????????????. 2l 4 . 1 . 1 業(yè) 務 問 題 定義???????????????????????? 22 4 . 1 . 2 寬表設計?????????????????????????? 2l 4 . 1 . 3 數(shù)據(jù)庫 設計????????????????????????? 22 4. 1. 4SEMMA??????????????????????????????????.. 25 4 . 2 虛開稽查模型?????????????????????????? 37 4 . 2 . 1 寬表設計??????????????????:???????。它能幫助稅務機關從大量的稅務數(shù)據(jù)中 分析納稅 人的行為信息,識別出納稅人走逃或虛開的特征,鎖定稽查目標,縮 小稽查成本。 本文依托河南省局稅收信息系統(tǒng)的各項數(shù)據(jù)資源,基于目前國際先進的數(shù) 據(jù)挖掘分析工具 SAG,利用數(shù)據(jù)挖掘技術,對省局稅務系統(tǒng)的數(shù)據(jù)挖掘工作進行 了初步探索。 37 4 . 2 . 2 建模過程?????????????????????????? 37 4 . 2 . 3 模型評估??????????? ??????????????? 4l 4 . 2 . 4 模型應用?????????????????????????? 44 4 . 3 本章小結(jié)???????????????????????????? 47 5 結(jié)論和展望??????????????????????。 1. 1.業(yè)務背景 新中國的稅收僅僅走過半個多世紀的短暫歷程,期間還有長達三十年的計 劃經(jīng)濟時期。 1. 2.國內(nèi)外研究與應用現(xiàn)狀 目前國內(nèi)外數(shù)據(jù)挖掘 DM 的主要研究內(nèi)容包括基礎理論、發(fā)現(xiàn)算法、數(shù) 據(jù)倉庫、可視化技術、定性定量互換模型、知識表示方法、發(fā)現(xiàn)知識的維護和 再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。 然而發(fā)現(xiàn)企業(yè)數(shù)據(jù)背后隱藏的價值卻是擺在企業(yè)面前的一個挑戰(zhàn)。 1. 4.研究意義 本文只是利用 SAS 工具進行稅務數(shù)據(jù)分析的一個探索,課題選取了“走 逃 和“虛開 ,探索成功后,還可以以 SAS 工具為基礎做其他方面的縱深分析。 1. 5.論文的組織結(jié)構(gòu) 論文各章節(jié)的組織結(jié)構(gòu)如下: 4 1 引論 第一章引論。作為論文的核心部分,本章主要對本次數(shù)據(jù)挖掘 建模工 作的工作過程進行了詳細介紹,包括需求分析、系統(tǒng)架構(gòu)和程序流程等。本章作為 整篇論文的理論基礎,重點從以下幾個方面進行重點介紹。在稅務系統(tǒng)中,決策樹模型主要針對不熟悉數(shù)據(jù)挖掘技術的稅收業(yè) 務人員的,稅收業(yè)務人員利用決策樹的一系列規(guī)則來初步判斷納稅人員的增值 稅票票面額度、每月發(fā)放的增值稅票數(shù)、稅員流失的可能性以及潛在的納稅人 員,保證稅收政策的有效實施。在實際應用中,決策樹模型的效用衰減速度極快,不僅導致模型的 生命周期短,而且容易造成建模結(jié)果不穩(wěn)定。在稅務數(shù)據(jù)中,利用對企業(yè)經(jīng)營數(shù)據(jù)的時序分析,來預測企業(yè)未來 的經(jīng)營能力,對企業(yè)的經(jīng)營狀況進行預測,為制定合理的稅收政策提供依據(jù);
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1