【正文】
2月31日止,由于市場擾亂,WTO成員可以對來自中國的紡織品服裝實行配額限制 [4]。所謂配額,就是一個國家為保護自己的民族工業(yè)和經(jīng)濟安全而對有關(guān)的進出口貨物的數(shù)量進行限制的一種措施 [3]。與全國的情況類似,紡織行業(yè)一直是上海的傳統(tǒng)產(chǎn)業(yè),長期以來在全市的出口創(chuàng)匯中扮演著重要的角色。進入2022年后由于暫時沒有了配額數(shù)量的限制,110月的出口金額便已經(jīng)突破了,% [1]。通過對上述幾種不同挖掘方法的組合運用,解決了紡織品出口管理工作中的難題,使得管理者可以根據(jù)挖掘所得制定出有針對性的管理政策,引導(dǎo)紡織品出口企業(yè)在避免貿(mào)易摩擦的同時取得利潤最大化。作為世界上紡織品第一出口大國,如何積極地引導(dǎo)出口企業(yè)將有限的紡織品服裝配額資源用足用好,是主管部門面臨的一個緊迫的難題。為了實現(xiàn)從事后管理模式向事前預(yù)判的模式的轉(zhuǎn)變,就需要將紡織品配額商品出口管理工作與數(shù)據(jù)挖掘有機結(jié)合,幫助管理者透過歷年大量的配額商品出口數(shù)據(jù),挖掘出隱含的知識,為政策的制定者做出科學(xué)的決策提供有力的支持。關(guān)鍵詞:紡織品服裝;數(shù)據(jù)挖掘;配額管理;信息技術(shù)IV / 51ABSTRACTWith the rapid development of foreign trade recently, the friction between China and other nations on textile and garment exports, which used to be China’s traditional advantage, is getting more and more frequent. As a leading textile exporting country in the world, its concerned management is facing an urgent problem as how to actively guide the export enterprises to fully and efficiently use the limited quota. To successfully transfer from a postjudgment style to prejudgment style, the management on the textile quota should work together with the data mining to help the manager to discover the hidden rule and knowledge through the abundant export data in past years and provide the policymaker with the scientific decision and strong support.Based on the detail request of Shanghai Foreign Economic Relation and Trade Commission (SFERT) Plan and Administrate department on textile and garment exports, and aimed on the key work of raising the efficiency on quota, three measures of analysis are taken to discover the quota potential and objective. On quota resources, Association Analysis is introduced to seek the relations among the special quota, quota and nonquota goods。我國的紡織品服裝不僅出口金額增幅驚人,而且出口金額在各大宗出口商品中的占比也相當(dāng)高。伴隨著將上海建設(shè)成為國際經(jīng)濟、金融、貿(mào)易、航運中心這一全新的城市定位,上海作為“ 長三角” 地區(qū)外貿(mào)出口橋頭堡的輻射作用日益顯現(xiàn),紡織品服裝的出口又煥發(fā)了青春,為本市近幾年外貿(mào)出口連續(xù)實現(xiàn)跳躍式地發(fā)展做出了相當(dāng)重要的貢獻。紡織品服裝配額屬于配額的一種,是由貿(mào)易的對象國為保護該國的經(jīng)濟利益,防止我國的紡織服裝類商品過多沖擊該國的市場而對我國該類產(chǎn)品的出口數(shù)量進行限制的一種措施。在2022年1月1日起取消了對我國所有的紡織品配額限制后,輸往美國、歐盟等主要傳統(tǒng)目標市場的紡織品出口出現(xiàn)了反彈式的激增,美國、歐盟正是根據(jù)了242特保條款對我國頻繁地展開反傾銷調(diào)查,給雙邊紡織品貿(mào)易帶來了極大的不穩(wěn)定性,影響了貿(mào)易的正2 / 51常、有序發(fā)展。配額分配是整個紡織品外貿(mào)出口管理工作的核心內(nèi)容之一。近年來,為了提高配額的使用率,尤其是引導(dǎo)企業(yè)提高出口產(chǎn)品的附加值,商務(wù)部又對緊俏的配額類別實行了招標分配的方式,即將這些類別數(shù)量的30%在全國范圍內(nèi)實施公開招標,由出價高的競標企業(yè)獲得這些熱點配額數(shù)量的使用權(quán) [7]。為了幫助本地區(qū)的企業(yè)在競標過程中能夠以盡可能低的中標成本獲取盡可能多的數(shù)量的配額資源,外貿(mào)出口主管部門每次招標之前都要召開招標動員暨投標信息會議,向企業(yè)發(fā)布有關(guān)配額類別的行情信息,分析價格走勢,引導(dǎo)、協(xié)調(diào)企業(yè)開展招標工作。3 / 51 目前的紡織品服裝出口管理存在的問題上節(jié)介紹了紡織品服裝配額的管理主要工作,本節(jié)將針對這些工作分析其中存在的問題與不足。為了打破這種配額分配終身制的弊端,建立獎優(yōu)罰劣、優(yōu)勝劣汰的競爭機制,給予有真正經(jīng)營實力的企業(yè),尤其是那些中小外貿(mào)企業(yè)、民營私營外貿(mào)企業(yè)平等獲得配額資源的機會,近年已經(jīng)陸續(xù)對21個緊俏的配額類別實行了有償?shù)恼袠?,用市場的手段來?yōu)化配置配額資源,提高配額使用率。即便是對部分已經(jīng)采取了招標分配的類別,在管理中也由于缺乏有效的數(shù)據(jù)分析,在招標類別的選取、配額招標資格的遴選、投標參考價格的制定等方面也存在著不少的問題。要想直接在此基礎(chǔ)上動態(tài)地跟蹤出口清關(guān)數(shù)據(jù),甚至是對出口動向提前進行預(yù)判是非常困難的。管理部門原來采取的粗放管理模式,已不適應(yīng)發(fā)展需要。這些方面的共同特點是都已經(jīng)積累了相當(dāng)數(shù)量的數(shù)據(jù),但是卻沒有對數(shù)據(jù)進行深入的挖掘分析,使得大量有用的信息還停留在數(shù)據(jù)的層面上,并沒有在外貿(mào)主管部門的政策制定中起到應(yīng)用的作用。在挖掘配額用戶特點方面,則采用聚類分析挖掘技術(shù),橫向比較各個外貿(mào)公司在出口規(guī)模、出口單價、配額使用率等方面指標,縱向研究不同類型外貿(mào)公司對不同配額的依賴程度,將全市各類外貿(mào)企業(yè)的出口特點多角度、全方位的呈現(xiàn)在主管部門面前,通過向政策的制定者提供這種全新的“多維立體”的出口數(shù)據(jù),推進外貿(mào)管理工作決策的科學(xué)化,確保合適的配額最終能夠分配到合適的企業(yè)手中。具體來說,本文各章節(jié)安排如下: 本章從分析本市紡織品配額管理工作的現(xiàn)狀入手,分析了在配額分配、招標配額分析、許可證數(shù)據(jù)分析等方面的目前管理方式的不足,簡單介紹了本文的現(xiàn)實意義。最后一章在第三章應(yīng)用的基礎(chǔ)上,總結(jié)歸納了數(shù)據(jù)挖掘在紡織品配額管理工作中應(yīng)用的特點,同時搜集了采取新的管理政策實施后的具體成效以及外貿(mào)公司的反饋意見,最后對目前解決方案中的不足之處進行了分析,并對未來進一步展開數(shù)據(jù)挖掘的應(yīng)用方向進行了展望。這些知識是隱含的、事先未知的有用信息,提取的知識表現(xiàn)為概念、規(guī)則、模式、規(guī)律等形式,以幫助管理者作出正確的決策 [10]。與之形成鮮明對比的是,國內(nèi)在這方面的研究起步比較晚,早期研究的方向多集中于關(guān)聯(lián)規(guī)則的挖掘,近來關(guān)于時序模式、分類、聚類、WEB 數(shù)據(jù)挖掘等的研究也日益受到重視,并取得了不少可喜的成果,一些原型系統(tǒng)或數(shù)據(jù)挖掘工具已經(jīng)研制成功并在不斷完善中。預(yù)測模型所謂預(yù)測即從數(shù)據(jù)庫或數(shù)據(jù)倉庫中已知的數(shù)據(jù)推測未知的數(shù)據(jù)或?qū)ο蠹心承傩缘闹捣植?。在關(guān)聯(lián)規(guī)則挖掘算法中,通常給出了置信度和支持度兩個概念,對于置信度和支持度均大于給定閾值的規(guī)則稱為強規(guī)則,而關(guān)聯(lián)分析主要就是對強規(guī)則的挖掘。聚類分析所謂聚類(Clustering)是指一組彼此間非常“相似”的數(shù)據(jù)對象的集合。好的聚類方法可以產(chǎn)生高質(zhì)量的聚類,保證每一聚類內(nèi)部的相似性很高,而各聚類之間的相似性很低。序列模式可以看成是一種特定的關(guān)聯(lián)模型,它在關(guān)聯(lián)模型中增加了時間屬性。Web 數(shù)據(jù)挖掘萬維網(wǎng)是一個巨大的、分布廣泛的和全球性的信息服務(wù)中心,其中包含了豐富的超鏈接信息,為數(shù)據(jù)挖掘提供了豐富的資源。 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法關(guān)聯(lián)規(guī)則挖掘近幾年研究較多。項目之間的相關(guān)性用關(guān)聯(lián)規(guī)則來描述,關(guān)聯(lián)規(guī)則反映了一組數(shù)據(jù)項之間的密切程度或關(guān)系。關(guān)聯(lián)規(guī)則是形如 X =〉Y 的蘊含式,其中 X 真包含在 I 中,Y 真包含在 I 中,且 X 與Y 沒有非空交集,X 稱為規(guī)則的條件,Y 稱為規(guī)則的結(jié)果。即:support(X =Y) ≥ min_supconfidence(X =Y) ≥ min_conf 的關(guān)聯(lián)規(guī)則稱為強規(guī)則;否則稱為弱規(guī)則。因此,可以把關(guān)聯(lián)規(guī)則挖掘劃分為以下兩個子問題:核心問題:根據(jù)最小支持度找出事務(wù)集 D 中的所有頻繁項集;較易解決的問題:根據(jù)頻繁項集和最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則。例如,由購物籃分析得出的關(guān)聯(lián)規(guī)則。多層的關(guān)聯(lián)規(guī)則指得是變量涉及不同抽象層次的項或?qū)傩?。給出了關(guān)聯(lián)規(guī)則的分類之后,接下來就可以考慮某個具體的關(guān)聯(lián)規(guī)則挖掘算法適用于哪一類規(guī)則的挖掘,某類關(guān)聯(lián)規(guī)則又可以用哪些不同的方法進行處理。包含項集的事務(wù)數(shù)稱為項集的出現(xiàn)頻率,簡稱為項集的頻率或支持度計數(shù)??梢詮?1 到 k 遞歸查找 k頻繁項集。Apriori算法是一種最有影響的挖掘布爾型關(guān)聯(lián)規(guī)則頻繁項集的算法。如果將項 A 添加到 I, 則結(jié)果項集(即 I∪A)不可能比 I更頻繁出現(xiàn)。它使用一種稱作逐層搜索的迭代算法,k項集用于探索(k+1)項集。設(shè) l1 和 l2 是 Lk1 中的項集,記號 li [j]表示 li 的第 j 項。掃描數(shù)據(jù)庫,確定 Ck 中每個候選的計數(shù),從而確定 Lk。在實際運用中有一點需要注意, 那就是 Apriori 的候選產(chǎn)生檢查方法大幅度壓縮了候選項集的大小,并導(dǎo)致很好的性能。其次,它可能需要重復(fù)的掃描數(shù)據(jù)庫,通過模式匹配檢查一個很大的候選集合。距離是經(jīng)常采用的度量方式。由于這個原因,聚類是觀察式學(xué)習(xí),而不是示例式學(xué)習(xí)。12 / 51商業(yè)幫助市場分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且用不同的購買模式描述不同客戶群的特征。作為其他數(shù)據(jù)挖掘算法的預(yù)處理即先進行聚類,然后再進行分類等其他的數(shù)據(jù)挖掘?;?Kmeans(K平均值) 、Kmedoids(K中心點)和其他一些方法的聚類分析工具已經(jīng)被加入到許多統(tǒng)計分析包或系統(tǒng)中。算法的選擇取決于數(shù)據(jù)的類型、聚類的目的和應(yīng)用。劃分方法(partitioning method)的基本思想是對于給定一個 n 個對象或元組的數(shù)據(jù)庫,用一個劃分方法構(gòu)建數(shù)據(jù)的 k 個劃分,每個劃分表示一個聚簇,并且 kn。在該算法當(dāng)中,每個簇用該簇中對象的平均值來表示。相似度的計算根據(jù)一個簇中對象的平均值來進行。這個過程要不斷的重復(fù),直到準則函數(shù)收斂。當(dāng)結(jié)果簇是密集的,而簇與簇之間區(qū)別明顯時,它的效果較好。算法:K平均。與之相對的,序列數(shù)據(jù)庫則是由有序事件的序列組成的數(shù)據(jù)庫,它可以有時間標記,也可以沒有時間標記(如 Web 頁面訪問序列) 。時序數(shù)據(jù)的周期分析:對周期模式的挖掘(即在時序數(shù)據(jù)庫中找出重復(fù)出現(xiàn)的模式) 。(2)循環(huán)變化循環(huán)變化(Cyclic movement)指的是趨勢線呈現(xiàn)擺動跡象,它可以是周期性的也可以不是周期性的,即在等時間間隔之間循環(huán)不一定按照相同的模式演進。具體的趨勢分析工具中最具有代表性的就是加權(quán)移動平均方法,該方法描述如下。使用加權(quán)移動平均時給中間的數(shù)據(jù)賦予較大的權(quán)重,從而可降低其負面影響。相似搜索可應(yīng)用于金融市場分析(如股票數(shù)據(jù)分析) 、醫(yī)療診斷分析(如心電圖分析) 、工程數(shù)據(jù)分析(如能耗分析)等。數(shù)據(jù)經(jīng)過變換(如 DFT)后,可用前幾個付里葉系數(shù)建立一個多維索引。以發(fā)現(xiàn)諸如季節(jié)、潮汐、行星軌道、每日能源消耗、每日交通流量等的周期性規(guī)律。周期模式挖掘的常用的方法有全周期分析(FFT)與部分周期分析和周期關(guān)聯(lián)規(guī)則挖掘,其中后者就是改進的 Apriori 算法,其內(nèi)容實質(zhì)上就是帶約束挖掘的 Apriori 算法,即 Apriori 算法加上約束條件 [19]。 紡配管理工作需求分析目前外經(jīng)貿(mào)委計劃與貿(mào)管處對紡織品服裝出口的管理工作主要包含如下內(nèi)容:配額的分配,包括按照出口基數(shù)的無償分配與對熱點配額的有償招標分配;協(xié)調(diào)組織紡織品配額招標;各種出口許可證的簽證核發(fā);歐盟紡織品原產(chǎn)地證書的申領(lǐng)與簽發(fā);清關(guān)數(shù)據(jù)的核對;提供紡織品服裝商品出口海關(guān)數(shù)據(jù)查詢等等。由于系統(tǒng)最早開發(fā)于 1997 年,后來盡管歷經(jīng)了多次版本升級,但是考慮到全國各個省、自治區(qū)、直轄市、建設(shè)兵團等簽證主管機關(guān)的技術(shù)裝備及維護能力的具體實際,所以在各地外貿(mào)主管行政機關(guān)的終端系統(tǒng)還是采用了微軟的 Visual Foxpro 工具進行開發(fā),以便各地機關(guān)可以完成日常的系統(tǒng)維護。這兩個模塊在系統(tǒng)中的明細功能架構(gòu)如圖 所示,系統(tǒng)中其他的模塊由于與本文關(guān)系不大,這里就不具體介紹了。紡織品配額電子招標系統(tǒng)該系統(tǒng)是商務(wù)部 EDI 中心開發(fā)的用于對熱點配額進行公開招標的應(yīng)用程序,完整的系統(tǒng)包括兩套程序,即公開招標電子投標程序( 版)與中標企業(yè)網(wǎng)上電子付款程序( 版) ,分別用于企業(yè)的投標與中標后支付中標保