【正文】
) = (2 + 1) * (3 + 1) * (3 + 1) = 48,CUBE,SELECT SUM(units_sold), model, theyear, color FROM my_cube GROUP BY model, theyear, color WITH CUBE,SELECT 39。 GROUP BY Model, Year, Color UNION SELECT Model, Year, ALL, SUM(Sales) FROM Sales WHERE Model = 39。數(shù)據(jù)分析技術(shù),戰(zhàn)略信息,企業(yè)目標(biāo) 在5年內(nèi)增加15%的客戶 在3年內(nèi)搶占15%的市場(chǎng) 在2年內(nèi)投放3種新產(chǎn)品 提高前5%的產(chǎn)品質(zhì)量 在東北市場(chǎng)提高15%的銷售額 所需信息 全面深入地了解公司運(yùn)營(yíng) 了解關(guān)鍵因素及其相互作用 檢測(cè)這些因素如何隨時(shí)間變化 將公司運(yùn)營(yíng)狀況和對(duì)手以及行業(yè)標(biāo)準(zhǔn)做比較,戰(zhàn)略信息系統(tǒng),SIS:Strategic Information Systems 能夠支援和改變組織戰(zhàn)略行為,使得組織具有競(jìng)爭(zhēng)力的信息系統(tǒng),決策支持系統(tǒng),正確決策—— 企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),錯(cuò)、錯(cuò)、錯(cuò) 在錯(cuò)誤的時(shí)間、錯(cuò)誤的地點(diǎn)、同錯(cuò)誤的對(duì)手打了一場(chǎng)錯(cuò)誤的戰(zhàn)爭(zhēng),噬臍何及,合九州六十四縣鐵, 不能鑄成此大錯(cuò)也,蒼天如圓蓋 大地如棋局 世間分楚漢 榮辱爭(zhēng)天下,博弈,博弈,博弈,博弈,納什均衡 一個(gè)博弈可能有多個(gè)納什均衡 每個(gè)參與者把其他參與人的策略當(dāng)作是給定的 允許了不可置信的威脅的存在,博弈,博弈,博弈,博弈,阿里巴巴:芝麻開門,哪些客戶對(duì)我們最有利?如何拓展與他們的聯(lián)系? 哪些客戶給我們提供利潤(rùn)?哪些客戶使我們?cè)馐軗p失? 根據(jù)他們經(jīng)常光顧的商店,最好的客戶居住在哪里? 哪些產(chǎn)品和服務(wù)能被最有效的進(jìn)行交叉銷售,銷售對(duì)象是誰? 哪些市場(chǎng)營(yíng)銷案例是最成功的?為什么? 哪些銷售渠道對(duì)于哪些產(chǎn)品是最有效的? 如何才能改善我們用戶的總體經(jīng)歷?,We are drowning in data but starved of information,商務(wù)智能,商務(wù)智能的需求 有巨量的商業(yè)數(shù)據(jù) 日常數(shù)據(jù):訂單、存貨、帳單、 外部數(shù)據(jù):客戶信息、對(duì)手信息、政策 每2到3年商業(yè)數(shù)據(jù)變會(huì)翻番 有93%的數(shù)據(jù)沒有在決策過程中使用到! 商務(wù)智能的目的 使人能更快捷、更容易地做出更好的商業(yè)決策 終極目標(biāo) 3wwin, win, win,商務(wù)智能,Business Intelligence is a process of turning data into knowledge and knowledge into action for business gain,Business Intelligence is the process of transforming data into information … and through iterative discovery transforming information into knowledge,elevate,從數(shù)據(jù)到知識(shí),垂拱而治,CEO:統(tǒng)計(jì)一下購(gòu)買我們的產(chǎn)品及競(jìng)爭(zhēng)對(duì)手產(chǎn)品的用戶信息 計(jì)算機(jī):,垂拱而治,CEO:怎樣會(huì)使得用戶購(gòu)買我們的產(chǎn)品? 計(jì)算機(jī):刺激銷售(如中獎(jiǎng)銷售、打折優(yōu)惠)會(huì)吸引他們購(gòu)物 CEO:促銷的成本是多少?促銷的最佳時(shí)機(jī)是什么時(shí)候?它會(huì)吸引多少新用戶? 計(jì)算機(jī):……,“三拍”而治,管理活動(dòng)的層次結(jié)構(gòu),管理活動(dòng)各層次中信息的特征,不同層次的信息處理需求,事務(wù)處理需求 不同的事務(wù)處理子系統(tǒng) 采購(gòu)子系統(tǒng):訂單、訂單細(xì)則、供應(yīng)商 銷售子系統(tǒng):顧客、銷售 庫(kù)存子系統(tǒng):出庫(kù)領(lǐng)料單、進(jìn)料入庫(kù)單、庫(kù)存臺(tái)帳 人事子系統(tǒng):?jiǎn)T工、部門 各種事務(wù)處理需求 一筆訂購(gòu)、一筆銷售、一次進(jìn)料、一次出料 要求 強(qiáng)調(diào)多用戶并發(fā)環(huán)境,數(shù)據(jù)的一致性、完整性,不同層次的信息處理需求,分析處理需求 今年銷售量下降的因素(時(shí)間、地區(qū)、商品、銷售部門) 某種商品今年的銷售情況與以往相比,有怎樣的變化?每年的第一季度商品銷售在各類商品上的分布情況怎樣? 要求 多個(gè)子系統(tǒng)中的數(shù)據(jù)(數(shù)據(jù)集成) 歷史數(shù)據(jù) 匯總、綜合的數(shù)據(jù),DSS早期演化階段,1960,1965,1970,1975,1980,主文件 報(bào)表,太多主文件,數(shù)據(jù)庫(kù)所有處理的單一數(shù)據(jù)源,聯(lián)機(jī)高性能事務(wù)處理,單一數(shù)據(jù)庫(kù)既用于事務(wù)處理,又用于DSS,DSS早期演化階段,抽取程序 搜索整個(gè)文件和數(shù)據(jù)庫(kù),使用某些標(biāo)準(zhǔn)選取合乎限制的數(shù)據(jù),并把數(shù)據(jù)傳到其他文件或數(shù)據(jù)庫(kù)中 優(yōu)點(diǎn) 將數(shù)據(jù)從事務(wù)處理應(yīng)用中轉(zhuǎn)移出來,在進(jìn)行數(shù)據(jù)分析時(shí)不會(huì)與事務(wù)處理發(fā)生沖突 當(dāng)將數(shù)據(jù)從事務(wù)處理應(yīng)用中抽取出來之后,數(shù)據(jù)的控制方式發(fā)生了轉(zhuǎn)變,最終用戶可以擁有抽取出來的數(shù)據(jù),抽取程序,DSS早期演化階段,蜘蛛網(wǎng),數(shù)據(jù)缺乏可信性 生產(chǎn)率低,從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù),事務(wù)處理與分析處理的性能特性不同 事務(wù)處理環(huán)境 數(shù)據(jù)存取操作頻率高 每次操作處理的時(shí)間短 占用系統(tǒng)資源少 系統(tǒng)可以允許多個(gè)用戶按分時(shí)方式使用資源,保持較短的響應(yīng)時(shí)間 分析處理環(huán)境 運(yùn)行時(shí)間長(zhǎng) 消耗大量系統(tǒng)資源 事務(wù)與分析應(yīng)用不宜放在同一中環(huán)境中,從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集成問題 事務(wù)處理 目的是使業(yè)務(wù)自動(dòng)化 只關(guān)注與本部門業(yè)務(wù)相關(guān)的當(dāng)前數(shù)據(jù) 事務(wù)處理應(yīng)用的分散:企業(yè)內(nèi)部各事務(wù)處理應(yīng)用間相互獨(dú)立 DSS需要集成的數(shù)據(jù) (內(nèi)部各部門數(shù)據(jù)、外部數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)) DSS需要對(duì)分散在各個(gè)事務(wù)處理應(yīng)用中的相關(guān)數(shù)據(jù)進(jìn)行集成,以向分析人員提供統(tǒng)一的數(shù)據(jù)視圖,數(shù)據(jù)倉(cāng)庫(kù)的定義,數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的(Subject Oriented),集成的(Integrated),相對(duì)穩(wěn)定的(Nonvolatile),反映歷史變化的(time Variant)數(shù)據(jù)集合。Chevy39。Chevy39。ALL Models39。ALL Colors39。) END, CASE WHEN (GROUPING(theyear)=1) THEN ’ALL’ ELSE ISNULL(theyear, 39。) END FROM my_cube GROUP BY model, theyear, color WITH CUBE,ROLLUP,SELECT ’unit_sold’ = SUM(units_sold), ’model’=CASE WHEN (GROUPING(model)=1) THEN ’ALL’ ELSE ISNULL(model, 39。) END, ’color’= CASE WHEN (GROUPING(color)=1) THEN ’ALL’ ELSE ISNULL(color, 39。這樣一來,上述幾種商品的銷量幾乎馬上成倍增長(zhǎng)。 ⑶if attribute_list為空 then 返回N作為葉節(jié)點(diǎn),標(biāo)記為samples中最普通的類。 ⑺設(shè)si是samples中test_attribute=ai的樣本的集合。對(duì)一個(gè)給定的樣本分類所需的期望信息為: 其中pi = si/s,利用決策樹進(jìn)行數(shù)據(jù)分類:ID3,設(shè)屬性A有v個(gè)不同值(a1, a2, … av)。 不同的聚類分析工具可以定義不同的規(guī)則集,從而相同的記錄集合可能有不同的劃分 應(yīng)用 市場(chǎng)或客戶分割、模式識(shí)別、基因分類、Web文檔分類等,聚類算法:KMeans,算法:k平均 輸入:簇的數(shù)目 k, 包含n個(gè)對(duì)象的數(shù)據(jù)庫(kù) 輸出:k個(gè)簇,使平方誤差最小 步驟: 任意選擇k個(gè)對(duì)象作為初始的簇中心 Repeat 根據(jù)簇中對(duì)象的平均值,將每個(gè)對(duì)象賦給最類似的簇 更新簇的平均值,即計(jì)算每個(gè)簇中對(duì)象的平均值 Until平方誤差小于某個(gè)閾值或不再發(fā)生變化 平方方差函數(shù): KMeans算法對(duì)噪音數(shù)據(jù)敏感,聚類算法:KMeans,格言,戴手套的貓逮不著老鼠 倒塌的燈塔比暗礁更危險(xiǎn) 戴手套的貓逮不著老鼠 對(duì)青少年火一樣的激情,歲月是最好的滅火器 不擲色子,就永遠(yuǎn)別想得到六點(diǎn) 統(tǒng)計(jì)數(shù)字就像超短裙,掩蓋起來的部分才是關(guān)鍵 老鼠夾上總會(huì)有免費(fèi)