【文章內(nèi)容簡介】
)R for DummiesR in a Nutshell Michael J. Crawley 的The R Book (這本書的中文版年末或者明年年初上架,問我為什么知道?因為我和另外幾名戰(zhàn)友在翻譯這本書)MatlabMatlab據(jù)說在淘寶上可以買。在米國的話還要買正版,還好是學生價,99刀,雖然也不便宜,但是和非學生 價相比,我實在是謝天謝地。話說在國外的同學們,還是能用正版盡量用正版。我有認識人被抓住罰了2500大洋就是因為用學校網(wǎng)絡下載盜版windows。雖然非常少發(fā)生,但是一旦發(fā)生了的話,2500大洋在美國能買25套windows正版系統(tǒng)了。Matlab實在沒有什么好的書推薦,因為我只是在學習線性代數(shù)的時候使用Matlab。平時都是使用R。但是有一個手冊比較好。我當時學習matlab的時候就是靠它還有g(shù)oogle寫的作業(yè)。加上上面線性代數(shù)里面推薦的那本Matlab的書籍,應該夠用了。LaTex寫作業(yè)必備神器。大家不用專門買書的,其實google和LaTex網(wǎng)上的一些手冊就夠了。如果真的想系統(tǒng)學,Helmut和Patrick合著的Guide to LATEX還是不錯的。還有介紹個LaTex模板的網(wǎng)站,我感覺這個更常用些,我們的作業(yè)都是靠這個模板弄的。C: 統(tǒng)計學學習部分這部分開始真正意義上介紹和統(tǒng)計核心課程相關(guān)的學習內(nèi)容。和與數(shù)學部分不同,這部分中的學習完全可以和我在計算機編程部分中講的知識相互貫穿來學的。尤其是R語言的學習,對統(tǒng)計的了解和學習是及其有幫助的。這個是重中之重。其實數(shù)理統(tǒng)計本身并不是多難,稍微有一些數(shù)學微積分基礎(chǔ)的同學,掌握這部分內(nèi)容應該非??欤窍胝莆赵鷮嵅⑶异`活了,非常難。好比說統(tǒng)計學中最基礎(chǔ)的一個概念:平均數(shù)。不學統(tǒng)計的同學們也知道,平均數(shù)就是把所有的數(shù)據(jù)相加除以數(shù)目。但是學了數(shù)理統(tǒng)計的童鞋們,如果你們對平均數(shù)的概念就只是這樣,那你們真的應該好好翻翻書再復習下了。初中老師講平均數(shù)的時候,還講了中數(shù),除了這些還講了條形圖,扇形圖等各種各樣的圖。為什么要講這些?為什么要講平均數(shù)?其實在這個階段,就是為了教你如何直觀地觀察數(shù)據(jù),讓你對數(shù)據(jù)有個直觀的把握。后來我們學了variance,就發(fā)現(xiàn),原來描述數(shù)據(jù)的時候,mean不準確,我們要結(jié)合variance才能更準確地明白數(shù)據(jù)。之后又有結(jié)合參數(shù)來講mean。簡單的算術(shù)mean和為了衡量參數(shù)而衍生出來mean有著不同的意義。這個mean可以用maximum likelihood estimator求得,也可以用method of moments求出。不同的distribution有mean, random resampling中有mean,做regression analysis的時候要用mean,連做statistical inference的時候還是要用到mean。Mean真是無處不在。雖然說這些定義還算是基礎(chǔ),但是非常容易搞混,一旦搞混了,你接下來的很多東西都不能學了。每天積攢點糊涂了,幾個月下來就真的糊涂了。這里推薦大家一本書——Larsen 的Introductionto Mathematical Statistics and Its Applications (5th Edition),他還配套一本參考答案,不過這本答案只有課后題的奇數(shù)題目的答案,偶數(shù)題目的答案只有教師用書上有。如果不會的話,只能google。這本書算是我見過的所有的數(shù)理統(tǒng)計學書中最最簡單直白的了:Student Solutions Manualfor Introduction to Mathematical Statistics and Its Applications他前面一二章講的是非?;A(chǔ)的概率知識,然后徐循漸進到較難的部分。整本書將近千頁,但是對大家的數(shù)學水平并沒有很高的要求,只要微積分基礎(chǔ)還算是扎實,稍微知道點實分析中的分散和收斂就可以了。不過,這本書信息量也非常大,覆蓋的內(nèi)容也很廣。我學數(shù)理統(tǒng)計學的時候,就是用的這本,連續(xù)三個學季,也就是9個月才把這本書從第一頁學到了最后一頁。到了后來學習更難的課程的時候,還要經(jīng)常翻書來溫故而知新,也可見本書對日后的學習有多重要了。這里我給大家分享下我學習這本書的心得,希望對自學的童鞋們有些幫助:① 這本書最重要的是所有黑字的定義和公式。一定要把它們理解清楚了。包括大寫的X和小寫的x的具體定義,這些都要區(qū)分清楚。什么是value和random variable,什么是estimator和estimates。統(tǒng)計中這種看著一樣的概念很多,要區(qū)分;② 每道例題都要仔細弄懂,因為那些題目都非常有典型性。各種的經(jīng)驗和教訓不斷教育了LZ這些例題對日后學習有著非同尋常的意義;③ 如果有時間,大家可以試著做下課后練習,可以幫助你更好地理解概念。我覺得這些聯(lián)系不但要做,而且在沒有到最后關(guān)頭,不能看答案,最好能和人一起討論下,這點應該對在校統(tǒng)計專業(yè)的弟弟妹妹們的一 個基本要求;④ 如果很忙,非要給這本書分個層次的話,前12章是必學,最后兩章可以選學:a. 一章到四章是最基礎(chǔ)的部分:i. 其中一章到三章是基礎(chǔ)中的基礎(chǔ);ii. 第四章開始講分布。對于分布,大家應該了解的內(nèi)容,可以見我們組里面發(fā)起的那個活動上面的內(nèi)容,對于統(tǒng)計專業(yè)的童鞋,這些內(nèi)容都是要大家融化在血液中的;b. 第五章是在第四章的基礎(chǔ)上建立展開的,講estimation。通過這章,大家對分布中的estimator的性質(zhì)會有一個更立體的了解;c. 第六到第九章是講statisticalinference,這個是日后大家學統(tǒng)計學用到的最多的東西;d.