寫到這邊,開始搞混了嗎?開始有點不知所措的嗎?
如果跟你說,再寫下去就是博士班資格考的內容時,你會不會打消學習意願了呢?
對我來說,知識比學歷重要。只可惜,台灣是一個重視學歷不重視知識的地方。
(往後會有更多數學,所以先補上這篇)
寫到這裡,只是統計的基本概念。往進階統計的方向寫下去,也有好多好多東西可以寫,機率就是一個很有趣的事情。再下去,數理統計、工程統計更是讓人一個頭兩個大。還可以朝品管的方向寫下去。還可以...。是的都可以。
而我,是因為看到最近又有什麼Big Data這個撈錢的術語。Data就是Data,沒有大小之分。若搞不清楚你收集資料的目的與意義,那也只是大垃圾與小垃圾之差別而已。
其實,真的沒有這麼難,而是你要知道你學這個要幹嘛?有很多在學校的老師都說數學不重要,不要學。我卻認為數學很重要,只可惜老師不會教。
而我,是學不是教。是從我自己學習的角度,來看這些「艱難」的學問。
還是回到原點,我們為什麼要學這些。
一切都是為了管理。
管理的目的是在控制異常。
所以,你才要去收集資料,看看他的誤差,然後「控制」這個誤差在你的理想範圍內。
所以,到目前為止,我們只有樣本數、樣本平均數、變異數、標準差、有中位數、四分位數等,這個期望用幾個數字,就能夠看出全貌。
說穿了,就是為了控制誤差。
因著誤差來源的因素不同,以及誤差所呈現的特殊樣式,所以後面才會搞出一堆有的沒有的數學模式。
之前提到過,為了讓「誤差減少誤差」所以,我們會「多抽樣幾個,並重複做幾次」。原則上每一次的抽樣都是獨立的行為。
這個模式就是單因子。我們只針對一個問題去抽取我們要的數據資料,利用「幾個」與「幾次」所得到的數據資料來推估母體,或者找出問題。
還有一種情境是「當這個配上那個會怎麼樣」這就是雙因子的問題。原則上每一次的抽樣,就得知道是在這個配上那個下所進行。這樣子的誤差就有可能會發生干擾。為了找出這個干擾,又有一堆的式子等著我們去學習,這類的應用甚至最後可以推估說,「這個配上那個根本沒有意義」,他們根本是獨立事件。
你想知道問題在哪裡嗎?你想透過資料找出問題在哪裡嗎?也許,你可以繼續看下去。
而我的目標,是希望這一段走完後,能慢慢走到機率論,再走到人工智慧的應用去。
沒有留言:
張貼留言