2013年6月30日 星期日

實驗設計-11

上回提到 ,其實,還有一點小關卡需要再突破一下。

上面的式子講的是母體。
事實上我們進行實驗,隨機抽樣取得數據,我們怎能這麼大膽的說他代表各別水準母體的平均數呢?
所以,我們也只能透過現有收集到的數據資料進行推估。
這部份又是統計一個很重要應用,點估計、區間估計等。依據樣本資料你能多大膽地說母體就是多少。
可是,實驗設計強調的是處理誤差,用來評估你的實踐結果如何,可不可信。

回到主體。
我們對於各別水準也只能用現有的抽樣資料來進行評估。事實上,我們的數學式子只能這麼寫著。

是否還記得,透過誤差來進行相對性比較時,會發生抵消的問題。我們不是改用的平方差嗎?
我們稱之為變異數,是吧。

現在,只不過是改成有個水準下,各別進行了次的隨機抽樣數。用一個式子就把它表達出來。所以,不要開始被這些式子給嚇到了。

(3.1.2)
  

他的意思是說,當我對各水準母體變異數的估計值,其實就是等於各水準樣本變異數。

這別各水準樣本變異數的計算方式,他自己那個水準下,從第1個抽樣數據開始到第n 個,個別去做減去該水準之樣本平均數的平方,再累加起來。然後最後再除以n-1。n是代表我們總共抽了幾個,j是足標,代表目前是指到第幾個。

喔~又回到母體的問題。
整個實驗的誤差估計值,也就可以這樣子表示:
(3.1.4)


還是用資料來表示吧。延續使用上次盒鬚圖所用的資料。



樣本平均數的符號

樣本變異數的符號

    

再改個表達方式。也就是對各別水準母體的估計值。




整體變異數的估計值




另外還有個東西也要順便提一下,就是殘差。本篇一開始講的式子,稍微移動一下。


思考邏輯都一樣,這個是指母體。我們又只能透過樣本來進行估計。
(3.1.5)


這時候,回去看看(3.1.3)與(3.1.4),把它合併起來,並且用(3.1.5)取代,就可以得到下列式子。
(3.1.6)

這算是到目前為止最複雜的式子了。
下表就是加上殘差結果。


現在看到這一推數字,真的先不要太緊張或太在意。之前一直強調,我們是透過隨機抽樣的過程,以取得之樣本資料來推估我們無法一眼看透的母體。需要猜測的母體,可能隱含著某種函數特性,或許他真的是2x+1,只不過他不是老師出的題目,他會明明白白告訴你。而這些都是你遭遇的問題。因為你不是上帝,真的無法篤定說出他背後影藏的函數特性。
既然是猜測、是推估,就會衍生很多你說的對不對的問題,就會衍生出一堆來驗證你對不對的方法。
這些東西總得要有依據、要能計算。而樣本平均數、樣本變異數等,就是最基本的材料了。
由於是實驗的過程,你所關心的因素可能會產生相互影響,這又會觸發一些新的素材出來(目前這部份還沒討論)
後面數學式子會越來越多,越來越抽象。但也希望能一步一步抽絲剝繭。

沒有留言:

張貼留言