2013年6月29日 星期六

實驗設計-9

之前有提到所謂「單因子」。別想太複雜,他就是你關心的一個題目。
燈有亮沒亮(兩個水準、兩種處理別),對植物成長的影響。
紅燈、黃燈、藍燈(三個水準、三種處理別),對植物成長的影響。

所謂的實驗設計,就是依上述所設定的問題,到底夠不夠完整性、具不具封閉性。
若沒有,妳就得要事先說明自己實驗設計的限制性。要把前提條件講清楚。

燈有沒有亮,兩個水準,「有亮」、「沒亮」。那時間多長呢?受不受日照影響呢?也就是你實驗所設定的環境。如果有另外的因素造成妳的實驗結果不一致性,那你所蒐集的資料就沒有意義。既然沒有意義,就不用浪費時間去搞數學模式了。

假設,妳的實驗環境設計非常完善。在一個密閉無日照的環境中,一個有用燈,一個沒有用燈。有用燈,燈的型號、亮度等等資訊都得收集。
接著,妳的問題就會變成,那~~妳到底要收集什麼資料。
原始問題是要問對植物成長的影響性。好~是什麼植物,要量測什麼數據來當做「成長」的「同義」資料。莖的週長、葉子長度、新發芽葉子,根的長度等等。有感覺了嗎?植物成長是你問題,某某數字就是你的題目。因為,是題目、是數字才能夠計算,才能夠比較。

問題還是沒有解決,因為還不夠嚴謹。
之前提過,所有的量測都會有誤差。我們要努力降低這個誤差,讓我們所收集到的數據資料是真的非常貼近於事實。這樣子我們才有可能下結論,而且是一個可以說服別人的結果。

所以,妳必須多量幾次。如果你只分別各種一棵植物,那是不是要多量幾個地方。有沒有可能,莖只有一個,妳也只能量一次。那就有風險性了。
各別多重幾棵吧,嗯,也許就可以降低量測誤差吧。
可是,妳不能有燈照的種子,與沒有燈照的種子是來自不同的植物,來自不同的購買源,這樣子又產生新的誤差來源。
所謂的隨機抽樣就是要降低這樣子誤差,減少別人對你實驗數據的攻擊。

接著又有問題了,那到底要種幾棵呢?這又是另一個實驗設計的問題。因為受限於資源(時間、經費等)妳不可能把全世界的種子都拿來種,但是,又得確保數據資料足夠,而不會有偏差。
這回到統計的問題,這叫大數法則。理論上,只要我收集的資料夠多,那會產生的誤差,應該會呈現常態分配(像一個倒鐘),可是怎麼才叫做夠多呢?一般來說是需要30筆。
也就是說,妳有兩個水準的話,那建議起碼要各種15盆,這樣子可能會減少資料的偏差(Bias)。

等你妳先解決的這些「問題」的問題後,才能說,我收集到了一堆數據資料,然後應該要用什麼樣的「題目」來得出,我的論點「有照」與「沒照」對於植物的成長有顯著的影響。


先聊到這,因為,接著會進入數學領域中。若沒做好心理建設,我想會放棄的人比較多吧。

沒有留言:

張貼留言