2013年6月30日 星期日

實驗設計-10

實驗結果模型

數學與統計到底是不是同一件事情。當然不是。就像數學與物理到底是不是同一件事情,是一樣的道理。

數學式子是這樣子表達:
這個式子是說,有一個函數,當我們投入x會得到y。但是,現在這個函數,還沒有告訴你,所以,你不知道要怎麼計算。
如果跟你說
當x=1時,y等於多少?這時候,你應該會說選我選我,因為你知道答案。而且,隨便給你x多少,你都可以回答。
x     y
=====
-2   -3
-1   -1
 0    0
 1    3
 2    5
其實,他是由已知x來取得y。
其實,他就是一條斜率為2,向右平移1的一條直線。
其實,只要有兩點,我們就可以畫出一直線了。

回到統計的觀念。
因為他可以代表所有可能的情形,所以,我們可以稱就是母體。

問題就是這個函數(母體)長什麼樣子我們不知道。他是一個黑盒子。(數學的式子是白盒子)
    
而統計式子是這樣表達:
這個就是誤差。而就是我們要透過樣本資料去推估的母體。
所以,y才是我們的已知,而函數(母體)長什麼樣子我們都不知道,你的x根本英雄無用武之地。
這下子,y不是我們算來的,而是我們在隨機抽樣的過程中,藉由實驗、量測等方式取得之數據。
可能我們收集到的資料就會變成:
   y
====
 -3.1
 -0.9
  0.1
  3.0
  4.7

你可以想像,就好像有一個圖片,當你zoom in(放大時),每個點的距離就可以看得很清楚;當你zoom out(縮小時),每個點的距離就會變小,甚至看起來像一直線。
是得,這就是你可以忍受的誤差範圍。我們的式子
就可以改寫成 

如果,我把每個 都設成0時,不就回到原始數學式子了。可惜,這個 在統計來說是必要之惡。

再拉回簡單的問題。還好,我們的 這個黑盒子,目前不是一條直線。而是向靶紙一樣,只是一中心點而已。
也就是~~~平均數。

這時候我們就開始改用統計的習慣用法吧。假設進行了次隨機抽樣所得之數據,每個觀察數據就可以用下列公式表達。
   
也就是每一個觀察值,就是平均數再加上他自己的誤差。

那如果是單因子分析,假設有個水準(處理別)
各別水準進行了次的隨機抽樣數。 那所有的數據資料就可以這樣式子表達:



現在,看到這樣子的式子應該不會心慌慌吧。

沒有留言:

張貼留言