almost 4 years ago

統計學有兩大類型
-敘述統計學(descriptive statistics)
-推論統計學(inferential statistics)
這兩類超級常被混用

敘述統計學"完全沒有"假設機率模型
因為敘述統計學關注的是 如何summarize資料
也就是用幾個簡單的數字 把資料的大致趨勢或分配作出統整

常見的方法就是 平均值 中位數 標準差...等等
成功率(e.g.大學錄取率)也是敘述統計學方法之一

推論統計學是建立在機率模型之上
用機率架構去詮釋資料分配的由來 並因此我們能夠對"未來的資料"進行"推論"
同時 因為有機率架構 我們也能對模型本身做推論 例如參數估計等等

敘述統計學和推論統計學常常被亂用
導致許多人覺得統計都在玩數字遊戲
舉例來說
高中最喜歡說他們今年台大錄取率高達XX%
然後拿出其他學校的比率作為比較 並結論自己學校比較好

這犯了一個關鍵錯誤 就是錄取率是來自敘述統計學的
這只總結了自己學校的大學錄取的成果之一
除非你做一些額外的機率模型假設 否則並不能夠結論出自己學校"比較好"
例如 學校錄取率高可能是因為減班制度 or 今年剛好老師猜題神準

敘述統計學完全不做推論 只純粹總結資料的特性
如果要進行推論(例如母體平均值高於某個量)
那必須要透過推論統計學 建立機率模型 才能進行推論

要做推論就一定要做假設 因此合格的統計學家都會很小心翼翼的跟你說
"在假設OOO之下 根據資料 我們得出XXX的結論"

← 對資料的新想法 理論統計與生活 →
 
comments powered by Disqus