over 3 years ago

統計學有個重要的議題-假設檢定(hypothesis test)
一種檢視假設檢定的方法 則是把它看成一種反證法的推廣版

假設檢定主要的設定如下:
我們有個假設A要去檢定是否合理(稱為 虛無假設-null hypotheis)
相對應的 當我們發現假設A不合理時 我們則接受相對應的假設B
(稱為 alternative hypothesis...中文我還真的不知道)

而我們如何認證合不合理? --透過資料
同時我們需要設定一個顯著水準(significance level)
什麼是顯著水準? 簡單來說 顯著水準就是我們對"合理性"的要求高低
顯著水準低 表示我們要有很強的證據(證據來自資料)說明虛無假設不合理
才能夠拒絕虛無假設

因為資料是一些數字 而我們想要的是證據的"強度"
把資料轉成證據強度的過程 就是建立一個檢定統計量(test statistics)
所以當我們得到一筆資料 就能計算檢定統計量
然後根據顯著水準 我們可以建構門檻值 當檢定統計量高於門檻值的時候
(檢定統計量大 可以看成證據強度很強)
我們就拒絕虛無假設

你可以看出 一個關鍵是建立"門檻值"
給定顯著水準後 如何建立門檻值呢?
我們透過 "假設在虛無假設為真的情況"
然後去計算在隨機之下 這個檢定統計量的分配情況
透過分配情況去選一個門檻值

這個 "假設虛無假設為真" 的行為 正是所謂反證法的論述模式
基本上 假設檢定就是一個在隨機分配下的反證法
我們想要拒絕虛無假設 所以我們先假設虛無假設為真
然後想辦法推出矛盾(這裡的矛盾 是相對於資料--矛盾就是跟資料不合)

顯著水準可以看成 我們想透過反證法
但因為隨機狀況下怎樣都有可能 因此我們需要一個矛盾的"度量"
當矛盾值(檢定統計量大小)夠大時 我們就能合理得拒絕虛無假設
而顯著水準正是這個矛盾的"度量"

基本上 非邏輯或數學的世界裡
很難真正的使用反證法
假設檢定可以看成一種把反證法推廣至機率模式裡
然後透過機率模式與現實世界的相似性
來作為科學推論的工具
這也是為什麼各個科學研究裡 資料分析總會比較"顯著性"的原因
背後的道理其實正是使用反證法的推廣

← 統計模型雜感 統計、橋牌與人生 →
 
comments powered by Disqus