almost 4 years ago

統計上一個很常見但常被亂詮釋的工具就是 信賴區間
而這個信賴區間會有一個信心(confidence)值
舉例來說 你會看到
台灣大學畢業生平均薪水的95%信賴區間是[19,000, 25,000]

信賴區間是一個區間估計的方法
是用一個區間來估計一個"參數"
可以把參數想成我們想要知道的東西 向上面那個例子裡
參數就是"台灣大學畢業生平均薪水"
當我們對一個信賴區間有越高的信心時
表示這個區間 理論上 越有可能涵蓋真實的參數

信賴區間的詮釋其實和直覺上有些不同 我們用上面的平均薪水當例子
許多人會用下面這個錯誤的詮釋
<錯誤的詮釋> 平均薪水有95%機率落在[19,000, 25,000]
為什麼說這是個錯誤?
一個關鍵原因是: 平均薪水是個"固定並且未知"的參數
在我們的觀點之下(稱為頻率學派Frequentist)就只是個值 沒有機率架構
所以 要嘛這個平均值就在[19,000, 25,000]之間
要嘛就不在這個區間裡

這就好比是我要你猜我目前的月薪
你不能說80%機率在2000-3000之間
因為我的月薪是一個"切確的值" 只是你不知道
2000-3000要嘛就是 要嘛就不是 毫無機率可言

那信賴區間的要怎麼詮釋呢?
<正確的詮釋> 這個根據資料建構出[19,000, 25,000]區間的"方法" 有95%的機率 會建構出涵蓋平均薪水的區間
正是因為這個機率詮釋是在擺"方法"之上 所以我們用"信心"而非 "機率"來作為95%對應的量

我們下面更詳細的解釋 信賴區間的意涵
"這套方法有95%的機率建構出涵蓋平均薪水的區間" 這句話該怎麼理解呢?
同樣用我們的例子來看
我們"固定"我們建立信賴區間的方法 然後去抽樣得到資料

假設你隨機抽樣 得到第一筆資料 然後建出第一個95%信賴區間
先把這信賴區間放著
我們再去隨機抽樣 得到第二筆資料 第二個95%信賴區間
重複如此的動作 但每次抽樣都彼此獨立並且都是隨機抽樣
假設我們重複上述動作10,000次 這樣我們會有10,000個信賴區間
現在我們來比較 每個信賴區間是否有包含實際的平均薪水
如果這套方法是有效的(valid)
那麼我們會得到大約9,500個信賴區間 有包含實際的平均薪水

所以 95%信賴區間的那個95%稱為信心 而不是機率
正是因為這個機率的詮釋是擺在方法之上 而非直接跟參數作比較

To學過量子物理的朋友
可以把信賴區間的95% 想成在量子實驗"觀測前"的機率
因為觀測前的狀態還是機率分配的 所以這個區間是否有涵蓋參數 是可以討論機率的

而收集資料的動作 就跟進行觀測是一樣的動作
會迫使機率分配degenerate到一個狀態
因此 根據資料建立出來的區間 已經沒有機率可言
所以要嘛這區間就包含了參數 要嘛就沒有包含

← 雜感: Machine Learning的成功 Tuning parameters雜感 →
 
comments powered by Disqus