over 3 years ago

先談一個生活的小例子
今天假如小明白天要期中考 但他睡醒時只剩20分鐘就要考試了
教授是個很嚴格的人 只要開考就會把門關起來 不讓學生進去考
所以小明一定要趕在20分鐘內趕到學校

小明有兩種方式上學

  1. 走路上學
  2. 搭公車上學 但不巧的是 剛好小明家離學校不算太遠 走路大概要18分鐘 誤差(標準差)約是1分鐘 搭公車大概是16分鐘 誤差約是4分鐘(因為等公車)

如果是你 你會選擇搭公車還是走路呢?(假設抵達時間是常態分配)
在這個問題之下 風險最低的其實是走路上學 而不是搭公車上學

為什麼呢? 因為走路上學 只要你花費的時間不超過2倍誤差 ((20-18)/1 = 2倍誤差)
你就不會遲到
如果搭公車 雖然平均時間比較短
但因為誤差大 所以你花費的時間反而不能超過1倍誤差
在常態分配之下 走路上學遲到的機率約是2% (注意我們是用單尾--只考慮大於1倍標準差的機率)
相對的 搭公車反而有16%的機率遲到

然而 如果反過來
走路上學要22分鐘 誤差還是1分鐘
但搭公車上學要24分鐘 誤差是4分鐘
你就應該要選擇搭公車上學

因為當你走路的話 你必須賭自己能用比平均值還要少2倍標準差的時間趕到
這個機率只有2%
如果搭公車的話 雖然平均花費時間高
但你有較高的可能花很少的時間就抵達 這機率反而高達16%

影響這些的關鍵就是所謂的尾端機率(tail probability)
這種尾端機率主要關注的是那些偏離平均值的事件發生的機率
一般來說 尾端機率通常特別關注那種遠離好幾倍誤差的事件發生可能性

如同小明考試的那個例子一樣 許多時候平均值好的選擇 並不一定是風險最低的選擇
因此我們需要分析第二階的誤差大小

其實這在許多比賽裡也很常用
當隊伍是優勢時 就會選擇打安全一點的策略
因為這樣誤差小而平均值高(優勢)
當隊伍是劣勢時 通常就會選擇積極一些的策略
賭對方的失誤來反超

我相信在經濟學裡應該有專門的名詞討論這個現象
只是我不是專精這塊 所以不曉得

我在高中考大學時做了一系列的分析
當時我在分析 如果你的在校成績好 或 在校成績壞
對於申請學校的時候 上哪個科系的機率比較高

當時申請學校 除了學測成績還有在校成績外
許多科系還要去當場來個筆試
我在研究兩個科系P還有E

一般來說 科系P的錄取分數比科系E還要低一些
當時我發現科系P的考試比重高達70%
但科系E的考試比重僅30%
考試比重我認為是最大的誤差來源 因為考試當天你的表現很可能會突然失常之類的
相對的 在學成績已經固定了 沒什麼誤差可言

我那時就根據常態分配還有尾端計算
得出結論是:
如果本身實力強的學生 上科系E的機率高得多
本身實力不強的學生 反而上科系P的機率比較高

我還記得當時的我還算出一條 兩個標準差與兩個平均值的關係式
會讓兩邊機率相等

--
現在回想起來 那時做了如此精妙的機率模型 真是太神奇了
最有趣的是那時的我根本沒學過統計與機率
只有高中的弱弱基礎
現在看來 真覺得自己的確頗有這方面的潛力
後來跑來做統計 其實也不奇怪

← 沒label如何定誤差 統計學與大數據-推論vs預測 →
 
comments powered by Disqus