about 3 years ago

統計算不算科學?
這是一個我們統計學家很常被問的問題
其實 這個問題跟數學算不算科學? 十足類似

在回答這個問題之前 我先講一下我認為的科學是什麼?
簡單來說 對我而言"科學是經過一套嚴謹的研究方法所獲得的知識(這套嚴謹的研究方法稱為科學方法)"

今天你走出家門發現太陽很大 就跟朋友說"臺北天氣很熱"(假設你住臺北)
這句話不能說是科學知識 即時這句話是真的
因為你的"臺北天氣很熱"這個結論 獲得的過程並非經過科學方法

科學還有個特性 就是永遠接受挑戰
並且在更多證據反對既有的結論時 會修正既有的結論

好 我們回到統計與科學的關係
在目前認定裡 邏輯, 統計, 數學, 理論電腦科學等等被歸類在"形式科學"(formal science)裡

什麼是形式科學?
我們一般談的科學 多指自然科學(知識的對象是自然界) 或社會科學(知識的對象是社會)
形式科學的對象是一個形式/符號系統(formal/sign system)
舉例來說 我們常用的一般數字(1,2,3,4...) 就是一個數字系統
從最原本的幾大公設(axiom)出發 然後定義基本結構與運算

比起其他科學
形式科學的推論更加嚴謹 因為在形式科學裡
所有操作與結構都源自於嚴謹的定義
因此推論是精確的 不會有任何模糊
舉例來說 在一般代數系統裡 A=2x+3y 當x=2, y=3時
我們得到結論 A=13
這個過程是嚴謹的邏輯運算 不會有任何模糊

形式科學裡面的知識 經常透過定理(theorem)來表示
每一個定理 都是某套系統裡面一個新的知識
例如 中央極限定理就告訴我們 在某些情況下
樣本平均數會出現常態的分配

形式科學對於一般科學界的意義重大
因為形式科學的結論是精確的
所以形式科學所建立的結構/模型 可以做明確的推論

一般科學界往往借助形式科學所構築的知識
跟實際上觀測到的現象作結合
經過實驗與驗證 來得出科學結論
並把這個結論透過形式科學的架構來表示

舉例來說 愛因斯坦的E=mc^2
這個公式很簡單 而背後的符號系統定義的非常完善
我們明確地知道 "="的意義 還有乘法 平方的意義
這套公式本身連結了三個物理量: 能量E, 質量m 還有光速c
透過代數符號系統 我們得到這三個物理量關聯性的知識

統計學家研究的是科學家在處理資料時常用的符號系統(機率模型)的知識
並且這些知識是透過形式科學的方法: 符號運算 去取得
沒有統計理論 科學家許多結論就不一定能夠下
我們講個t分配的例子

許多科學研究都會用到t分配
假設今天我們並不曉得t分配的性質(缺乏這個知識)
那麼 所有用到t檢定(t-test)的科學研究
結論通通必須重新審視
因為這些結論並不一定達到科學研究的要求(顯著水準)

不過 這幾年科學界對於實驗的態度也略有改變
特別是電腦模擬(simulation)

在過去 電腦模擬是否被視作科學研究方法一直都有爭議
但這幾年科學界大多接受電腦模擬作為科學研究方法之一
因此 知識的取得並不限於傳統的實驗 觀測 或著形式科學的運算
電腦模擬的結果 現在也可以被視為一種科學

這幾年有些統計方法的有效性是透過電腦模擬去驗整
(有效性就是一個知識)
這也被接受為科學的一員

所以 統計學家算不算科學家?
既然我們的方法滿足科學方法
並且對象又是形式/符號系統
我們自然是科學家的成員之一
或更精確地說 我們是形式科學家(formal scientist)

← 雜感: 統計的社會功用 JSM2014心得-Rise of the Machines →
 
comments powered by Disqus