about 4 years ago

Functional space(函數空間) 是一堆函數的集合
他到底有什麼功用呢?
舉例來說 你想要探討筆電電源線到插座之間 "整條電線的溫度的最大值"
這個最大值有兩個特性

  1. 它是隨機的 (主因是電流通過所產生的熱擾動造成)
  2. 這個值的變化幾乎是連續的 我們可以用一個隨機過程+函數空間來描述整條電線的溫度 電線上每個點 他的溫度是個隨機量 這個隨機量本身具有一個機率分配 e.g. 常態分配, 平均值20度C, 標準差0.01度C 溫度分配 本身就是一個函數 因此電線上每個點 背後都對應到一個函數 所以 整條電線的所有點的溫度函數 全部收集起來就是一個函數的集合 也就是一個functional space

然則 這整條電線有無限多個點
就算你知道每個點單獨來看是個很小的常態分配
無限多個點的最大值..可以是無限大!

這時該如何控制這個最大值的分配呢?
分析functional space有個方法 稱為covering number
假設我的電源線有100公分長
而我知道 電源線上兩個點如果相鄰2.5公分以內的溫度 不會超過0.1度C
那我可以每隔5公分選一個點 一共選出20個點
最大的溫度不會超過這20個點的最大值+0.1度C

所以 我們把原本要比較無限多個點的量
化簡為比較有限點(20個點)的量 加上一個上界0.1度C
這20個點會對應到20個隨機變數(他們是相關的 不過這沒關係)
20個隨機變數的最大值 就算是相關的
也可以控制它的分配

因此 我們就能計算這個原本無限多個點的取最大值得分配
也就是這個函數空間裡最大值的那個函數

統計上的函數空間非常非常的多 只是一般不會明講
舉例來說 迴歸分析本身就是在函數空間裡找尋
迴歸模型可以寫成Y=m(X)+e, e是誤差
m是一個連接Y和X關係的"函數"
所有可能的m所建立的集合 就是一個函數空間
常見的線性回歸 只是要求m(X)=a+bX
因此這個函數空間等價於a,b兩個"參數"所建構的"參數空間"
而我們各種方法在找的 就是找這個函數/參數空間裡 最符合我們答案的那個函數

密度估計也是在函數空間裡面找最符合的那個密度函數

分類分析(classification)裡頭 所有可能的classifiers
也建構出一個函數空間

所以 函數空間對於進階的統計分析是頗為重要的
有興趣者不妨多瞭解一些函數空間的性質

← 理論統計與生活 computer vision與image data雜感 →
 
comments powered by Disqus