Outline of the Course :
課程有三大類 theory (mathematical), technical (practical) and analysis (conceptual). 章節如下 :
The essence of machine learning :
要進行 machine learning 必須滿足的幾個要件 :
Components of learning :
Machine learning 可以拆解成以下幾個元件的組合 (Formalization) :
示意圖如下 :
A simple hypothesis set - The 'perceptron' :
這邊教授舉了一個最簡單的 ML Algorithm 'perceptron' 來講解 Hypothesis set. 而他的定義相當簡潔 :
(截自 wiki)
簡單來說, 他為每個 feature 定義一個 weighting, 而形成一個 weighting vector, 將 feature vector 與 該 weighting vector 相乘後得到的值如果大於零就是 class1, 反之為 class0. 而在使用這個演算法前有個重要的前提, 就是 data 必須要能夠 linearly separable!
簡單來說就是希望找出下列公式中粉紅色的 weighting vector, 將平面中的 '+' 與 '-' 能夠分隔開來進而達到分類的用意, 但遺憾的是現實世界的 data 多半不是 linearly separable :
Basic premise of learning :
如果 mapping 到 ML, observations -> data ; underlying process -> hypothesis (or the learned model). 另外這邊也將 ML 進行簡單分類 :
Q & A :
在課程最後, 教授還有 Q&A. 有幾個問題還蠻有深度的. 千萬別錯過 ^^. 如 "Data set" 的 size 要多少才能夠讓 ML 訓練出來較正確的 Model? 越多越好? 多半實務上 "Data set" 的 size 不是我們可以決定的 ^^".
Supplement :
* Machine Learning course - recorded at a live broadcast from Caltech
沒有留言:
張貼留言