分類: Uncategorized

Clustering and Segmentation 分群和分割

今天學習的主題跟機器學習有關,以下是簡單的筆記,初次理解可能有誤或過於粗淺,歡迎提出有問題的地方。

機器學習有兩種方法:

  1. supervised learning:監督式學習
  2. unsupervised learning:非監督式學習

首先是監督式學習:

假設我們給電腦一百張人臉照,同時也給它照片上的人臉是誰,而當我們在Test的時候,給電腦一張圖片,電腦能夠分辨出是否是人臉照以及這張人臉照是誰。

對比非監督式學習:

我們一樣給電腦一百張人臉,但是不給電腦任何標籤,由電腦自動去分群,並希望我們Test的時候也會得到跟上述一樣的結果。

Dimensionality Reduction

一張30*30px的圖,該維度就是900維,我們使用演算法(例如:PCA)來降維,將較多的變數縮減成較少的變數,但也能保留原data大部分資訊,降維後的資料,我們就可以將其表現在二維圖表上,進行後續的分析、分群等等,但有個缺點:只能分析原本的data,如果我們丟新data進去,電腦只會告訴我們大概會在這個圖表的哪個位置。

Generative Models 生成模型

我們給電腦一堆臥室的圖片,並且給電腦一組亂數,電腦就會依據我們給的亂數去排列我們給我臥室圖,而這個臥室的圖片每一張只改變一組亂數,所以會呈現出連續性。

room

[Radford, Metz and Chintala, 2016]

Segmentation 分割

一樣以圖形辨識舉例,我們有一張圖片,電腦有多種分割開圖片成元件的方法,可能是用人、樹、路分割開來,或者是人身、人頭、人腳等等,至於是否符合我們需要,則端看情境,而且電腦在元件的label上有時候會跟現實認知不同,例如人被label成車子之類的。