K nn是什麼意思

"K NN" 通常指的是 "K-Nearest Neighbors",其中 "K" 是一個數值,代表在分類或回歸任務中使用的最近鄰的數量,而 "Nearest Neighbors" 指的是在特徵空間中與某個點(即待分類點或測試點)距離最近的點。

在機器學習中,K-Nearest Neighbors 是一種監督學習算法,用於分類和回歸任務。該算法的基本思想是:在特徵空間中,如果一個樣本附近的K個最近(即最鄰近)樣本的大多數屬於某一個類別,則該樣本也屬於這個類別,這類似於現實生活中少數服從多數的思想。

在分類任務中,K-NN 算法通過測量待分類樣本與所有訓練樣本之間的距離來確定最鄰近的K個樣本,然後根據這K個最近鄰的類別,通過多數表決等方式來決定待分類樣本的類別。在回歸任務中,則是通過平均K個最近鄰的屬性值來預測待預測樣本的屬性值。

K-NN 算法的優點是簡單易懂,易於實現,而且對異常值不敏感。但是,它的缺點是對特徵空間中的數據量大小比較敏感,因為需要計算所有樣本的最近鄰,所以在大數據集上效率較低。此外,K-NN 算法在訓練過程中存儲了所有的訓練樣本,因此它的記憶體開銷也較大。