題:
K均值和K最近的鄰居之間的主要區別是什麼?
nsc010
2013-04-18 22:15:44 UTC
view on stackexchange narkive permalink

我知道k-means是無監督的,用於聚類等,而k-NN是有監督的。但是我想知道兩者之間的具體區別嗎?

簡潔的比較:http://baoqiang.org/?p=579
五 答案:
Bitwise
2013-04-18 22:32:06 UTC
view on stackexchange narkive permalink

這些是完全不同的方法。它們名稱中都帶有字母K的事實是一個巧合。

K-均值是一種聚類算法,試圖將一組點劃分為K個集合(簇),以使每個群集中的點趨於彼此靠近。它是無監督的,因為這些點沒有外部分類。

K最近鄰是一種分類(或回歸)算法,為了確定點的分類,將K個最近點的分類。之所以受到監督,是因為您試圖基於已知的其他點分類來對點進行分類。

我認為比這傢伙給予的讚譽更多。他們都使用距離方法分別對輸入進行聚類和分類。這通常是為什麼將它們一起教的原因,以及為什麼要討論與它們有關的尺寸問題。各種距離方法都可以應用於兩者。實際上有很多相似之處。
當然,@eljusticiero67用於對輸入進行分類,這在OP中有所提及。而且大多數經典的學習方法都是基於距離的,因此這也不足為奇。請注意,OP對這些差異感興趣。我也理解,好像OP暗示由於兩個名稱中的K可能存在相似性。
BartoszKP
2014-04-10 17:09:51 UTC
view on stackexchange narkive permalink

答案中的按位指出,k-means是一種聚類算法。如果涉及k最近鄰(k-NN),則該術語有點模糊:

  • 在分類的上下文中,它是一種分類算法,如前面提到的答案

  • 通常是一個問題,為此存在各種解決方案(算法)

因此,在第一種情況下,說“ k-NN分類器”實際上可以表示解決k-NN問題的各種底層具體算法,並且將其結果解釋為分類目的。

這些是兩種不同的事物,但您可能會發現k均值算法是解決k NN問題的各種可能方法之一(Marius Muja和David G. Lowe,“具有自動算法配置的快速近似最近鄰居”,在國際計算機視覺理論與應用會議(VISAPP'09),2009年 PDF

Anton Andreev
2018-01-11 15:57:30 UTC
view on stackexchange narkive permalink

您可以有一個監督的k均值。您可以根據標記的數據構建質心(如k均值)。沒有什麼可以阻止你。如果您想改善這一點,歐幾里德空間和歐幾里德距離可能無法為您提供最佳結果。您將需要選擇您的空間(例如,可以是黎曼空間)並定義點之間的距離(甚至定義一個“點”)。最後兩個是研究主題,它們還取決於您擁有的數據(信號)的類型(屬性)。

Rti
2015-10-26 14:45:08 UTC
view on stackexchange narkive permalink

K-means可以為鄰居節點創建集群信息,而KNN找不到給定鄰居節點的集群。

mohatef
2017-11-23 18:09:15 UTC
view on stackexchange narkive permalink

k均值可用作在實際分類階段部署knn之前的訓練階段。K表示創建由屬於每個類別的樣本的質心和類別標籤表示的類別。knn使用這些參數以及k號對一個看不見的新樣本進行分類,並將其分配給由K均值算法創建的k類之一



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...