共計 518 個字符,預(yù)計需要花費(fèi) 2 分鐘才能閱讀完成。
在 Python 中,可以使用 scikit-learn 庫中的 KMeans 類來實(shí)現(xiàn) KMeans 聚類算法。下面是一個簡單的示例代碼:
from sklearn.cluster import KMeans
# 創(chuàng)建一個 KMeans 對象,指定聚類的簇數(shù)為 k
kmeans = KMeans(n_clusters=k)
# 將數(shù)據(jù)傳入 KMeans 對象進(jìn)行聚類
kmeans.fit(data)
# 獲取聚類結(jié)果,即每個樣本所屬的簇
labels = kmeans.labels_
# 獲取聚類的中心點(diǎn)
centroids = kmeans.cluster_centers_
在上面的代碼中,data
是一個包含樣本數(shù)據(jù)的數(shù)組,每行表示一個樣本。n_clusters
參數(shù)指定聚類的簇數(shù),即 k 的值。fit
方法用于對數(shù)據(jù)進(jìn)行聚類,labels_
屬性返回每個樣本所屬的簇,cluster_centers_
屬性返回聚類的中心點(diǎn)。
需要注意的是,KMeans 算法對數(shù)據(jù)的特征進(jìn)行聚類,因此需要先對數(shù)據(jù)進(jìn)行特征提取或者降維。另外,KMeans 算法的結(jié)果受到初始中心點(diǎn)的選擇影響,有可能得到不同的聚類結(jié)果。為了避免這個問題,可以通過多次運(yùn)行 KMeans 算法,選擇聚類結(jié)果最好的一次。
丸趣 TV 網(wǎng) – 提供最優(yōu)質(zhì)的資源集合!
正文完