如何理解R語言聚類算法中的期望最大化聚類

149次閱讀

共計(jì) 554 個(gè)字符，預(yù)計(jì)需要花費(fèi) 2 分鐘才能閱讀完成。

今天就跟大家聊聊有關(guān)如何理解 R 語言聚類算法中的期望最大化聚類，可能很多人都不太了解，為了讓大家更加了解，丸趣 TV 小編給大家總結(jié)了以下內(nèi)容，希望大家根據(jù)這篇文章可以有所收獲。

1. 原理解析:
它將數(shù)據(jù)集看作一個(gè)含有隱性變量的概率模型, 并以實(shí)現(xiàn)模型最優(yōu)化, 即獲取與數(shù)據(jù)本身性質(zhì)最契合的聚類方式為目的, 通過”反復(fù)估計(jì)”模型參數(shù)找到最優(yōu)解, 同時(shí)給出相應(yīng)的最優(yōu)類別 k. 而”反復(fù)估計(jì)”的過程即是 EM 算法的精華所在, 這一過程由 E -step(Expectation) 和 M -step(Maximization) 兩個(gè)步驟交替進(jìn)行來實(shí)現(xiàn)。

2. 在 R 語言中的應(yīng)用
期望最大化聚類主要運(yùn)用到了 mclust 包里的 Mclust 函數(shù)。
Mclust(data,G=NULL,modelNames=NULL,prior=NULL,control=emControl(),initialization=NULL,warn=FALSE,…)
3. 以 iris 數(shù)據(jù)集為例進(jìn)行分析
1) 應(yīng)用模型并查看模型的相應(yīng)參數(shù)
fit_EM=Mclust(iris[,-5])
fit_EM[1:length(fit_EM)]

看完上述內(nèi)容，你們對(duì)如何理解 R 語言聚類算法中的期望最大化聚類有進(jìn)一步的了解嗎？如果還想了解更多知識(shí)或者相關(guān)內(nèi)容，請(qǐng)關(guān)注丸趣 TV 行業(yè)資訊頻道，感謝大家的支持。

正文完