層次聚類是什麼意思

層次聚類(Hierarchical Clustering)是一種將數據點組織成樹狀結構的聚類方法。它通過逐層地將數據點組合起來,形成一個層次的分類結構。層次聚類可以分為兩種主要類型:自上而下(Top-Down)和自下而上(Bottom-Up)。

自上而下的層次聚類,又稱為分解層次聚類,它首先將每個數據點視為一個單獨的簇,然後逐漸將這些簇合併成更大的簇。這種方法通常使用連接規則(如單連接、完全連接或平均連接)來決定如何將兩個簇合併成一個。

自下而上的層次聚類,又稱為凝聚層次聚類,它首先將每個數據點視為一個單獨的簇,然後逐漸將這些簇合併成更大的簇。這種方法通常使用連接規則來決定哪些小的簇應該首先合併。

層次聚類的一個優點是它不需要事先指定簇的數目,因為它可以生成一個簇的層次結構。這使得層次聚類對於不確定簇數目的情況特別有用。然而,層次聚類的一個缺點是它可能會生成不平衡的簇,因為它不像其他聚類方法那樣可以控制每個簇的大小。