聚類是什麼意思

在統計學和數據分析中，聚類是一種無監督學習（ unsupervised learning）技術，用於將數據分組成類別或簇，使得同一類別中的數據點比不同類別中的數據點具有更高的相似性。聚類的目標是發現數據中的自然結構，而無需預先給定類別的標籤。

聚類算法會根據數據點的某些特徵（如距離、相似性或其他關聯性）將它們組織成簇。這些簇可以是數據點在空間中的物理位置，也可以是更高維度數據中的抽象概念。聚類的應用非常廣泛，包括市場細分、基因分類、圖像分析、數據壓縮、搜尋引擎和許多其他領域。

聚類算法可以分為多種類型，包括：