箱線圖意思

箱線圖(Box Plot)是一種用來顯示數據分佈情況的統計圖表,它通過一個矩形框(箱體)和幾條線來表示數據的範圍、中位數、四分位距和極端值。箱線圖的結構通常包括以下幾個部分:

  1. 端點(Endpoints):箱線圖的兩端分別表示數據的最小值和最大值。如果數據中有離群值(Outliers),則會在箱線圖外以點或加號的形式標出。

  2. 箱體(Box):箱體的上下邊界分別表示數據的第二四分位數(Q2,中位數)和第三四分位數(Q3)。箱體的寬度並不反映數據的變異性,它只是一個固定的比例。

  3. 胡須(Whiskers):箱線圖的兩側有兩條線,稱為胡須。胡須的長度通常設置為從箱體的邊界延伸到數據的最小值和最大值。如果數據的變異性很大,胡須可能會很長。

  4. 中位數線(Median Line):如果數據有中位數,則會在箱體中間畫一條水平線,表示數據的中位數。

箱線圖有助於快速識別數據的集中趨勢(中位數)和變異性(四分位距和極端值),它特別適用於比較不同組數據的分布情況。箱線圖通常用於質量控制、數據探勘和統計分析中。