作為家庭作業問題的一部分,我被要求通過刪除最小和最大的觀測值來計算數據集的均值,並解釋結果。修整後的平均值低於未修整的平均值。
我的解釋是,這是因為基本分佈正偏,所以左尾比右尾更密集。由於這種偏斜,刪除高基準數據比刪除低基準數據更容易拖累均值,因為從非正式的角度來說,還有更多的低數據正在“等待取代”。 (這合理嗎?)
然後我開始懷疑修整百分比是如何影響的,因此我針對各種$ k計算了修整後的平均值$ \ bar x _ {\ operatorname {tr}(k)} $ = 1 / n,2 / n,\ dotsc,(\ frac {n} {2} -1)/ n $。我得到了一個有趣的拋物線形狀:
我不太確定該如何解釋。從直覺上看,似乎曲線圖的斜率應該(與中位數的k個數據點內的分佈部分的負偏度成正比)。 (這個假設確實可以驗證我的數據,但是我只有$ n = 11 $,所以我不太有把握。)
這種類型的圖是否有名稱,或者它是常用的?我們可以從該圖中收集哪些信息?有標準解釋嗎?
供參考,數據為:4、5、5、6、11、17、18、23、33、35、80。