因此,我們有算術平均值(AM),幾何平均值(GM)和諧波平均值(HM)。他們的數學公式以及相關的定型示例(例如,諧波均值及其在“速度”相關問題中的應用)也是眾所周知的。
但是,一直令我著迷的一個問題是“確定在給定上下文中最適合使用哪個均值?”必須至少有一些經驗法則可以幫助理解其適用性,但是我遇到的最常見的答案是:“這取決於” (但取決於什麼? )。
這似乎是一個相當瑣碎的問題,但即使是高中課本也無法解釋這個問題-它們僅提供數學定義!數學上的一個簡單測試就是“您的母親/孩子會理解嗎?”
因此,我們有算術平均值(AM),幾何平均值(GM)和諧波平均值(HM)。他們的數學公式以及相關的定型示例(例如,諧波均值及其在“速度”相關問題中的應用)也是眾所周知的。
但是,一直令我著迷的一個問題是“確定在給定上下文中最適合使用哪個均值?”必須至少有一些經驗法則可以幫助理解其適用性,但是我遇到的最常見的答案是:“這取決於” (但取決於什麼? )。
這似乎是一個相當瑣碎的問題,但即使是高中課本也無法解釋這個問題-它們僅提供數學定義!數學上的一個簡單測試就是“您的母親/孩子會理解嗎?”
此答案的數學傾向可能比您想要的要大。
要認識的重要一點是,全部這些均值只是偽裝的算術均值 。諧波)是“正確”的意思是在當前問題中找到“加法結構”。
換句話說,假設我們得到了一些抽象量$ x_1,x_2,\ ldots,x_n $ ,我將其稱為“度量”,出於一致性考慮,以下在一定程度上濫用了該術語。這三種方法中的每一種都可以通過以下方式獲得:(1)將每個$ x_i $轉換為某個$ y_i $,(2)取 arithmetic 均值,然後(3)轉換回原始的測量範圍。
算術平均值:顯然,我們使用“身份”轉換:$ y_i = x_i $。因此,步驟(1)和(3)很簡單(什麼都不做),並且$ \ bar x _ {\ mathrm {AM}} = \ bar y $。
幾何平均值:此處的加法結構位於原始觀測值的對數上。因此,我們取$ y_i = \ log x_i $,然後在步驟(3)中獲得GM,我們通過$ \ log $的反函數進行轉換,即$ \ bar x _ {\ mathrm {GM}} = \ exp(\ bar {y})$。
調和平均值:這裡的可加結構位於我們觀察值的倒數上。因此,$ y_i = 1 / x_i $,則$ \ bar x _ {\ mathrm {HM}} = 1 / \ bar {y} $。
在物理問題中,這些問題通常是通過以下過程產生的:相對於測量值$ x_1,\ ldots,x_n $和其他一些數量,例如$ z_1,\ ldots,z_n $,我們有一些數量$ w $保持不變。現在,我們玩以下游戲:保持$ w $和$ z_1 + \ cdots + z_n $不變,並嘗試找到一些$ \ bar x $,以便如果我們替換單個觀察值$ x_i的 each $ by $ \ bar x $,那麼“總計”關係仍然保持。
距離-速度-時間示例似乎很受歡迎,因此讓我們使用它。
恆定距離,不同時間
考慮固定距離行駛了$ d $。現在假設我們以速度$ v_1,\ ldots,v_n $行駛此距離$ n $次,乘以時間$ t_1,\ ldots,t_n $。現在我們玩我們的遊戲。假設我們要用某個固定速度$ \ bar v $代替我們的各個速度,以使總時間保持恆定。注意,我們有$$ d-v_i t_i = 0 \ >,$$,因此$ \ sum_i(d-v_i t_i)= 0 $。當我們在遊戲中將每個$ v_i $替換為$ \ bar v $時,我們希望保持這種 total 關係(總時間和總行駛距離)。因此,$$ nd-\ bar v \ sum_i t_i = 0 \ >,$$,由於每個$ t_i = d / v_i $,我們得到$$ \ bar v = \ frac {n} {\ frac {1} {v_1} + \ cdots + \ frac {1} {v_n}} = \ bar v _ {\ mathrm {HM}} \ >。$$
請注意,此處的“附加結構”是針對各個時間,而我們的測量值與它們成反比,因此適用諧波均值。
變距,恆定時間
現在,讓我們更改情況。假設對於$ n $個實例,我們在距離$ d_1,\ ldots,d_n $上以速度$ v_1,\ ldots,v_n $行駛固定時間$ t $。現在,我們希望保留總距離。我們有$$ d_i-v_i t = 0 \ >,$$並且如果$ \ sum_i(d_i-v_i t)= 0 $,整個系統是守恆的。再次玩遊戲,我們尋求一個$ \ bar v $,使得$$ \ sum_i(d_i-\ bar vt)= 0 \ >,$$,但是由於$ d_i = v_i t $,我們得到了$$ \ bar v = \ frac {1} {n} \ sum_i v_i = \ bar v _ {\ mathrm {AM}} \ >。$$
在這裡,我們要維護的累加結構與測量值成比例
等體積立方體
假設我們構造了一個具有給定體積$ V的$ n $維盒$和我們的測量值是盒子的邊長。然後$$ V = x_1 \ cdot x_2 \ cdots x_n \ >,$$ 並假設我們要構造一個具有相同體積的$ n $維(超)多維數據集。也就是說,我們要用共同的邊長$ \ bar x $替換我們的各個邊長$ x_i $。然後$$ V = \ bar x \ cdot \ bar x \ cdots \ bar x = \ bar x ^ n \ >。$$
這很容易表明我們應該採用$ \ bar x =(x_i \ cdots x_n)^ {1 / n} = \ bar x _ {\ mathrm {GM}} $。
請注意,加法結構位於對數中,即$ \ log V = \ sum_i \ log x_i $,我們正在嘗試保留左側數量。
從舊的新方法
作為練習,請考慮一下“ “自然”的意思是在第一個示例中讓距離和時間都變化的情況。也就是說,我們有距離$ d_i $,速度$ v_i $和乘以$ t_i $。我們要保存總的行駛距離和時間,並找到一個恆定的$ \ bar v $來實現這一目標。
鍛煉:在這種情況下,“自然”是什麼意思?
擴展@Brandon的出色評論(我認為應該提倡回答):
當您對乘法差異感興趣時,應使用幾何平均值。布蘭登指出,範圍不同時應使用幾何平均值。這通常是正確的。原因是我們要均衡範圍。例如,假設大學申請人的SAT分數(0到800),HS的平均成績(0到4)和課外活動(1到10)得到了評分。如果一所大學希望對這些值求平均並均衡範圍(即每種質量相對於範圍的權重增加),那麼幾何均值將是可行的方法。
但這不是當我們擁有不同範圍的音階時,始終為true。如果我們比較不同國家(包括窮國和富國)的收入,我們可能不想要幾何平均值,而想要算術平均值(或更可能是中位數或修整後的平均值)。
我見過的諧波均值唯一用途是比較速率。例如:如果您以40英里/小時的速度從紐約開車到波士頓,然後以60英里/小時的速度返回,那麼您的總體平均值不是50英里/小時的算術平均值,而是諧波平均值。
AM = $(40 + 60)/ 2 = 50 $ HM = $ 2 /(1/40 + 1/60)= 48 $
檢查是否適合這個簡單的例子,想像一下從紐約市到波士頓120英里。然後,那裡的驅動器需要3個小時,開車回家需要2個小時,總時間為5個小時,距離為240英里。 $ 240/5 = 48 $
我將其簡化為3-4條經驗法則,並提供勾股方法的更多示例。
這3種方法之間的關係是 HM < GM < AM對於具有某些變化的非負數據。當且僅當樣本數據完全沒有變化時,它們才相等。
對於水平數據,請使用AM。價格是一個很好的例子。 要使用比率,請使用GM。投資回報率,相對價格和聯合國的人類發展指數都是例子。 HM適用於費率。以下是 David Giles提供的非汽車示例:
例如,請考慮“每週工作的小時數”(比率)。假設我們有四個人(樣本觀察值),每個人總共工作2000小時。但是,他們每週工作的小時數不同,如下所示:
人員總小時數每週每週工作時數1 2,000 40 502 2,000 45 44.44443 2,000 35 57.1428574 2,000 50 40總計:8,000 191.587297
第三列中的值的算術平均值為AM =每週42.5小時。但是,請注意該值的含義。將樣本成員的工作總週數(8,000)除以該平均值得出的數值為188.2353,這是所有四個人工作的總週數。
現在看上表的最後一列。實際上,樣本成員工作的總週數的正確值為191.5873週。如果我們在表的第三列中計算每周小時數的諧波均值,則HM = 41.75642小時(< AM), 將此數字除以8,000小時,得出的總工作週數的正確結果為191.5873。在這種情況下,諧波均值可以為樣本平均值提供適當的度量。
David還討論了這3種均值的加權形式,這些均值出現在用於衡量通貨膨脹的價格指數中。
p>我經常很難弄清是比率還是比率。投資收益通常在計算均值時視為比率,但由於通常以“每單位時間的百分比”表示,因此它們也是一種比率。我認為有用的區別是比率通常是無單位的,因此回報率就是比率,因為當前價值超過投資的$具有美元符號可以抵消。匯率的分子和分母具有不同的單位。
因此,如果您要總結北歐國家的巨無霸指數,則可以使用同等加權的HM,因為是一個比率。按國家/地區劃分,HM會告訴您在必須擁有相同數量的每種貨幣的約束下,需要支付多少貨幣才能獲得BM。
您的問題的一個可能答案(“我如何確定哪種均值在給定背景下最合適?”)是意大利數學家 Oscar Chisini給出的均值定義。 。
此處是一篇論文,包含更詳細的說明和一些示例(平均行進速度等)。
我認為回答這個問題的簡單方法是:
諧波平均值= 2ab /(a + b)= a(b / a + b)+ b(a /(a + b)
例如:由於您投資的資金量(A)保持固定,但每股價格(P)和份數(N)有所不同(A = PN)。實際上,如果您將算術平均值視為一個均等地位於兩個數字之間的數字,則諧波均值也是一個均等地位於兩個數之間的數字,但是(這很好)“中心”是百分比(比率)相等的位置,即:(x-a)/ a =(b -x)/ b,其中x是諧波平均值。