誰能提供清晰的對數線性回歸與邏輯回歸之間的區別的清單?我了解前者是一個簡單的線性回歸模型,但我不清楚何時應使用每種模型。
誰能提供清晰的對數線性回歸與邏輯回歸之間的區別的清單?我了解前者是一個簡單的線性回歸模型,但我不清楚何時應使用每種模型。
這個名字有點用詞不當。對數線性模型傳統上用於列聯表格式的數據分析。雖然“計數數據”不必一定遵循泊松分佈,但對數線性模型實際上只是泊松回歸模型。因此,使用“ log”名稱(泊松回歸模型包含“ log”鏈接函數)。
線性回歸模型中的“對數轉換結果變量”不是對數線性模型,(也不是冪運算結果變量,因為“對數線性”表明)。對數線性模型和邏輯回歸都是廣義線性模型的示例,其中線性預測變量(例如對數奇數或對數比率)之間的關係是線性的在模型變量中。它們不是“簡單的線性回歸模型”(或使用通常的$ E [Y | X] = a + bX $格式的模型)。
儘管如此,還是有可能獲得關於使用邏輯回歸和泊松回歸進行分類變量。只是在泊松模型中,結果變量被視為協變量。有趣的是,您可以設置一些模型,這些模型以與比例賠率模型非常相似的方式在組間借用信息,但是這種模型尚未得到很好的理解,也很少使用。
在邏輯和泊松中獲得等效推理的示例如下所示的使用R的回歸模型:
y <- c(0,1,0,1)x <- c(0,0,1 ,1)w <- c(10,20,30,40)##通過邏輯回歸得出x和y之間的關係的比值比glm(y〜x,family = binomial,weights = w)##比值比相同列聯表頻率之間的交互參數glm(w〜y * x,family = poisson)
有趣的是,$ y $和$ x $之間缺乏關聯意味著在邏輯回歸模型中優勢比為1,同樣,在對數線性模型中交互項為0。讓您了解我們如何測量列聯表數據中的條件獨立性。
我不認為我會稱其為“簡單線性回歸模型”。儘管可以將log或logit轉換用作許多不同模型的鏈接函數,但通常將它們理解為指的是特定模型。例如,對於響應變量以二項式分佈的情況,“邏輯回歸”被理解為廣義線性模型(GLiM)。此外,“對數線性回歸”通常被理解為應用於多向列聯表的Poisson GLiM。換句話說,除了它們都是回歸模型/ GLiM之外,我認為它們不一定非常相似(@AdamO指出它們之間存在某些聯繫,但典型用法卻截然不同)。最大的差異在於,邏輯回歸假設響應以二項式分佈,而對數線性回歸假定響應以泊松分佈。實際上,對數線性回歸與大多數回歸模型有很大不同,因為響應變量實際上根本不是變量中的一個(通常意義上),而是與變量組合相關的一組頻率計數在多向列聯表中。
為澄清起見,“二進制”邏輯回歸具有兩個結果的因變量。我的理解是,如果因變量,結果變量具有兩個以上類別,則還可以選擇使用“多項式”邏輯回歸。請參見此處。