題:
對數線性回歸與邏輯回歸
user38133
2014-02-16 06:57:17 UTC
view on stackexchange narkive permalink

誰能提供清晰的對數線性回歸與邏輯回歸之間的區別的清單?我了解前者是一個簡單的線性回歸模型,但我不清楚何時應使用每種模型。

三 答案:
AdamO
2014-02-16 07:11:54 UTC
view on stackexchange narkive permalink

這個名字有點用詞不當。對數線性模型傳統上用於列聯表格式的數據分析。雖然“計數數據”不必一定遵循泊松分佈,但對數線性模型實際上只是泊松回歸模型。因此,使用“ log”名稱(泊松回歸模型包含“ log”鏈接函數)。

線性回歸模型中的“對數轉換結果變量”不是對數線性模型,(也不是冪運算結果變量,因為“對數線性”表明)。對數線性模型和邏輯回歸都是廣義線性模型的示例,其中線性預測變量(例如對數奇數或對數比率)之間的關係是線性的在模型變量中。它們不是“簡單的線性回歸模型”(或使用通常的$ E [Y | X] = a + bX $格式的模型)。

儘管如此,還是有可能獲得關於使用邏輯回歸和泊松回歸進行分類變量。只是在泊松模型中,結果變量被視為協變量。有趣的是,您可以設置一些模型,這些模型以與比例賠率模型非常相似的方式在組間借用信息,但是這種模型尚未得到很好的理解,也很少使用。

在邏輯和泊松中獲得等效推理的示例如下所示的使用R的回歸模型:

  y <- c(0,1,0,1)x <- c(0,0,1 ,1)w <- c(10,20,30,40)##通過邏輯回歸得出x和y之間的關係的比值比glm(y〜x,family = binomial,weights = w)##比值比相同列聯表頻率之間的交互參數glm(w〜y * x,family = poisson) 
有趣的是,$ y $和$ x $之間缺乏關聯意味著在邏輯回歸模型中優勢比為1,同樣,在對數線性模型中交互項為0。讓您了解我們如何測量列聯表數據中的條件獨立性。
再次,這可能表明我沒有經驗,但是您能否為列聯表提供定義?它還可能會幫助遇到此問題的其他人。
列聯表(通常)是二維表,它枚舉了兩個變量的所有可能響應並顯示了單元格中觀察的頻率。例如,您可能有一個2比2的權變表,其中顯示了吸煙狀況(從不與當前)和癌症(肺癌與無癌症),可用於估計吸煙與癌症風險之間的關聯。
gung - Reinstate Monica
2014-02-16 07:10:06 UTC
view on stackexchange narkive permalink

我不認為我會稱其為“簡單線性回歸模型”。儘管可以將log或logit轉換用作許多不同模型的鏈接函數,但通常將它們理解為指的是特定模型。例如,對於響應變量以二項式分佈的情況,“邏輯回歸”被理解為廣義線性模型(GLiM)。此外,“對數線性回歸”通常被理解為應用於多向列聯表的Poisson GLiM。換句話說,除了它們都是回歸模型/ GLiM之外,我認為它們不一定非常相似(@AdamO指出它們之間存在某些聯繫,但典型用法卻截然不同)。最大的差異在於,邏輯回歸假設響應以二項式分佈,而對數線性回歸假定響應以泊松分佈。實際上,對數線性回歸與大多數回歸模型有很大不同,因為響應變量實際上根本不是變量中的一個(通常意義上),而是與變量組合相關的一組頻率計數在多向列聯表中。

謝謝!我想我的自然後續問題(可能表明我缺乏經驗)是關於如何確定對給定問題建模的正確分佈。我認為我需要做更多的閱讀才能確保我始終可以正確選擇。
對數線性模型是適用於多向列聯表的Poisson回歸模型。例如,如果您有一個2向列聯表,並且您想知道行和列是否獨立,那麼您將進行卡方檢驗;如果您有> 2向列聯表,則可以使用對數線性模型。 Logistic回歸適用於您具有響應變量且僅$ \ {0,\ 1 \} $的情況。
M. Phipps
2018-07-27 11:35:27 UTC
view on stackexchange narkive permalink

為澄清起見,“二進制”邏輯回歸具有兩個結果的因變量。我的理解是,如果因變量,結果變量具有兩個以上類別,則還可以選擇使用“多項式”邏輯回歸。請參見此處



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...