題:
我的Poisson GLM應該使用偏移量嗎?
Vivienne
2016-08-31 18:06:48 UTC
view on stackexchange narkive permalink

我正在進行研究,以研究使用兩種不同的水下視覺普查方法時魚類密度和魚類物種豐富度的差異。我的數據最初是計數數據,但通常將其更改為魚的密度,但我仍然決定使用Poisson GLM,我希望它是正確的。

  model1 <- glm(g_den〜method + site + depth,poisson) 

我的3個預測變量是我訂購的方法,位置和深度我輸入它們時的因素。

我的反應變量是石斑魚物種豐富度,石斑魚密度,其他魚類也一樣。我知道密度不是整數,而是數字數據,例如1.34849。但是現在我得到了這個錯誤:

在dpois(y,mu,log = TRUE)中:非整數x = 0.037500

我一直在閱讀,很多人建議使用偏移量,這是最明智的做法嗎?

這實際上與如何使用R無關。這是一個偽裝為R問題的基本統計問題。它應該是這裡的話題。
三 答案:
gung - Reinstate Monica
2016-09-01 20:09:30 UTC
view on stackexchange narkive permalink

這裡有幾個問題:

  1. 您需要將觀察到的計數用作響應變量。您不應該使用密度( g_den )。
  2. 如果觀察到的計數來自不同區域,則需要將這些區域的日誌作為新變量:

      larea = log(area) 
  3. 您可以通過兩種不同的方式控制觀察的不同區域:

    • 使用 larea 代碼>作為偏移量。這將使您的響應實際上是速率(即使模型左側列出的是 count )。
    • 使用 larea 作為協變量。這將控制不同的區域,但不會使您的響應等同於費率。這是一種更靈活的方法,可讓您評估 larea 的增加是否對計數有增加或減少的影響(即,斜率是小於還是大於1)。
  4. ol>

    在以下CV線程中有關於這些問題的更多信息:

JDL
2016-08-31 18:13:54 UTC
view on stackexchange narkive permalink

您似乎將魚的數量除以所調查的水的體積(或面積)。在這種情況下,偏移量確實合適,您應使用除以後的值的對數。也許

model1 <- glm(g_den〜方法+站點+深度+偏移量(log(area)),泊松)

(由先前的不正確編輯版本,缺少日誌)

錯誤消息的原因是,泊松分佈通常是整數值,但響應不是整數。一旦存在偏移,這種情況就會改變;(響應/偏移)必須為整數(假設原始計數為整數,則為整數)。

您提到您應該在答案中使用area的對數轉換(因為Poisson模型使用log鏈接),但是您的代碼不進行轉換。我不認為默認情況下“偏移”會應用轉換,但是自從我使用“偏移”以來已經有一段時間了。
請注意,默認情況下,“ offset()” *不*應用轉換;它僅強制係數為1。例如,請參見[here](http://rfunction.com/archives/223)。
好點子。我將進行編輯以包括日誌。
感謝您的評論。那麼我應該將數據改回計數而不是密度,並將面積作為單獨的變量包括在內嗎?我還被建議在另一個論壇上做一個伽馬或高斯逆模型,如果我要保持數據的密度,將我的零值更改為0.00001,您認為這也合適嗎?
偏移量非常好使用,沒有理由使用任何其他偏移量。這正是偏移量要解決的問題。
好的,謝謝,但是在應用偏移之前,我需要將數據從密度更改為計數。
不,保持密度。一旦添加了偏移量,響應就不再必須是整數了。
我剛剛意識到我使用的每種方法的區域都是不同的,所以我將無法使用相同的區域
好的,我修復了它,即使使用偏移量,我仍然遇到相同的錯誤
@JDL一旦將log(area)包含為偏移量,則將非整數密度作為響應是不正確的。對數鏈接函數和對數(區域)偏移量是一個先驗合理的假設,即$ E(\ mathrm {count})= \ exp(\ beta ^ T x)\ mathrm {area} = \ exp(\ beta^ T x + \ log(\ mathrm {area}))$,即與預期魚的數量和每個區域的大小成正比。這意味著預期密度$ E(\ mathrm {count} / \ mathrm {area})= E(\ mathrm {count})/ \ mathrm {area} = \ exp(\ beta ^ T x)$獨立於日誌(區域)。
您不能將密度用作響應。您必須使用原始計數作為答复。包括偏移量將以正確的方式自動使* count *響應等效於密度。
mdewey
2016-09-01 16:13:26 UTC
view on stackexchange narkive permalink

如果要使用泊鬆建模,則必須為響應變量使用整數值。然後,您有兩個選擇

  • 使用區域或其他合適的分母作為偏移量。通常通常需要首先記錄該
  • 包括區域或其他內容作為預測變量。同樣,這通常會作為日誌包含在內,因為您是在對日誌計數建模。計數。如果您使用預測變量方法,則會說您知道,如果您乘以面積即可乘以計數,但不一定要乘以相同的因子。

    這是您的要求。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...