[R-es] Warning en modelo ZINB

Miriam Alzate miriam.alzate en unavarra.es
Mie Abr 11 18:38:28 CEST 2018


Muchas gracias Carlos por la respuesta y enlaces. Entiendo lo qué 
significa el tema de separación perfecta pero no logro entender cómo 
solucionarlo, estoy intentado seguir los enlaces pero me parece bastante 
complicado...


El 10/04/2018 a las 21:16, Carlos J. Gil Bellosta escribió:
> Hola, ¿qué tal?
>
> Pues casi seguro que tienes un caso de "separación perfecta".  Aunque 
> no exista una variable única (p.e., un nivel en una variable 
> categórica) que tenga asociados solo valores 0, es posible que exista 
> una combinación lineal de variables que separe regiones donde solo hay 
> ceros del resto de las observaciones.
>
> Un modelo inflado contiene internamente algo muy parecido a una 
> regresión logística y te estás encontrando un problema muy parecido a 
> este 
> <https://www.datanalytics.com/2010/10/25/una-solucion-al-problema-de-la-separacion-perfecta-con-regresiones-logisticas/>. 
> Existe código en R para solucionar ese problema en el contexto de la 
> logística (penalizaciones a lo Jeffrey, incluso ridge/lasso), pero no 
> creo que se hayan incorporado en modelos más específicos como los 
> inflados.
>
> No sé si tu paquete te permite introducir penalizaciones en parámetros 
> (que es la vía que señalaba más arriba). La otra opción es la ruta 
> "fully bayesian", como aquí 
> <https://github.com/stan-dev/example-models/tree/master/BPA/Ch.12>.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
>
> El lun., 9 abr. 2018 a las 20:35, <miriam.alzate en unavarra.es 
> <mailto:miriam.alzate en unavarra.es>> escribió:
>
>     Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
>     sigue dando el aviso...
>
>     El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió:
>     > Si, creo que el motivo del warning puede ser ese. Es hipotético,
>     pero
>     > plausible. Sobre todo cuando tienes más de un 90% de ceros.
>     >
>     > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs
>     > binomial
>     > negativa) sería infinito. Y de ahí el warning.
>     >
>     >
>     >
>     > El lun., 9 abr. 2018 a las 20:09, <miriam.alzate en unavarra.es
>     <mailto:miriam.alzate en unavarra.es>> escribió:
>     >
>     >>
>     >> ¿Quieres decir que para un nivel de una variable categorica
>     todas las
>     >> observaciones de la variable respuesta sean ceros?
>     >>
>     >> Gracias
>     >> El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió:
>     >> > ¿Podría ser que para algún nivel de alguna variable independiente
>     >> > categórica solo hubiese ceros? En ese caso, casi seguro,
>     aparecería
>     >> ese
>     >> > tipo de warning.
>     >> >
>     >> > El lun., 9 abr. 2018 a las 19:00, <miriam.alzate en unavarra.es
>     <mailto:miriam.alzate en unavarra.es>>
>     >> escribió:
>     >> >
>     >> >> Muchas gracias por la respuesta. He mirado y los
>     coeficientes no son
>     >> >> altos
>     >> >> pero sí tengo una gran cantidad de ceros en la variable
>     dependiente
>     >> (más
>     >> >> del 90%). Sin embargo, al incluir otro tipo de variables
>     >> independientes
>     >> >> no
>     >> >> me da ese aviso, dejando la misma variable dependiente.
>     >> >>
>     >> >> ¿Cómo podría utilizar stan/rstan de forma sencilla para
>     diagnosticar
>     >> el
>     >> >> modelo?
>     >> >>
>     >> >> Muchas gracias
>     >> >>
>     >> >> El Lun, 9 de Abril de 2018, 18:48, Carlos J. Gil Bellosta
>     escribió:
>     >> >> > Hola, ¿qué tal?
>     >> >> >
>     >> >> > El "warning" que comentas aparece en glm.fit precisamente
>     cuando un
>     >> >> > coeficiente diverge.
>     >> >> >
>     >> >> > El aviso puede ser malo o irrelevante, depende. Puede que
>     haya sido
>     >> >> > emitido
>     >> >> > en algún paso intermedio del ajuste (por lo que no habría
>     mayor
>     >> >> problema).
>     >> >> > O que afecte al ajuste entero. Uno de los síntomas de que
>     el ajuste
>     >> es
>     >> >> > malo
>     >> >> > es que algún coeficiente de tu modelo es excesivamente
>     grande. O
>     >> que
>     >> >> el
>     >> >> > peso correspondiente a tus ceros esté muy próximo a 0 o 1
>     (que es
>     >> lo
>     >> >> mismo
>     >> >> > en el contexto de un modelo inflado). Mira a ver qué pinta
>     tienen
>     >> los
>     >> >> > coeficientes y si tienen cierto sentido a la vista de tus
>     datos.
>     >> >> Vigila
>     >> >> > los
>     >> >> > extremadamente altos.
>     >> >> >
>     >> >> > Si no estás segura de tus coeficientes, puedes implementar el
>     >> modelo
>     >> >> > generativamente vía stan/rstan. Es sencillo y tendrías buenos
>     >> >> diagnósticos
>     >> >> > de lo que esta ocurriendo.
>     >> >> >
>     >> >> > Un saludo,
>     >> >> >
>     >> >> > Carlos J. Gil Bellosta
>     >> >> > http://www.datanalytics.com
>     >> >> >
>     >> >> >
>     >> >> >
>     >> >> >
>     >> >> > El lun., 9 abr. 2018 a las 18:34,
>     <miriam.alzate en unavarra.es <mailto:miriam.alzate en unavarra.es>>
>     >> >> escribió:
>     >> >> >
>     >> >> >> Buenas tardes,
>     >> >> >>
>     >> >> >> Estoy estimando un modelo binomial negativo de ceros inflados
>     >> (ZINB)
>     >> >> >> utilizando el comando zeroinfl() del paquete pscl. Al
>     ejecutarlo
>     >> me
>     >> >> da
>     >> >> >> el
>     >> >> >> siguiente aviso:
>     >> >> >> Warning: glm.fit: fitted probabilities numerically 0 or 1
>     occurred
>     >> >> >>
>     >> >> >> ¿Sabéis que significa y si puedo usar el modelo aún con
>     ese aviso?
>     >> >> ¿Los
>     >> >> >> coeficientes son fiables?
>     >> >> >>
>     >> >> >> Muchas gracias,
>     >> >> >>
>     >> >> >> Miriam
>     >> >> >>
>     >> >> >> _______________________________________________
>     >> >> >> R-help-es mailing list
>     >> >> >> R-help-es en r-project.org <mailto:R-help-es en r-project.org>
>     >> >> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
>     >> >> >>
>     >> >> >
>     >> >>
>     >> >>
>     >> >>
>     >> >
>     >>
>     >>
>     >>
>     >
>
>


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es