[R-es] ARIMA automatizados (Gregorio R. Serrano)
jluis.gilsanz en tasacionesh.com
jluis.gilsanz en tasacionesh.com
Mar Mayo 10 09:30:55 CEST 2011
;-)
From: grserrano en ccee.ucm.es
To: Jluis GILSANZ/ES/EUROPE/GROUP en BNPPARIBAS
Date: 09/05/2011 16:06
Subject: Re: [R-es] ARIMA automatizados (Gregorio R. Serrano)
Sent by: grserrano en gmail.com
Con el regulador hemos topado ... Para un proyecto de esa magnitud yo
habría probado algunas cosas más como VAR, descomponer la variabilidad de
los precios, relacionar precios provinciales con agregados ... Pero todo
eso requiere bastante más trabajo de recogida de datos, análisis, etc.
Espero que te salga bien.
Un saludo
Gregorio R. Serrano
El 9 de mayo de 2011 12:23, <jluis.gilsanz en tasacionesh.com> escribió:
Hola de nuevo:
Te comento entre líneas.
grserrano---09/05/2011 10:48:21---Buenas. De nada, para eso está la lista.
Sobre tu nuevo algoritmo, me parece muy
Buenas.
De nada, para eso está la lista. Sobre tu nuevo algoritmo, me parece muy
sensato, pero:
1) ¿Existe alguna serie económica mensual o trimestral no estacional? Yo
creo que auto.arima decide las diferencias con algún contraste de raíces
unitarias (no he "mirado dentro"), pero en series económicas tendría que
buscar mucho para encontrar una serie que no requiere diferencia
estacional y cuando ocurre se debe a que la fuente ha planchado
(suavizado, desestacionalizado) los datos.
Efectivamente auto.arima usa, a grosso modo, KPSS para encontrar las
diferencias regulares y una versión modificada del test Canova-Hanses para
las estacionales. Los datos provienen del Ministerio de Fomento al cual le
son proporcionados a través de ATASA (la patronal de las sociedades de
tasación española), es posible que dichas fuentes hagan el suavizado que
planteas.
2) Los precios no sólo crecieron, sino que aceleraron, es decir, desde
2000 el crecimiento fue cada vez mayor (segunda derivada positiva). Para
hacer eso estacionario necesitas dos diferencias, o al menos probarlas (yo
tengo dos diferencias regulares en mi modelo de precios de vivienda, pero
son precios agregados, no provinciales). Yo probaría d=2 y D=1, después
puedes comprobar la no estacionariedad en la estimación.
Completamente de acuerdo, de hecho en la primera tanda de modelos que me
genero auto.arima hay varias provincias (unas 20 o 22 aprox.), con
mercados muy dinámicos, que llegaron a un d=2. El iniciar con d=1 y no con
un d=2 estaba fundamentado en que algunas otras provincias, con mercados
mas estáticos, con una sola diferenciación regular bastaba y me parecía
mas prudente no tender a modelos sobrediferenciados. En términos
coloquiales era decirle a auto.arima "como poco me pones un d=1 y tu
decides si llegamos a d=2 o nos quedamos en d=1".
3) El horizonte de previsión me parece excesivo, ya sé que eso suele ser
culpa de nuestros jefes/clientes que creen que se puede prever todo, pero
tal y como están las cosas es disparatado. ¿Te imaginas las previsiones
horizonte 12 trimestres que habrías hecho a finales de 2006?
Es muy excesivo de hecho, y mas teniendo en cuenta la poca amplitud
histórica de la serie (apenas 64 trimestres). El horizonte a 3 años esta
fijado por el propio Banco de España que nos exige realizar esas
previsiones en su normativa ECO 805/2003 que dice mas o menos asi:
...la entidad tasadora estime que existe una probabilidad elevada de que
el valor de tasación experimente una reducción significativa en términos
nominales antes de transcurrido un año desde la fecha de la tasación que
dure al menos 3 años. La estimación deberá apoyarse en datos sólidos
disponibles sobre la situación coyuntural del mercado local....
Otra cosa es que, en la situación actual, esas estimaciones sean muy poco
fiables. Según mi opinión personal, ningún modelo que se base en la propia
historia de la serie, hubiese anticipado el cambio de ciclo de 2006,
fundamentalmente porque no ha habido un cambio de ciclo como el que hemos
vivido estos últimos años. Todo estos modelos (alisados, arimas etc) se
basan en algo que ya ha pasado para estimar el futuro. Resumiendo tenemos
que hacer esas estimaciones aunque somos consciente de que su validez es
mas que cuestionable.
4) Los alisados tienen mejor pinta, también puedes usar algún filtro tipo
Hodrick-Presscott, pero cualquiera de esas opciones tardará mucho más en
reaccionar ante un cambio de tendencia que el ARIMA. Yo hago previsiones
con ARIMA y después presento gráficos suavizados, pero no calculo
previsiones de datos suavizados.
Finalmente creo me voy a decantar por la opción de los alisados, lo cierto
es que me produce bastante inquietud el obtener modelos arima que cumplen
una diagnosis correcta de residuos pero que presentan coeficientes no
significativos.
A vista de pájaro los alisados arrojan predicciones "mejores" y sobre
todo, no me causan tanta intranquilidad en cuanto al cumplimiento de
hipótesis y requerimientos de los arima.
¡Jó! qué pesado soy, pero es que en esto tengo la experiencia de muchos
informes periódicos de coyuntura a mis espaldas.
Y no sabes cuanto me alegro de que seas tan pesado como instructivo
Muchas gracias
Salu2
El 9 de mayo de 2011 09:44, <jluis.gilsanz en tasacionesh.com> escribió:
Hola
Gregorio muchas gracias por tu respuesta, veo que con tu experiencia no
puedo confiar demasiado en la automatización de arimas de forecast.
Sabiendo esta renuencia a hacer diferenciaciones del algoritmo, se me
plantea una estrategia que quizás ayude al auto.arima de forecast a
funcionar mejor.
Hacer un barrido previo a los 200 y picos modelos que tengo que generar y
detectar aquellos en los que sea necesarios al menos una diferenciación
estacional.
Puesto que los datos se refieren a evolución de precios inmobiliarios en
los que siempre existe una marcada tendencia (creciente desde 1995 -2007 y
decreciente los tres últimos años), podría modificar el código que he
escrito de forma que:
-Para los casos en los que en el barrido previo detecte estacionalidad,
inicializar el auto.arima con d=D=1
-Para aquellos casos en los que el barrido no detecte estacionalidad
inicializarlo con d=1 y D=0.
De cualquier forma estoy contemplando la posibilidad de cambiar los
modelos Arima por unos alisados exponenciales, ya que las estimaciones a
realizar son de un horizonte de 12 trimestres y las estimaciones a futuro
que realizan los alisados tienen mejor "pinta" que los modelos arima que
he construido hasta ahora.
Si no fuera por limitado nivel de ingles le enviaría un mensaje al creador
del paquete a ver si el puede explicarme el motivo de que el algoritmo
encuentre modelos con coeficientes no significativos pero en los que la
diagnosis del modelo es correcta.
Un saludo
José Luis Gilsanz Gómez
Estadística
Tasaciones Hipotecarias
María de Molina, 54 - 28006 - Madrid
Tel. : 34-914549694
Fax : 34-917822164
Email : jluis.gilsanz en tasacionesh.com
Site web: www.tasacionesh.es
-- AVISO LEGAL --
Los datos personales que en esta comunicación aparecen, así como los que
nuestra empresa mantiene de Vd. y de su empresa, son tratados con la
finalidad de mantener el contacto así como realizar las gestiones que en
esta aparecen (Ley Orgánica 15/1999, de 13 de diciembre, de Protección de
Datos de Carácter Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y
oposición dirigiéndose a atencion.clientesth en tasacionesh.com.
La utilización de su dirección de correo electrónico por parte de nuestra
empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios
de la Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe
comunicación comercial por nuestra parte y desea dejar de recibirla,
rogamos nos lo comunique por vía electrónica a través de la dirección
atencion.clientesth en tasacionesh.com .
From: r-help-es-request en r-project.org
To: r-help-es en r-project.org
Date: 07/05/2011 12:03
Subject: Resumen de R-help-es, Vol 27, Envío 7
Sent by: r-help-es-bounces en r-project.org
Asuntos del día:
1. Re: ARIMA automatizados (Gregorio R. Serrano)
----------------------------------------------------------------------
Message: 1
Date: Fri, 6 May 2011 15:41:29 +0200
From: "Gregorio R. Serrano" <grserrano en ccee.ucm.es>
To: jluis.gilsanz en tasacionesh.com
Cc: r-help-es en r-project.org
Subject: Re: [R-es] ARIMA automatizados
Message-ID: <BANLkTik9X=rEdzDhbjrC9Tr2aj-oJXuR_A en mail.gmail.com>
Content-Type: text/plain
Hola.
Yo trabajo bastante con modelos ARIMA para previsiones mensuales y
auto.arima (de forecast) y yo no solemos coincidir en la especificación.
auto.arima se resiste a diferenciar y eso da lugar a un p muy alto y
también, a veces, a unos q inaceptables (y como consecuencia correlación
excesiva entre los parámetros estimados). A veces lo utilizo como punto de
partida o como complemento a la identificación y diagnosis, pero no uso
automáticamente los modelos que devuelve.
Por otra parte, no estoy dispuesto a que me cambie la especificación de un
ARIMA sin "mi permiso", así que yo guardo los órdenes p,d,q, P,D,Q de mis
modelos en un archivo y reestimo la misma especificación cada mes (cuando
actualizo datos). Sólo si los residuos indican otra cosa me planteo
cambiar
el modelo, cosa que no debería ocurrir con frecuencia.
Un saludo
Gregorio R. Serrano
El 6 de mayo de 2011 10:58, <jluis.gilsanz en tasacionesh.com> escribió:
> Hola:
>
> Si no recuerdo mal creo que este es mi primer post, así que espero no
> cometer ninguna "barbaridad" y que sean comprensivos conmigo.
> Retomo mi contacto con R después de una pequeña introducción que hice
hace
> un par de años gracias a un curso de la UNED.
>
> El proyecto trata, a grandes rasgos de:
> 1.- Conectarse a un servidor Microsoft SQL y bajarse a R unos datos de
> evolución de precios unitarios de vivienda (publicados por el Mto. de
> Fomento de España) por cuatrimestres (desde 1995 a 2010 hacen un total
de
> 64 trimestres) y por provincias.
> 2.- Generar un bucle en el que para cada una de las 52 provincias se
> obtenga un modelo ARIMA automático, así como sus estimaciones a 3 años
> vista.
> 3.- Al final del bucle se guardara en el SQL una tabla que contiene,
para
> cada provincia, entre otras cosas, el modelo ajustado , los
AIC,AICC,BIC,
> log-likehood, sigma2, así como una variable booleana que especifica si
el
> modelo tiene TODOS sus coeficientes significativos. También guardare una
> tabla con las estimaciones efectuadas por cada modelo ajustada a cada
> provincia.
>
> Si alguien tiene interés en el código que he desarrollado se lo puedo
> proporcionar, o si se considera de interés publicarlo en la lista. No lo
> envío ahora por ser demasiado extenso.
>
> Para ello utilizo los paquetes RODBC para conectarme al SQL Server donde
> están los datos y forecast para calcular los modelos automatizados
ARIMA,
> y aquí es donde radica el problema.
>
> A pesar de que según el autor del paquete se especifica en este articulo
> http://www.jstatsoft.org/v27/i03/paper que el algoritmo garantiza la
> obtención de un modelo valido, me he encontrado que alguno de los 52
> modelos ajustados tiene alguno de sus coeficientes no significativos
> (usando un nivel de significación de 0,05), a pesar de que usando tsdiag
> los gráficos muestran una buena diagnosis del modelo.
>
> Extrañado por ello me he decido aplicar, a modo de prueba, el
> procedimiento de obtención de ARIMA automatizados del paquete forecast a
> la secuencia de datos AirPassengers con la que muchos aprendimos a
> trabajar con modelos ARIMA. Para dicha secuencia de datos el mejor
modelo
> obtenido segun se especifico en su día por Box & Jenkins es un
> ARIMA(0,1,1)(0,1,1)[12] , mientras que el procedimiento automatizado del
> paquete forecast propone un modelo ARIMA(0,1,0)(0,0,2)[12] usando la
> opción por pasos o bien un modelo ARIMA(2,1,1)(0,0,2)[12] with drift
> usando la opción que prueba con todos los modelos posibles.
> En ambos casos me sorprende que no haga ninguna diferenciación
estacional
> a pesar de que se trata de una serie claramente estacional.
>
> Se me plantean muchas dudas que espero que me puedan resolver.
> ¿Estoy equivocando la forma de enfocar el proyecto?
> ¿Puedo confiar en el paquete forecast a pesar de estos resultados tan
> desconcertantes?
> ¿Existe algún otro paquete alternativo que me permita realizar algo
> similar?.
>
> Desde ya, muchísimas gracias por haber leído esta extensa exposición
>
> Muchas gracias
>
> Un saludo
>
> José Luis Gilsanz Gómez
>
>
>
> -- AVISO LEGAL --
>
> Los datos personales que en esta comunicación aparecen, así como los que
> nuestra
> empresa mantiene de Vd. y de su empresa, son tratados con la finalidad
de
> mantener
> el contacto así como realizar las gestiones que en esta aparecen (Ley
> Orgánica
> 15/1999, de 13 de diciembre, de Protección de Datos de Carácter
Personal).
> Puede ejercer sus derechos de acceso, rectificación, cancelación y
> oposición
> dirigiéndose a atencion.clientes en tasacionesh.com
> La utilización de su dirección de correo electrónico por parte de
nuestra
> empresa
> queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la
> Sociedad de
> la Información y el Comercio Electrónico. Si Vd. recibe comunicación
> comercial por
> nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por
vía
> electrónica
> a través de la dirección atencion.clientes en tasacionesh.com
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
-- AVISO LEGAL --
Los datos personales que en esta comunicación aparecen, así como los que
nuestra
empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de
mantener
el contacto así como realizar las gestiones que en esta aparecen (Ley
Orgánica
15/1999, de 13 de diciembre, de Protección de Datos de Carácter
Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y
oposición
dirigiéndose a atencion.clientes en tasacionesh.com
La utilización de su dirección de correo electrónico por parte de nuestra
empresa
queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la
Sociedad de
la Información y el Comercio Electrónico. Si Vd. recibe comunicación
comercial por
nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía
electrónica
a través de la dirección atencion.clientes en tasacionesh.com
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Dr. Gregorio R. Serrano
Dpto. Economía Cuantitativa (UCM)
Voz:+34 91394 2361
Fax:+34 91394 2591
http://www.grserrano.es
-- AVISO LEGAL --
Los datos personales que en esta comunicación aparecen, así como los que
nuestra
empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de
mantener
el contacto así como realizar las gestiones que en esta aparecen (Ley
Orgánica
15/1999, de 13 de diciembre, de Protección de Datos de Carácter
Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y
oposición
dirigiéndose a atencion.clientes en tasacionesh.com
La utilización de su dirección de correo electrónico por parte de nuestra
empresa
queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la
Sociedad de
la Información y el Comercio Electrónico. Si Vd. recibe comunicación
comercial por
nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía
electrónica
a través de la dirección atencion.clientes en tasacionesh.com
--
Dr. Gregorio R. Serrano
Dpto. Economía Cuantitativa (UCM)
Voz:+34 91394 2361
Fax:+34 91394 2591
http://www.grserrano.es
-- AVISO LEGAL --
Los datos personales que en esta comunicación aparecen, así como los que nuestra
empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de mantener
el contacto así como realizar las gestiones que en esta aparecen (Ley Orgánica
15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición
dirigiéndose a atencion.clientes en tasacionesh.com
La utilización de su dirección de correo electrónico por parte de nuestra empresa
queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la Sociedad de
la Información y el Comercio Electrónico. Si Vd. recibe comunicación comercial por
nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía electrónica
a través de la dirección atencion.clientes en tasacionesh.com
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20110510/889089ae/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/gif
Size: 105 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20110510/889089ae/attachment-0001.gif>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/jpeg
Size: 24195 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20110510/889089ae/attachment-0001.jpe>
Más información sobre la lista de distribución R-help-es