[R-es] Descarga ficheros web desde R

Jorge Pradas jorpr@mo @end|ng |rom gm@||@com
Jue Abr 7 17:14:52 CEST 2022


No soy muy experto en paginas asp.net pero no funciona como una pagina
normal, es por eso que tienes que hacer un post, en este caso ha sido fácil
porque en el envío de este formulario no hacía falta pasar
ningún parámetro, porque imagino que el único fichero de descarga que
ofrece ese link es el que queria descargar el compañero, sino en la llamada
post se debería haber completado con parámetros.

Aquí tienen algo más de información que he podido encontrar:
https://medium.com/@simranpandey97/web-scraper-for-aspx-form-based-webpages-b8828085e4a2

Jorge


El jue, 7 abr 2022 a las 15:29, Javier Marcuzzi (<
javier.ruben.marcuzzi using gmail.com>) escribió:

> Estimados
>
> La dirección es GET, no POST, tendría que andar en principio, si me ocurre
> que podría intentar con
> https://cran.r-project.org/web/packages/rvest/index.html , posiblemente
> hay algo interno que se soluciona.
>
> Javier Rubén Marcuzzi
>
> > El 7 abr. 2022, a las 08:26, Jorge Pradas <jorpramo using gmail.com> escribió:
> >
> >  Hola!
> >
> > Creo que con GET no va, con POST mejor y sacando el content. Prueba así,
> a
> > mi me ha ido.
> >
> > library("httr")
> > UrlBase <-  "
> >
> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1
> > "
> > file=POST(UrlBase)[["content"]]
> > writeBin(as.raw(file),
> >         con = "./filename.zip")
> >
> > un saludo!
> > Jorge
> >
> > El jue, 7 abr 2022 a las 11:50, Blas (<b1 using famovil.es>) escribió:
> >
> >> Buenos días,
> >>
> >> me encuentro con un problema que imagino
> >> es muy común pero no veo solución aparente en internet. No tengo mucha
> >> idea de páginas "aspx" ni "javascript" pero necesito descargar datos
> >> públicos desde la siguiente dirección:
> >> http://serviciosede.mineco.gob.es/Indeco/.
> >> En concreto necesito descargar el fichero completo con todas las series
> >> que está en el enlace "Descarga completa de BDSICE". Con el debugger
> >> del navegador me dice que está bajo la URL "
> >>
> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1
> >> "
> >>
> >>
> >>
> >> He probado a ejecutar el siguiente código:
> >>
> >>
> >>
> >>
> >>
> >> library("httr")
> >>
> >> UrlBase <-  "
> >>
> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1
> >> "
> >>
> >> download.file(UrlBase, "./BaseDatos.zip")
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >> Y también el código:
> >>
> >>
> >>
> >>
> >>
> >> library("httr")
> >>
> >> UrlBase <-  "
> >>
> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1
> >> "
> >>
> >> get(UrlBase)
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >> Ninguno de los métodos me ha funcionado.
> >>
> >> Alguien que me oriente.
> >>
> >>
> >>
> >>
> >>
> >> Saludos.
> >>
> >> Blas.
> >>        [[alternative HTML version deleted]]
> >>
> >> _______________________________________________
> >> R-help-es mailing list
> >> R-help-es using r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >       [[alternative HTML version deleted]]
> >
> > _______________________________________________
> > R-help-es mailing list
> > R-help-es using r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es