[R-es] Descarga ficheros web desde R

Javier Marcuzzi j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com
Jue Abr 7 22:53:57 CEST 2022


Estimados

El lugar de referencia es una dirección, esta es GET, no tiene campo POST, aunque, yo no mire como está realizado, desconocía el problema de asp, aunque esto son estados para identificar el usuario y trabajar entre las solicitudes y respuestas, al respecto, cada vez que yo tuve problemas utilicé selenium desde R, se instala como cualquier paquete en R y mi opción preferida es Firefox, es lento, pero para el servidor lo realiza una persona desde Firefox, ejecuta javascript y demás cosas evitando inconvenientes.

Javier Rubén Marcuzzi


> El 7 abr. 2022, a las 12:14, Jorge Pradas <jorpramo using gmail.com> escribió:
> 
> No soy muy experto en paginas asp.net <http://asp.net/> pero no funciona como una pagina normal, es por eso que tienes que hacer un post, en este caso ha sido fácil porque en el envío de este formulario no hacía falta pasar ningún parámetro, porque imagino que el único fichero de descarga que ofrece ese link es el que queria descargar el compañero, sino en la llamada post se debería haber completado con parámetros.
> 
> Aquí tienen algo más de información que he podido encontrar:
> https://medium.com/@simranpandey97/web-scraper-for-aspx-form-based-webpages-b8828085e4a2 <https://medium.com/@simranpandey97/web-scraper-for-aspx-form-based-webpages-b8828085e4a2>
> 
> Jorge
> 
> 
> El jue, 7 abr 2022 a las 15:29, Javier Marcuzzi (<javier.ruben.marcuzzi using gmail.com <mailto:javier.ruben.marcuzzi using gmail.com>>) escribió:
> Estimados
> 
> La dirección es GET, no POST, tendría que andar en principio, si me ocurre que podría intentar con https://cran.r-project.org/web/packages/rvest/index.html <https://cran.r-project.org/web/packages/rvest/index.html> , posiblemente hay algo interno que se soluciona.
> 
> Javier Rubén Marcuzzi
> 
> > El 7 abr. 2022, a las 08:26, Jorge Pradas <jorpramo using gmail.com <mailto:jorpramo using gmail.com>> escribió:
> > 
> >  Hola!
> > 
> > Creo que con GET no va, con POST mejor y sacando el content. Prueba así, a
> > mi me ha ido.
> > 
> > library("httr")
> > UrlBase <-  "
> > http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1 <http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1>
> > "
> > file=POST(UrlBase)[["content"]]
> > writeBin(as.raw(file),
> >         con = "./filename.zip")
> > 
> > un saludo!
> > Jorge
> > 
> > El jue, 7 abr 2022 a las 11:50, Blas (<b1 using famovil.es <mailto:b1 using famovil.es>>) escribió:
> > 
> >> Buenos días,
> >> 
> >> me encuentro con un problema que imagino
> >> es muy común pero no veo solución aparente en internet. No tengo mucha
> >> idea de páginas "aspx" ni "javascript" pero necesito descargar datos
> >> públicos desde la siguiente dirección:
> >> http://serviciosede.mineco.gob.es/Indeco/ <http://serviciosede.mineco.gob.es/Indeco/>.
> >> En concreto necesito descargar el fichero completo con todas las series
> >> que está en el enlace "Descarga completa de BDSICE". Con el debugger
> >> del navegador me dice que está bajo la URL "
> >> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1 <http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1>
> >> "
> >> 
> >> 
> >> 
> >> He probado a ejecutar el siguiente código:
> >> 
> >> 
> >> 
> >> 
> >> 
> >> library("httr")
> >> 
> >> UrlBase <-  "
> >> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1 <http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1>
> >> "
> >> 
> >> download.file(UrlBase, "./BaseDatos.zip")
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> Y también el código:
> >> 
> >> 
> >> 
> >> 
> >> 
> >> library("httr")
> >> 
> >> UrlBase <-  "
> >> http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1 <http://serviciosede.mineco.gob.es/Indeco/DescargaArchivo.aspx?estadisticas=True&tipo=1>
> >> "
> >> 
> >> get(UrlBase)
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> 
> >> Ninguno de los métodos me ha funcionado.
> >> 
> >> Alguien que me oriente.
> >> 
> >> 
> >> 
> >> 
> >> 
> >> Saludos.
> >> 
> >> Blas.
> >>        [[alternative HTML version deleted]]
> >> 
> >> _______________________________________________
> >> R-help-es mailing list
> >> R-help-es using r-project.org <mailto:R-help-es using r-project.org>
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es <https://stat.ethz.ch/mailman/listinfo/r-help-es>
> >> 
> > 
> >       [[alternative HTML version deleted]]
> > 
> > _______________________________________________
> > R-help-es mailing list
> > R-help-es using r-project.org <mailto:R-help-es using r-project.org>
> > https://stat.ethz.ch/mailman/listinfo/r-help-es <https://stat.ethz.ch/mailman/listinfo/r-help-es>
> 


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es