[R-es] ERROR EN LECTURA DE PAGINAS HTML GIGANTES

Vie Ene 10 15:07:01 CET 2020

Estimado Diego Maldonado

Por ahí leí que hay un error pendiente, pero está fechado en el año 2019,
hace muuccchhooo.

Puede ser que una actualización tenga solucionado el problema?

Yo en lo personal opte por casi el mismo camino, excepto que no uso R y no
uso contenedores. C# me resulta una opción más adecuada para extraer los
datos, luego analizo con R.

Javier Rubén Marcuzzi

El vie., 10 ene. 2020 a las 1:01, Diego Maldonado via R-help-es (<
r-help-es using r-project.org>) escribió:

> Saludos estimado foro, por comentarles que estoy haciendo un proceso de
> webscrapping con Rselenium por medio de contenedores docker y al
> automatizar la cargar paginas html con el paquete XML por medio de la
> función read_html me sale el siguiente mensaje de error:
>
>  Error in doc_parse_raw(x, encoding = encoding, base_url = base_url,
> as_html = as_html,  :
>   Excessive depth in document: 256 use XML_PARSE_HUGE option [1]
>
> Si alguien me puede guiar como solventarlo les agradecería del fondo de mi
> alma ya que voy algunos días tratando de resolverlo pero no lo logro.
>
> De Antemano agradezco su atención
>
> Atte
>
> Diego Maldonado
> Chiefanalytics officer
> Mentalytica
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]