[R-es] rvest webscraping
Ruben Tobalina Ramirez
|@gr|m@e@cr|t@ @end|ng |rom gm@||@com
Mie Jul 9 16:56:20 CEST 2025
Hola, buenas tardes,
Estoy usando *rvest* para hacer webscraping y me surge una duda con el
siguiente código:
*x <- '<h2>Alerta Cobra <span class="title">(Alarm für Cobra 11 - Die
Autobahnpolizei)</span>\n</h2>'*
*x %>% read_html() %>% html_nodes(xpath = "//h2")*
Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*.
En este ejemplo seria solo *Alerta Cobra. *He probado usando los
típicos operadores como *!* o *:not(span)*, pero no ha resultado bien.
Una orientación de como hacerlo me vendría bien, muchas gracias de antemano.
PD: perdón que en els anterior mensaje se me olvidó poner un asunto.
--
Rubén.
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es