[R-es] rvest webscraping

Mie Jul 9 16:56:20 CEST 2025

Hola, buenas tardes,

Estoy usando *rvest*  para hacer webscraping y me surge una duda con el
siguiente código:

*x <- '<h2>Alerta Cobra <span class="title">(Alarm für Cobra 11 - Die
Autobahnpolizei)</span>\n</h2>'*
*x %>% read_html() %>% html_nodes(xpath = "//h2")*

Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*.
En este ejemplo seria solo *Alerta Cobra. *He probado usando los
típicos operadores como *!* o *:not(span)*, pero no ha resultado bien.

Una orientación de como hacerlo me vendría bien, muchas gracias de antemano.

PD: perdón que en els anterior mensaje se me olvidó poner un asunto.
-- 
Rubén.

	[[alternative HTML version deleted]]