[R-es] rvest webscraping

Mie Jul 9 19:07:59 CEST 2025

Hola, Rubén;
Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el
plugin SelectorGadget para los derivados de Chromium (Brave, Chrome,
Opera....) te sirve para identificar cuál es la etiqueta específica para
seleccionar los diferentes elementos de una página.
Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver
por esa vía (te tocaría ver algún tutorial).

Suerte
Juan

Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita using gmail.com)
erabiltzaileak (2025 uzt. 9(a), az. (16:56)):

> Hola, buenas tardes,
>
> Estoy usando *rvest*  para hacer webscraping y me surge una duda con el
> siguiente código:
>
> *x <- '<h2>Alerta Cobra <span class="title">(Alarm für Cobra 11 - Die
> Autobahnpolizei)</span>\n</h2>'*
> *x %>% read_html() %>% html_nodes(xpath = "//h2")*
>
> Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*.
> En este ejemplo seria solo *Alerta Cobra. *He probado usando los
> típicos operadores como *!* o *:not(span)*, pero no ha resultado bien.
>
> Una orientación de como hacerlo me vendría bien, muchas gracias de
> antemano.
>
> PD: perdón que en els anterior mensaje se me olvidó poner un asunto.
> --
> Rubén.
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

-- 
Juan Abasolo, PhD

Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
Bilboko Hezkuntza Fakultatea
Euskal Herriko Unibertsitatea EHU

Sarriena auzoa z/g 48940 - Leioa (Bizkaia)

T       : (+34) 94 601 7567
Telegram: @JuanAbasolo
Skype   : abasolo72
Bloga   : juanabasolo.netlify.app

	[[alternative HTML version deleted]]