[R-es] rvest webscraping

Ruben Tobalina Ramirez |@gr|m@e@cr|t@ @end|ng |rom gm@||@com
Mie Jul 9 23:03:54 CEST 2025


Buenas noches Juan,

Gracias por la respuesta. Mañana miro a ver si me sirve esa herramienta.

Un saludo

Rubén.

El dc., 9 de jul. 2025, 19:08, Juan Abasolo <juan.abasolo using ehu.eus> va
escriure:

> Hola, Rubén;
> Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el
> plugin SelectorGadget para los derivados de Chromium (Brave, Chrome,
> Opera....) te sirve para identificar cuál es la etiqueta específica para
> seleccionar los diferentes elementos de una página.
> Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver
> por esa vía (te tocaría ver algún tutorial).
>
> Suerte
> Juan
>
> Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita using gmail.com)
> erabiltzaileak (2025 uzt. 9(a), az. (16:56)):
>
>> Hola, buenas tardes,
>>
>> Estoy usando *rvest*  para hacer webscraping y me surge una duda con el
>> siguiente código:
>>
>> *x <- '<h2>Alerta Cobra <span class="title">(Alarm für Cobra 11 - Die
>> Autobahnpolizei)</span>\n</h2>'*
>> *x %>% read_html() %>% html_nodes(xpath = "//h2")*
>>
>> Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando
>> *span*.
>> En este ejemplo seria solo *Alerta Cobra. *He probado usando los
>> típicos operadores como *!* o *:not(span)*, pero no ha resultado bien.
>>
>> Una orientación de como hacerlo me vendría bien, muchas gracias de
>> antemano.
>>
>> PD: perdón que en els anterior mensaje se me olvidó poner un asunto.
>> --
>> Rubén.
>>
>>         [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es using r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Juan Abasolo, PhD
>
> Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea EHU
>
> Sarriena auzoa z/g 48940 - Leioa (Bizkaia)
>
> T       : (+34) 94 601 7567
> Telegram: @JuanAbasolo
> Skype   : abasolo72
> Bloga   : juanabasolo.netlify.app
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es