From co| @end|ng |rom qu@||tyexce||ence@e@ Tue Jul 1 22:07:42 2025 From: co| @end|ng |rom qu@||tyexce||ence@e@ (Carlos Ortega) Date: Tue, 1 Jul 2025 22:07:42 +0200 Subject: [R-es] =?utf-8?q?97_-_Reuni=C3=B3n_Grupo_de_R_-_Madrid=3A_Jueves?= =?utf-8?q?_26_de_junio_de_2025?= In-Reply-To: References: Message-ID: Gracias a todos los que pudieron asistir (presencial y online) a la última sesión del "Grupo de Usuarios de R de Madrid". Y gracias en especial a Pedro Concejero y al "DS Lab" (Universidad Rey Juan Carlos ) por todas las facilidades. El video y material de la presentación está disponible aquí: - https://madrid.r-es.org/97-jueves-26-de-junio-2025/ (Nos vemos a la vuelta del verano). Gracias, Carlos Ortega www.qualityexcellence.es El dom, 22 jun 2025 a las 10:55, Carlos Ortega () escribió: > Hola, > > ¿Qué tal? > > El próximo *jueves* (26 de junio), volvemos con una nueva reunión del " > Grupo de R de Madrid". > > Esta vez contamos con Pedro Concejero (habitual en esta lista) que nos > contará: > > "Kinsey, Tukey y el CIS: estadística en la cama" > "Estadística y diversidad sexual: de Kinsey a microdatos del CIS" > El detalle de la agenda lo podéis encontrar aquí: > > - > https://www.meetup.com/es-ES/grupo-de-usuarios-de-r-de-madrid/events/308570748/ > > Este evento será tanto presencial como online (Zoom). > > Os esperamos!. > > Gracias, > Carlos Ortega > www.qualityexcellence.es > > > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 13:39:27 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 13:39:27 +0200 Subject: [R-es] =?iso-8859-1?q?=28sin_asunto=29?= Message-ID: Hola, buenas tardes, Estoy usando *rvest* para hacer webscraping y me surge una duda con el siguiente codigo: *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die Autobahnpolizei)\n

'* *x %>% read_html() %>% html_nodes(xpath = "//h2")* Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. En este ejemplo seria solo *Alerta Cobra. *He probado usando los típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. -- Rubén. [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 16:56:20 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 16:56:20 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Hola, buenas tardes, Estoy usando *rvest* para hacer webscraping y me surge una duda con el siguiente código: *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die Autobahnpolizei)\n

'* *x %>% read_html() %>% html_nodes(xpath = "//h2")* Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. En este ejemplo seria solo *Alerta Cobra. *He probado usando los típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. PD: perdón que en els anterior mensaje se me olvidó poner un asunto. -- Rubén. [[alternative HTML version deleted]] From ju@n@@b@@o|o @end|ng |rom ehu@eu@ Wed Jul 9 19:07:59 2025 From: ju@n@@b@@o|o @end|ng |rom ehu@eu@ (Juan Abasolo) Date: Wed, 9 Jul 2025 19:07:59 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Hola, Rubén; Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el plugin SelectorGadget para los derivados de Chromium (Brave, Chrome, Opera....) te sirve para identificar cuál es la etiqueta específica para seleccionar los diferentes elementos de una página. Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver por esa vía (te tocaría ver algún tutorial). Suerte Juan Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita en gmail.com) erabiltzaileak (2025 uzt. 9(a), az. (16:56)): > Hola, buenas tardes, > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > siguiente código: > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > Autobahnpolizei)\n

'* > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > Una orientación de como hacerlo me vendría bien, muchas gracias de > antemano. > > PD: perdón que en els anterior mensaje se me olvidó poner un asunto. > -- > Rubén. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Juan Abasolo, PhD Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea Bilboko Hezkuntza Fakultatea Euskal Herriko Unibertsitatea EHU Sarriena auzoa z/g 48940 - Leioa (Bizkaia) T : (+34) 94 601 7567 Telegram: @JuanAbasolo Skype : abasolo72 Bloga : juanabasolo.netlify.app [[alternative HTML version deleted]] From j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com Wed Jul 9 22:55:32 2025 From: j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com (Javier Marcuzzi) Date: Wed, 9 Jul 2025 17:55:32 -0300 Subject: [R-es] (sin asunto) In-Reply-To: References: Message-ID: Buenas tardes Rubén Lo que usted desea no se puede, pero hay una solución. Primero, si selecciona el h2 lo que está dentro de esta etiqueta se selecciona. Segundo, lo que está mal es la selección, sin embargo, puede solucionar esta buscando y borrando el código El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez escribió: > > Hola, buenas tardes, > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > siguiente codigo: > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > Autobahnpolizei)\n

'* > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. > > -- > Rubén. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 23:01:12 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 23:01:12 +0200 Subject: [R-es] (sin asunto) In-Reply-To: References: Message-ID: Buenas noches Javier, Gracias por la respuesta, yo también lo había pensado. Creo que no me vale porque el span dentro del h2 no se repite en todos los casos. Rubén. El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi < javier.ruben.marcuzzi en gmail.com> va escriure: > Buenas tardes Rubén > > Lo que usted desea no se puede, pero hay una solución. Primero, si > selecciona el h2 lo que está dentro de esta etiqueta se selecciona. > Segundo, lo que está mal es la selección, sin embargo, puede solucionar > esta buscando y borrando el código podría repetir en todos los datos, por lo cuál el localizarlo y eliminarlo > sería una solución. > > Por lo cuál al restallado de rvest tendría que procesarlo con otro script > en R que limpie el código repetido en todos los registros. > > ¿Esa solución le es útil? > > Javier Marcuzzi > > > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez < > lagrimaescrita en gmail.com> escribió: > > > > Hola, buenas tardes, > > > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > > siguiente codigo: > > > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > > Autobahnpolizei)\n

'* > > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando > *span*. > > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > > > Una orientación de como hacerlo me vendría bien, muchas gracias de > antemano. > > > > -- > > Rubén. > > > > [[alternative HTML version deleted]] > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 23:03:54 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 23:03:54 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Buenas noches Juan, Gracias por la respuesta. Mañana miro a ver si me sirve esa herramienta. Un saludo Rubén. El dc., 9 de jul. 2025, 19:08, Juan Abasolo va escriure: > Hola, Rubén; > Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el > plugin SelectorGadget para los derivados de Chromium (Brave, Chrome, > Opera....) te sirve para identificar cuál es la etiqueta específica para > seleccionar los diferentes elementos de una página. > Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver > por esa vía (te tocaría ver algún tutorial). > > Suerte > Juan > > Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita en gmail.com) > erabiltzaileak (2025 uzt. 9(a), az. (16:56)): > >> Hola, buenas tardes, >> >> Estoy usando *rvest* para hacer webscraping y me surge una duda con el >> siguiente código: >> >> *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die >> Autobahnpolizei)\n

'* >> *x %>% read_html() %>% html_nodes(xpath = "//h2")* >> >> Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando >> *span*. >> En este ejemplo seria solo *Alerta Cobra. *He probado usando los >> típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. >> >> Una orientación de como hacerlo me vendría bien, muchas gracias de >> antemano. >> >> PD: perdón que en els anterior mensaje se me olvidó poner un asunto. >> -- >> Rubén. >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > -- > Juan Abasolo, PhD > > Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea > Bilboko Hezkuntza Fakultatea > Euskal Herriko Unibertsitatea EHU > > Sarriena auzoa z/g 48940 - Leioa (Bizkaia) > > T : (+34) 94 601 7567 > Telegram: @JuanAbasolo > Skype : abasolo72 > Bloga : juanabasolo.netlify.app > [[alternative HTML version deleted]]