[R-es] Búsqueda de palabras en una variable de R

Freddy Omar López Quintero freddy.vate01 en gmail.com
Mar Nov 28 03:50:19 CET 2017


El mar, 28-11-2017 a las 03:42 +0100, miriam.alzate en unavarra.es
escribió:
> Tengo un vector de 40 palabras (marca) y necesito saber si en una de
> las
> variables del data.frame (datos) se incluye alguna de esas 40
> palabras. Si
> se incluye alguna de ellas, me gustaría crear una variable dummy
> siendo 1
> que incluye alguna palabra y 0 que no incluye.
> 
> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?

Lo que describes luce como minería de texto y lo que parece que quieres
es una porción de la matriz que llaman Term-Document Matrix. El paquete
por excelencia para estos menesteres es tm:

https://cran.r-project.org/web/packages/tm/

que tiene su buena viñeta

https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf

Ojalá sirva.

Saludos.


-- 
«...homines autem hominum causa esse generatos...»

Cicero
	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es