[R-es] Identificar todos los repetidos y "marcarlos".

Carlos J. Gil Bellosta cgb @end|ng |rom d@t@n@|yt|c@@com
Sab Mayo 18 20:44:30 CEST 2019


Afortunadamente, en R no hay una función para cada cosa que a uno se le
ocurra hacer. El diccionario de funciones sería infinito.

Lo que quieres hacer es una línea de código:

library(plyr)
tmp <- iris

res <- ddply(tmp, .(Species), transform, reps = count(Species))

En "reps" tienes el número de veces que se repite cada "id" y puedes hacer
lo que quieras con esas filas donde reps > 1.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El sáb., 18 may. 2019 a las 19:07, Samura . (<tontito82 using hotmail.com>)
escribió:

> Hola,
> gracias por la respuesta.
>
> Por como funciona "duplicate" el dato original que se repite no lo marca,
> y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame
> con todos dnis  repetidos y ver en que se diferencian observando el resto
> de variables.
>
> Al final lo he resuelto de una manera un poco artesanal, obteniendo los
> dnis unicos de los duplicados y filtrando
> pero pensaba que habria alguna funcion que te diera todos los repetidos de
> golpe.
>
> Un saludo.
>
> ________________________________
> De: Salvador Castillo Raya <casraysa using hotmail.com>
> Enviado: sábado, 18 de mayo de 2019 0:31
> Para: Samura .; r-help-es using r-project.org
> Asunto: RE: Identificar todos los repetidos y "marcarlos".
>
>
> Hola,
>
>
>
> Te serviría algo así:
>
>
>
> df <- data.frame(x=c(1, 1, 4, 5, 4, 6))
>
>
>
> df <- cbind(df, ind_duplicado = as.integer(duplicated(df)))
>
>
>
> df_sindup <-subset(df, ind_duplicado == 0)
>
>
>
> Saludos.
>
>
>
> ________________________________
> From: R-help-es <r-help-es-bounces using r-project.org> on behalf of Samura . <
> tontito82 using hotmail.com>
> Sent: Saturday, May 18, 2019 2:10:37 AM
> To: r-help-es using r-project.org
> Subject: [R-es] Identificar todos los repetidos y "marcarlos".
>
> Hola,
> Tengo la siguiente duda:
> �existe algo parecido a identificar casos repetidos en R al estilo de como
> lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos)
>
> Estoy probando con "duplicated" pero no es lo que busco.
>
>
> Gracias.
>
>         [[alternative HTML version deleted]]
>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es