[R-es] [Antes sin asunto] espacios en celdas excel y table

Alfredo Alvarado david.alvarado.r en gmail.com
Mie Ago 13 19:18:52 CEST 2014


Buenas tardes tengan todos. Un saludo a todo el grupo.
Muchas gracias por las orientaciones Jorge y Julio..
Efectivamente, el problema era que las celdas de excel no estaban del
todo homogéneas. Me toco algo de trabajo manual al respecto.
Con respecto a la opción de eliminar espacios, que era uno de los
problemas, y ya cuando superé el tema de las diferencias de tipeo, o
de cómo plasmaron la información en excel quienes la recopilaron, es
strip.white=TRUE, del comando o función table.

read.table(file.choose(), header = TRUE, sep =";", strip.white = TRUE)

Nuevamente agradecido por las orientaciones.





>Jorge I Velez <jorgeivanvelez en gmail.com>
>
>11 de ago. (hace 2 días)
>
>Hola Alfredo,
>
>Algunos comentarios/observaciones:
>
>1.  No uses attach.  Mejor, explora la funcion with() y/o within().  attach es muy peligroso.
>2.  Solo por curiosidad, como hiciste para crear la tabla usando
>latabla$ciudad de origen?  Supongo que deberia ser latabla$"ciudad de origen"
>3.  Lo que observas, tiene que ver con que en tus datos hay espacios "escondidos".  Una forma de resolver este problema (desde R) es >utilizando el paquete stringr y la funcion str_trim.  Hay dos ejemplos en la ayuda;  creo que el primero de ellos ilustra lo que ocurre en tu >caso.
>
>Saludos cordiales,
>Jorge.-
>
>

2014-08-12 8:09 GMT+10:00 Alfredo Alvarado <david.alvarado.r en gmail.com>:
>
> Buenas tardes grupo, un saludo.
> Busco su amable ayuda en los siguiente:
> Tengo una tabla con alrededor de 20 variables en columnas.
> La tabla proviene de un excel convertido en csv.
> Estoy tomando dos variables: la columna correspondiente a "ciudad de
> origen" y "apellido" de la persona.
> hago:
> attach(latabla)
> y luego names(latabla), y me da las variables que digo, latabla$ciudad
> de origen, y latabla$apellido.
> Quiero ver las dos columnas para ver de acuerdo a la ciudad de origen
> las frecuencias de los apellidos registrados:
> table(latabla$ciudad de origen, latabla$apellido)
>
> Me da, efectivamente la tabla que quiero, en las filas la ciudad de
> origen, en las columnas los apellidos, y en los campos, la frecuencia
> de apellidos por ciudad de origen.
> Sin embargo, la pregunta que tengo es que la tabla resultante genera
> una fila sin nombre, y una columna sin nombre, la primera fila y la
> primera columna, y le asigna un valor de 1, como si hubiera un dato, y
> al resto 0. Es decir, como si ese campo vacío con esa columna vacía
> generara un valor.
> He revisado la tabla, la he cambiado, pero no logrop quitarle eso.
> Por otra parte, y aún más importante, algunas ciudades, no todas, (de
> 58, sólo 2), las repite como nombres de filas diferentes, aunque se
> trata del mismo nombre, lo coloca como si se tratara de dos distintos.
> Le cambié el nombre en excel y sigue haciendo lo mismo.
> No tengo idea del por qué sucede esto último. Las otras ciudades las
> usa como una sola fila y coloca los valores, a excepción de esas dos
> ciudades que las divide como si fueran diferentes, y las pone una
> debajo de la otra, dos veces el mismo nombre.
> ¿Alguna idea que puedan ofrecerme al respecto?
> De antemano, gracias a todos-.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

Julio Di Rienzo <dirienzo.julio en gmail.com>

12 de ago. (hace 1 día)


para mí
Alfredo fíjate si table no tiene un argumento como na.omit y en tal
caso ponerlo en TRUE

Enviado desde mi iPad



Más información sobre la lista de distribución R-help-es