[R-es] NA's

daniel daniel319 en gmail.com
Mie Jul 25 14:32:53 CEST 2012


Creo que Luciano puede estar en lo correcto y el problema esta en los
datos. Qué te da str(C_L_J_1) y options()$stringsAsFactors.

Daniel Merino



El 24 de julio de 2012 20:03, Marcuzzi, Javier Rubén <
javier.ruben.marcuzzi en gmail.com> escribió:

>   Estimado Luciano Selzer
>
> Los datos son leídos con
> C_L_0<- read.csv("~/Tambos/Control_RP.txt")
>
> El archivo txt es generado como resultado a una consulta en base de datos.
>
> A partir de este realizo varias líneas de código, donde una línea en
> particular toma dos fechas y calcula la diferencia entre estas. Como
> resultado hay 18 registros de 80516 que dan NA, porque falta una fecha.
>
> La búsqueda de los NA son dentro de un data.frame, donde hay algo de
> información en otra columna, puesto que anteriormente todos los controles
> que tienen leche cero o NA los hago valer uno, pero no los uso, tomo
> solamente los mayores a 5, colocar un summary sería enviar muchos datos sin
> sentido, pero hay variables donde todo tiene información, nada de NA.
>
> Hay fechas donde “no” hay información, el animal podía estar en el listado
> predefinido pero al ir al campo estaba muerto, por eso que elimino los NA
> antes. Pero es ilógico un control, que se realizó a campo, se pago por él,
> en algunos casos intervino un análisis de laboratorio, y no anotaron el
> día. Estadísticamente 18 contra 80516 tiene poca o nada que ver, pero para
> mí es un dato muy importante, ¿que paso?, ¿descuido, error de escritura,
> problema en el software?, esos NA son algo de 5000 euros (en leche) sin
> fecha. Posiblemente esa parte puntual de calidad de datos no es muy
> importante en términos estadísticos, como sí son otros problemas que puede
> documentar, pero sin dudas es lo más fácil de mostrar.
>
> Javier
>
>  *From:* Luciano Selzer <luciano.selzer en gmail.com>
> *Sent:* Tuesday, July 24, 2012 7:27 PM
> *To:* Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com>
> *Cc:* r-help-es en r-project.org
> *Subject:* Re: [R-es] NA's
>
> Capaz que esos son los NA. Pienso que pueden ser filas vacias. Que usaste
> para leer los datos? read.table?
> Luciano
>
>
> El 24 de julio de 2012 18:24, Marcuzzi, Javier Rubén <
> javier.ruben.marcuzzi en gmail.com> escribió:
>
>>   Estimado Julio Di Rienzo
>>
>> Muchas gracias por su sugerencia, pero creo que en mi contexto no sería
>> aplicable, cambiaría los NA por TRUE o FALSE, no se si se ve mi captura de
>> pantalla, esos registros tienen su origen en controles lecheros, y como
>> ambos somos de Argentina usted debe conocer que no siempre al laboratorio
>> le solicitan análisis de proteína, es decir hay muchos NA, mi intención es
>> informar los animales que tienen NA en los días de lactancia, es decir, le
>> realizaron un control lechero con o sin análisis fisicoquímico, pero no
>> registraron el día del control, son muy pero muy pocos datos en relación a
>> la cantidad que tengo, pero bueno, es lo que hay.
>>
>> Es bueno utilizar R o su software, InfoStat, que en una oportunidad me
>> cedió por un problema que tuve en mi facultad, sin embargo, la calidad de
>> los datos es indispensable independientemente del análisis posterior. Deseo
>> informar algunos problemas de datos previo a mi análisis, por eso que
>> busque los NA.
>>
>> Javier
>>
>>  *From:* Julio Alejandro Di Rienzo <dirienzo.julio en gmail.com>
>> *Sent:* Tuesday, July 24, 2012 4:57 PM
>> *To:* Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com>
>> *Cc:* r-help-es en r-project.org
>> *Subject:* Re: [R-es] NA's
>>
>>  Javier proba con
>>
>> complete.cases(cosas)
>> te devuelve un vector booleano
>>
>> Prof. Julio Di Rienzo
>> Estadística y Biometría
>> FCA- U.N. Córdoba
>> IBS-RARG President
>> http://sites.google.com/site/juliodirienzo
>> "Biometry, the active pursuit of biological
>> knowledge by quantitative methods."
>> (R.A. Fisher, 1948)
>>
>>
>>
>> 2012/7/24 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com>
>>
>>>   Buenas tardes
>>>
>>> Les consulto los siguiente, dentro de unos datos hay registros
>>> faltantes, estos son NA.
>>>
>>> Me gustaría poder avisar cuáles son los registros no tomados en cuenta
>>> porque son NA.
>>>
>>> Como no puedo reproducir el error, copio y pego un script R que es la
>>> forma que yo razone, la cuál me funciona, y un trozo de la captura de
>>> pantalla donde aparece mi error, es decir todo NA.
>>>
>>> #   NA's
>>> persona <- c('javier', 'ruben', 'marcuzzi')
>>> bici <- c(1,1,3)
>>> auto <- c(NA,1,1)
>>> cosas <- data.frame(persona, bici, auto)
>>> cosas
>>> no_NA_auto <- cosas[!is.na(cosas$auto),]
>>> no_NA_auto
>>> si_NA_auto <- cosas[is.na(cosas$auto),]
>>> si_NA_auto
>>>
>>> [image: image]
>>> ¿Que significa eso? Algo no anda, ¿que puede ser?
>>>
>>> Javier Marcuzzi
>>>
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Daniel
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120725/8c603625/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/png
Size: 206830 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120725/8c603625/attachment-0001.png>


Más información sobre la lista de distribución R-help-es