[R-es] ¿Qué hace as.numeric()?

Carlos Ortega cof en qualityexcellence.es
Vie Ago 5 06:26:41 CEST 2016


Hola Mauricio,

Para hacer alguna prueba más, yo lo único que echo de menos es que nos
pudieras dar un "ejemplo reproducible" y para esto no hay nada mejor que
nos pases una parte representativa del conjunto de datos.

Además de lo ya expuesto, se pueden utilizar otras alternativas de lectura
del fichero a la de "read.table()", por ejemplo la que ofrece "fread()" del
paquete "data.table" o la "read_csv()" del paquete "readr". En los que no
hace falta declarar a priori el tipo de cada columna ya que automática los
infieren de una lectura inicial (200-300 líneas).

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 5 de agosto de 2016, 5:04, <javier.ruben.marcuzzi en gmail.com> escribió:

> Estimado Mauricio Monsalvo
>
> ¿Puede usar esos datos importados a una base de datos? Por ejemplo en
> mysql un código como puede ser:
> SELECT email, COUNT(*) Total
> FROM clientes
> GROUP BY email
> HAVING COUNT(*) > 1
>
> Para buscar los duplicados (en este caso correos electrónicos), la idea es
> conocer las variables y cantidades, una vez que las conoce puede actualizar
> para ir normalizando los datos (desde el punto de vista de la base de
> datos). Luego solo tendría un problema, conocer los decimales, pero eso ya
> fue resuelto anteriormente por la base de datos al importar los datos, o
> fueron importados como cadena (varchar, etc.). En ese caso tendría unas
> nuevas columnas que llenaría con consultas.
>
> Cuándo pueda tener los datos bien almacenados, recién piense en
> importarlos a R, datos mal almacenados son casi imposible de recuperar en R.
>
> Por desgracia datos mal almacenados es algo común, ¿puede ingresar al
> almacenamiento a un nivel más adecuado?, me refiero a algo más próximo a
> los originales para poder usted mismo acomodarlos para luego exportarlos a
> R.
>
> Otra forma pero que requiere conocimientos de programación, es leer el
> archivo desde un lenguaje de programación, C#, Java, C++, F, y acomodar
> desde alguno de estos, pero para eso también debería conocer muy bien como
> acomodar los datos, sería muy sencillo cometer un error lógico (hay
> resultados procesados correctamente, pero obteniendo valores inadecuados,
> por el error de lógica).
>
> Javier Rubén Marcuzzi
>
> De: Mauricio Monsalvo
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es