[R-es] sql codificación R

"Marcuzzi, Javier Rubén" javier.ruben.marcuzzi en gmail.com
Vie Ago 29 15:51:59 CEST 2014


Estimado Carlos

Eso funcionaría y no funcionaría, porque con los mismos datos estoy 
realizando dos trabajos, en el segundo podría convertir el fichero de 
salida, pero en el primero me resulta raro y creo que se me complica.

La base de datos esta codificada como UTF-8-general-ci, linux es UTF-8 
(creo).

El archivo de R está en UTF8 y al ejecutarlo sale lo siguiente:

 > datos <- dbSendQuery(con, "SELECT * FROM usuario.usuario;")
 > data <- fetch(datos, n = -1)
 > data
   idusuario   nombre
1         1   Javier
2         2 Rub\xe9n

Donde resulta claro el problema con el acento en mi segundo nombre 
(Rubén - \xe9).

En el caso de la salida a json podría convertir el archivo (file -i 
...), porque esa es lo que utilizo cuándo tengo más de 1000 registros 
(problemas de exportación con mysql workbench), y utilizo esos datos en 
json para leer desde otro software (bueno, va dentro de archivos que se 
compilan (más o menos).

En el caso de continuar el trabajo en R y generar informes con Sweave no 
sabría como solucionar el problema con las palabras acentuadas cuándo 
los registros son leídos desde la base de datos.

Una alternativa es exportar cada consulta desde la base de datos a csv, 
importar este a R, ... muchos archivos. Pero en pruebas que ya había 
realizado para planificar el trabajo, este problema no existía, y la 
verdad que prefiero trabajar los datos con sql a R, me resulta más 
sencillo para realizar consultas, acomodar datos, etc.

Javier Marcuzzi


El 29/08/14 a las 08:24, Carlos Ortega escibió:
> Hola,
>
> Ya que trabajas sobre Ubuntu, puedes lanzar desde tu programa en R una 
> consulta al sistema y antes de procesar fichero comprobar el encoding 
> del fichero con el comando "*file -i*" y su salida capturarla y 
> procesarla en R.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es <http://www.qualityexcellence.es>
>
>
> El 29 de agosto de 2014, 12:57, Carlos J. Gil Bellosta 
> <cgb en datanalytics.com <mailto:cgb en datanalytics.com>> escribió:
>
>     Hola, ¿qué tal?
>
>     Los documentos de JSON tienen que estar codificados en UTF8.
>
>     Probablemente, la tabla que generas con tu consulta tiene caracteres
>     codificados de otra manera. ?iconv es tu amigo. Una manera
>     rudimentaria pero práctica de comprobar la codificación de un fichero
>     determinado es tratar de abrirlo con un navegador de los que te
>     permiten cambiar el "encoding".
>
>     Un saludo,
>
>     Carlos J. Gil Bellosta
>     http://www.datanalytics.com
>
>     El día 28 de agosto de 2014, 23:18, "Marcuzzi, Javier Rubén"
>     <javier.ruben.marcuzzi en gmail.com
>     <mailto:javier.ruben.marcuzzi en gmail.com>> escribió:
>     > Estimados
>     >
>     > Les envío dos archivos, el primero es mysql, el segundo es el
>     código R. A
>     > ambos los ejecuté en ubuntu 14.04, anteriormente en mi script
>     tenía anotado,
>     > se ve feo pero anda, esto es referente a los acentos, hoy se ve feo
>     > (codificado no en español) y rjson produce un error, básicamente
>     me informa
>     > que no es UFT-8.
>     >
>     > Desconozco que pasa, ¿alguna idea?
>     >
>     > Desde ya muchas gracias.
>     > Javier Rubén Marcuzzi
>     >
>     > _______________________________________________
>     > R-help-es mailing list
>     > R-help-es en r-project.org <mailto:R-help-es en r-project.org>
>     > https://stat.ethz.ch/mailman/listinfo/r-help-es
>     >
>
>     _______________________________________________
>     R-help-es mailing list
>     R-help-es en r-project.org <mailto:R-help-es en r-project.org>
>     https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
>
> -- 
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es <http://www.qualityexcellence.es>


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es