[R-es] A vueltas con el encoding

Isidro Hidalgo Arellano |h|d@|go @end|ng |rom jccm@e@
Vie Jun 3 12:25:30 CEST 2022


El problema es en Windows, sí, ya veo que en Mac no pasa.

Gracias

 

Isidro Hidalgo Arellano

Observatorio del Mercado de Trabajo

Consejería de Economía, Empresas y Empleo

http://www.castillalamancha.es/

 

De: Carlos Ortega <> 
Enviado el: viernes, 3 de junio de 2022 10:02
Para: Isidro Hidalgo Arellano <ihidalgo using jccm.es>
CC: Lista R <r-help-es using r-project.org>
Asunto: Re: [R-es] A vueltas con el encoding

 

Hola,

 

No es Windows.... y creo que no he instalado esa versión parcheada, no sé si existe para Mac...

Con "UTF-8" y "Latin-1" me funciona sin problemas.

 

> readLines("fichero.txt", encoding = "UTF-8")
[1] "[1] \"             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES."   
[2] "ACTIVOS)\"               "                                                
[3] ""                                                                         
[4] "[2] \"                                          MES:        MAYO     AÑO:"
[5] "2022\"            "                                                       
Warning message:
In readLines("fichero.txt", encoding = "UTF-8") :
  incomplete final line found on 'fichero.txt'
> readLines("fichero.txt", encoding = "Latin-1")
[1] "[1] \"             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES."   
[2] "ACTIVOS)\"               "                                                
[3] ""                                                                         
[4] "[2] \"                                          MES:        MAYO     AÑO:"
[5] "2022\"            "                                                       
Warning message:
In readLines("fichero.txt", encoding = "Latin-1") :
  incomplete final line found on 'fichero.txt'
> version
               _                           
platform       x86_64-apple-darwin17.0     
arch           x86_64                      
os             darwin17.0                  
system         x86_64, darwin17.0          
status                                     
major          4                           
minor          2.0                         
year           2022                        
month          04                          
day            22                          
svn rev        82229                       
language       R                           
version.string R version 4.2.0 (2022-04-22)
nickname       Vigorous Calisthenics   

 

Gracias,

Carlos Ortega

http://secure-web.cisco.com/1ESgn7BOIhx4dz8dHh5dGz0vD6MpY3v8uGkuIEpCUgTf-IiFQTa3-s8QqjaOJNL6eMN8lFTneyXV1_20ssfyZs_Y4dVRU0jFbiqdThu0q6TsoK-ATgHBqLIiIVQLycgW7NjRU36XqXpm6WTTEye23lgIhwJQp71whLgZTSk3VvZQySfE2rE4rbPIXIUWWPAFwXfD3urSFgqJI6XM9R6bVq1LgYmsRrWnT2d8UztCVRdGp8MkyjpD6_TVxgbhwfv0S7a8d4h2FupO7GFReZWswuzLXSTrWJnX4RXOE8YMrNk_zAwOUwqR8OdlkkTaVed64RF5C6LzUYsW3Tz10UiUOsA/http%3A%2F%2Fwww.qualityexcellence.es

 

El vie, 3 jun 2022 a las 9:39, Isidro Hidalgo Arellano (<ihidalgo using jccm.es <mailto:ihidalgo using jccm.es> >) escribió:

La última versión de R (4.2.0. patched), a la que estoy cogiendo una manía
nada despreciable, no me carga correctamente ficheros de texto latinos (con
“Ñ” y otros caracteres) aunque especifique el encoding ISO-8859-1.

Obtengo el mismo resultado con “readLines(fichero)” que con
“readLines(fichero, encoding = “ISO-8859-1”)”.

Por ejemplo, estas líneas me las carga así…:



[1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
ACTIVOS)"               

[2] "                                          MES:        MAYO     A\xd1O:
2022"            



… cuando el contenido del fichero es éste:



[1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
ACTIVOS)"               

[2] "                                          MES:        MAYO     AÑO:
2022"            



En las notas oficiales de la nueva versión se hace referencia a que se ha
cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece
perfecto, pero si especificas un juego de caracteres específico, R debería
ser obediente, ¿no?



No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona
perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding…



A ver si podéis ayudarme, please. Gracias


        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es using r-project.org <mailto:R-help-es using r-project.org> 
https://stat.ethz.ch/mailman/listinfo/r-help-es



-- 

Saludos,
Carlos Ortega
http://secure-web.cisco.com/1ESgn7BOIhx4dz8dHh5dGz0vD6MpY3v8uGkuIEpCUgTf-IiFQTa3-s8QqjaOJNL6eMN8lFTneyXV1_20ssfyZs_Y4dVRU0jFbiqdThu0q6TsoK-ATgHBqLIiIVQLycgW7NjRU36XqXpm6WTTEye23lgIhwJQp71whLgZTSk3VvZQySfE2rE4rbPIXIUWWPAFwXfD3urSFgqJI6XM9R6bVq1LgYmsRrWnT2d8UztCVRdGp8MkyjpD6_TVxgbhwfv0S7a8d4h2FupO7GFReZWswuzLXSTrWJnX4RXOE8YMrNk_zAwOUwqR8OdlkkTaVed64RF5C6LzUYsW3Tz10UiUOsA/http%3A%2F%2Fwww.qualityexcellence.es


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es