[R-es] A vueltas con el encoding

Isidro Hidalgo Arellano |h|d@|go @end|ng |rom jccm@e@
Vie Jun 3 13:23:04 CEST 2022


Vaya tela. "latin1" en mi máquina debe especificarse alternativamente con "iso_8859-1", yo lo estaba especificando con "ISO-8859-1".
Utilizaré "latin1" a partir de ahora.
De verdad, mil gracias, Marcelino.

AVISO A NAVEGANTES... hay funciones que no usan el parámetro "encoding =", sino "fileEncoding =". Un ejemplo es "read.fwf()", que utilizo a menudo. En Windows, con la versión 4.2.0 patched TENEMOS QUE ESPECIFICAR SIEMPRE EL JUEGO DE CARACTERES

Saludos a todos,

Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
http://www.castillalamancha.es/

-----Mensaje original-----
De: R-help-es <> En nombre de Marcelino de la Cruz Rot
Enviado el: viernes, 3 de junio de 2022 13:04
Para: r-help-es using r-project.org
Asunto: Re: [R-es] A vueltas con el encoding

Podría deberse a que no codificas el encoding de la manera adecuada o a que tu Windows no reconoce ese encoding.

Con iconvlist() puedes ver la lista de encodings que reconoce tu sistema. En el mío, ISO-8859-1 debería codificarse como "iso_8859_1".
Más sobre esto en ?iconv.

Marcelino



El 03/06/2022 a las 12:39, Isidro Hidalgo Arellano escribió:
> Acabo de descubrir que si especificas "latin1" en vez de "ISO-8859-1" funciona.
> Por favor, que alguien me lo explique...
> Mil gracias, os debo una cerveza XD
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo 
> http://www.castillalamancha.es/
>
> -----Mensaje original-----
> De: R-help-es <> En nombre de Marcelino de la Cruz Rot Enviado el: 
> viernes, 3 de junio de 2022 12:29
> Para: r-help-es using r-project.org
> Asunto: Re: [R-es] A vueltas con el encoding
>
> ¿Pero lo has usado con "latin1"?
>
> Yo lo he probado en Windows (R version 4.2.0 (2022-04-22 ucrt) -- "Vigorous Calisthenics") y me ha funcionado correctamente para leer palabras con tildes, ñ, etc.
>
> Marcelino
>
>
> El 03/06/2022 a las 12:24, Isidro Hidalgo Arellano escribió:
>> Ya lo había probado. Tampoco funciona. En Windows NO hace nada el encoding, es muy frustante.
>> Pero tenéis que tener este problema mucha gente, una burrada de 
>> ficheros llevan caracteres latinos... ¿de verdad soy el único 
>> pardillo al que le pasa? Jajajajaja Gracias
>>
>> Isidro Hidalgo Arellano
>> Observatorio del Mercado de Trabajo
>> Consejería de Economía, Empresas y Empleo 
>> http://www.castillalamancha.es/
>>
>> -----Mensaje original-----
>> De: R-help-es <> En nombre de Marcelino de la Cruz Rot Enviado el:
>> viernes, 3 de junio de 2022 10:24
>> Para: r-help-es using r-project.org
>> Asunto: Re: [R-es] A vueltas con el encoding
>>
>> Hola Isidro:
>>
>> Yo creo que puedes solucionarlo con algo así:
>>
>> readLines(con <- file("fichero.txt", encoding = ""),
>> encoding="latin1")
>>
>> Es decir, especificando el encoding como "" en la connection e indicando el encoding del fichero en readLines.
>>
>> Lo cuentan en la sección "Encoding"  de ?connections.
>>
>> Un saludo,
>>
>> Marcelino
>>
>>
>>
>> El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:
>>> La  ltima versi n de R (4.2.0. patched), a la que estoy cogiendo una 
>>> man a nada despreciable, no me carga correctamente ficheros de texto 
>>> latinos (con  є y otros caracteres) aunque especifique el encoding ISO-8859-1.
>>>
>>> Obtengo el mismo resultado con  readLines(fichero)  que con
>>>    readLines(fichero, encoding =  ISO-8859-1 ) .
>>>
>>> Por ejemplo, estas l neas me las carga as :
>>>
>>>     
>>>
>>> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
>>> ACTIVOS)"
>>>
>>> [2] "                                          MES:        MAYO     A\xd1O:
>>> 2022"
>>>
>>>     
>>>
>>>     cuando el contenido del fichero es  ste:
>>>
>>>     
>>>
>>> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
>>> ACTIVOS)"
>>>
>>> [2] "                                          MES:        MAYO     A O:
>>> 2022"
>>>
>>>     
>>>
>>> En las notas oficiales de la nueva versi n se hace referencia a que 
>>> se ha cambiado algo para que en Windows se utilice por defecto UTF-8.
>>> Me parece perfecto, pero si especificas un juego de caracteres espec 
>>> fico, R deber a ser obediente,  no?
>>>
>>>     
>>>
>>> No es un problema de RStudio, he comprobado que R 4.1.3. a pelo 
>>> funciona perfectamente, pero R 4.2.0. patched falla, no hace caso 
>>> del encoding
>>>
>>>     
>>>
>>> A ver si pod is ayudarme, please. Gracias
>>>
>>>
>>> 	[[alternative HTML version deleted]]
>>>
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es using r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> --
>> Marcelino de la Cruz Rot
>> Depto. de Biología y Geología
>> Física y Química Inorgánica
>> Universidad Rey Juan Carlos
>> Móstoles España
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es using r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>> .
>
> --
> Marcelino de la Cruz Rot
> Depto. de Biología y Geología
> Física y Química Inorgánica
> Universidad Rey Juan Carlos
> Móstoles España
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> .


--
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España

_______________________________________________
R-help-es mailing list
R-help-es using r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es