[R-es] A vueltas con el encoding

Marcelino de la Cruz Rot m@rce||no@de|@cruz @end|ng |rom urjc@e@
Vie Jun 3 13:04:29 CEST 2022


Podría deberse a que no codificas el encoding de la manera adecuada o a 
que tu Windows no reconoce ese encoding.

Con iconvlist() puedes ver la lista de encodings que reconoce tu 
sistema. En el mío, ISO-8859-1 debería codificarse como "iso_8859_1".
Más sobre esto en ?iconv.

Marcelino



El 03/06/2022 a las 12:39, Isidro Hidalgo Arellano escribió:
> Acabo de descubrir que si especificas "latin1" en vez de "ISO-8859-1" funciona.
> Por favor, que alguien me lo explique...
> Mil gracias, os debo una cerveza XD
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo
> http://www.castillalamancha.es/
>
> -----Mensaje original-----
> De: R-help-es <> En nombre de Marcelino de la Cruz Rot
> Enviado el: viernes, 3 de junio de 2022 12:29
> Para: r-help-es using r-project.org
> Asunto: Re: [R-es] A vueltas con el encoding
>
> ¿Pero lo has usado con "latin1"?
>
> Yo lo he probado en Windows (R version 4.2.0 (2022-04-22 ucrt) -- "Vigorous Calisthenics") y me ha funcionado correctamente para leer palabras con tildes, ñ, etc.
>
> Marcelino
>
>
> El 03/06/2022 a las 12:24, Isidro Hidalgo Arellano escribió:
>> Ya lo había probado. Tampoco funciona. En Windows NO hace nada el encoding, es muy frustante.
>> Pero tenéis que tener este problema mucha gente, una burrada de
>> ficheros llevan caracteres latinos... ¿de verdad soy el único pardillo
>> al que le pasa? Jajajajaja Gracias
>>
>> Isidro Hidalgo Arellano
>> Observatorio del Mercado de Trabajo
>> Consejería de Economía, Empresas y Empleo
>> http://www.castillalamancha.es/
>>
>> -----Mensaje original-----
>> De: R-help-es <> En nombre de Marcelino de la Cruz Rot Enviado el:
>> viernes, 3 de junio de 2022 10:24
>> Para: r-help-es using r-project.org
>> Asunto: Re: [R-es] A vueltas con el encoding
>>
>> Hola Isidro:
>>
>> Yo creo que puedes solucionarlo con algo así:
>>
>> readLines(con <- file("fichero.txt", encoding = ""),
>> encoding="latin1")
>>
>> Es decir, especificando el encoding como "" en la connection e indicando el encoding del fichero en readLines.
>>
>> Lo cuentan en la sección "Encoding"  de ?connections.
>>
>> Un saludo,
>>
>> Marcelino
>>
>>
>>
>> El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:
>>> La  ltima versi n de R (4.2.0. patched), a la que estoy cogiendo una
>>> man a nada despreciable, no me carga correctamente ficheros de texto
>>> latinos (con  є y otros caracteres) aunque especifique el encoding ISO-8859-1.
>>>
>>> Obtengo el mismo resultado con  readLines(fichero)  que con
>>>    readLines(fichero, encoding =  ISO-8859-1 ) .
>>>
>>> Por ejemplo, estas l neas me las carga as :
>>>
>>>     
>>>
>>> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
>>> ACTIVOS)"
>>>
>>> [2] "                                          MES:        MAYO     A\xd1O:
>>> 2022"
>>>
>>>     
>>>
>>>     cuando el contenido del fichero es  ste:
>>>
>>>     
>>>
>>> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
>>> ACTIVOS)"
>>>
>>> [2] "                                          MES:        MAYO     A O:
>>> 2022"
>>>
>>>     
>>>
>>> En las notas oficiales de la nueva versi n se hace referencia a que
>>> se ha cambiado algo para que en Windows se utilice por defecto UTF-8.
>>> Me parece perfecto, pero si especificas un juego de caracteres espec
>>> fico, R deber a ser obediente,  no?
>>>
>>>     
>>>
>>> No es un problema de RStudio, he comprobado que R 4.1.3. a pelo
>>> funciona perfectamente, pero R 4.2.0. patched falla, no hace caso del
>>> encoding
>>>
>>>     
>>>
>>> A ver si pod is ayudarme, please. Gracias
>>>
>>>
>>> 	[[alternative HTML version deleted]]
>>>
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es using r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> --
>> Marcelino de la Cruz Rot
>> Depto. de Biología y Geología
>> Física y Química Inorgánica
>> Universidad Rey Juan Carlos
>> Móstoles España
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es using r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>> .
>
> --
> Marcelino de la Cruz Rot
> Depto. de Biología y Geología
> Física y Química Inorgánica
> Universidad Rey Juan Carlos
> Móstoles España
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> .


-- 
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España



Más información sobre la lista de distribución R-help-es