[R-es] A vueltas con el encoding

Isidro Hidalgo Arellano |h|d@|go @end|ng |rom jccm@e@
Vie Jun 3 12:24:41 CEST 2022


Ya lo había probado. Tampoco funciona. En Windows NO hace nada el encoding, es muy frustante.
Pero tenéis que tener este problema mucha gente, una burrada de ficheros llevan caracteres latinos... ¿de verdad soy el único pardillo al que le pasa? Jajajajaja
Gracias

Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
http://www.castillalamancha.es/

-----Mensaje original-----
De: R-help-es <> En nombre de Marcelino de la Cruz Rot
Enviado el: viernes, 3 de junio de 2022 10:24
Para: r-help-es using r-project.org
Asunto: Re: [R-es] A vueltas con el encoding

Hola Isidro:

Yo creo que puedes solucionarlo con algo así:

readLines(con <- file("fichero.txt", encoding = ""), encoding="latin1")

Es decir, especificando el encoding como "" en la connection e indicando el encoding del fichero en readLines.

Lo cuentan en la sección "Encoding"  de ?connections.

Un saludo,

Marcelino



El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:
> La  ltima versi n de R (4.2.0. patched), a la que estoy cogiendo una 
> man a nada despreciable, no me carga correctamente ficheros de texto 
> latinos (con  є y otros caracteres) aunque especifique el encoding ISO-8859-1.
>
> Obtengo el mismo resultado con  readLines(fichero)  que con 
>  readLines(fichero, encoding =  ISO-8859-1 ) .
>
> Por ejemplo, estas l neas me las carga as :
>
>   
>
> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] "                                          MES:        MAYO     A\xd1O:
> 2022"
>
>   
>
>   cuando el contenido del fichero es  ste:
>
>   
>
> [1] "             ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] "                                          MES:        MAYO     A O:
> 2022"
>
>   
>
> En las notas oficiales de la nueva versi n se hace referencia a que se 
> ha cambiado algo para que en Windows se utilice por defecto UTF-8. Me 
> parece perfecto, pero si especificas un juego de caracteres 
> espec fico, R deber a ser obediente,  no?
>
>   
>
> No es un problema de RStudio, he comprobado que R 4.1.3. a pelo 
> funciona perfectamente, pero R 4.2.0. patched falla, no hace caso del 
> encoding 
>
>   
>
> A ver si pod is ayudarme, please. Gracias
>
>
> 	[[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es


--
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España

_______________________________________________
R-help-es mailing list
R-help-es using r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es