[R-es] A vueltas con el encoding
Marcelino de la Cruz Rot
m@rce||no@de|@cruz @end|ng |rom urjc@e@
Vie Jun 3 10:24:05 CEST 2022
Hola Isidro:
Yo creo que puedes solucionarlo con algo así:
readLines(con <- file("fichero.txt", encoding = ""), encoding="latin1")
Es decir, especificando el encoding como "" en la connection e indicando
el encoding del fichero en readLines.
Lo cuentan en la sección "Encoding" de ?connections.
Un saludo,
Marcelino
El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:
> La �ltima versi�n de R (4.2.0. patched), a la que estoy cogiendo una man�a
> nada despreciable, no me carga correctamente ficheros de texto latinos (con
> �є y otros caracteres) aunque especifique el encoding ISO-8859-1.
>
> Obtengo el mismo resultado con �readLines(fichero)� que con
> �readLines(fichero, encoding = �ISO-8859-1�)�.
>
> Por ejemplo, estas l�neas me las carga as�:
>
>
>
> [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] " MES: MAYO A\xd1O:
> 2022"
>
>
>
> � cuando el contenido del fichero es �ste:
>
>
>
> [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] " MES: MAYO A�O:
> 2022"
>
>
>
> En las notas oficiales de la nueva versi�n se hace referencia a que se ha
> cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece
> perfecto, pero si especificas un juego de caracteres espec�fico, R deber�a
> ser obediente, �no?
>
>
>
> No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona
> perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding�
>
>
>
> A ver si pod�is ayudarme, please. Gracias
>
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España
Más información sobre la lista de distribución R-help-es