[R-es] buscar y reemplazar tabs dentro de un archivo

Javier Marcuzzi javier.ruben.marcuzzi en gmail.com
Mar Mayo 17 23:19:35 CEST 2016


Estimado Eric

Las filas que faltan, ¿son filas enteras, donde todo es valor NA o “” en un data.frame?

Porque si es así podrías importar todo y luego buscar (filtrar) los que no son NA.

Copio y pego un código que utilizo en un trabajo, posiblemente le sea útil.

Tratamientos$Tratamiento[Tratamientos$Tratamiento == ""] <- NA  # asignar NA a las celdas vacías
Tratamientos<- Tratamientos[ !is.na(Tratamientos$Tratamiento),]    #Solo dejo filas en las que las tratamiento son diferentes de cero

Javier Rubén Marcuzzi

De: ja palazon
Enviado: martes, 17 de mayo de 2016 18:06
Para: r-help-es en r-project.org
Asunto: Re: [R-es] buscar y reemplazar tabs dentro de un archivo

Usa la función system para desde R usar las herramientas del sistema.

On 17/05/16 16:13, eric wrote:
> Hola Jose, muchas gracias por la sugerencia, no conocia la existencia 
> de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo 
> para no tener que escribir algo en otro lenguaje, porque te refieres a 
> "sed" en linux, no ? y tambien por lo mucho mejor que es un script que 
> hacerlo a mano, considerando que son varios cientos de archivos ... 
> voy a probar con un script de bash a ver si me funciona.
>
> Muchas gracias a todos,
>
> Saludos, Eric.
>
>
>
>
>
>
>
>
>
>
> On 05/15/2016 11:57 AM, JA Palazón wrote:
>> Hola
>>
>> Lo más sencillo es utilizar sed, desde la línea de comandos:
>>
>> sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat
>>
>> Alternativa: usa la hoja de cálculo de libre office te da
>> la opción de eliminar repeticiones de separador de campos.
>>
>> Espero que te sirva
>>
>> El 14/05/16 a las 18:58, eric escribió:
>>> Estimados, tengo el siguiente problema:
>>>
>>> tengo muchos archivos (algunos cientos) con columnas de datos
>>> separados por \tab y al importar en R me di cuenta que me faltaban
>>> algunas filas ... despues de 3 dias dandole vueltas al problema
>>> encontre que las filas que faltaban tenian un doble \tab en alguna
>>> columna
>>>
>>> Luego la pregunta es:
>>>
>>> existe alguna forma de importar los archivos de modo que el doble \tab
>>> no produzca errores o
>>>
>>> existe alguna forma de "abrir" los archivos sin importarlos en R (pero
>>> con R), buscar y reemplazar ese doble \tab para luego importar
>>>
>>> Saludos y muchas gracias,
>>>
>>> Eric,
>>>
>>>
>>>
>>>
>>
>

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es