[R-es] Seleccionar de columnas de un conjunto de datos

Marcuzzi, Javier Rubén javier.ruben.marcuzzi en gmail.com
Jue Oct 11 16:40:38 CEST 2012


Hola a todos:

AWK - recuerdo haber usado eso, es sencillo pero casi no se utiliza.

Hice una consulta casi al azar y comparto este correo de otra lista, es casi 
idéntico a la solución escrita aquí.

http://www.mail-archive.com/r-help@r-project.org/msg149812.html

Javier Marcuzzi

-----Mensaje original----- 
From: Jorge I Velez
Sent: Thursday, October 11, 2012 11:15 AM
To: Carlos Ortega
Cc: R-help-es
Subject: Re: [R-es] Seleccionar de columnas de un conjunto de datos

Perfecto!  Muchas gracias, Carlos.

Este es el comando que utilice (Mac OS X):

setwd("~/Desktop")
system("awk ' { print $1, $2, $6 } ' mdd.ped > mdd.phen")

Y este el resultado de system.time():

user  system elapsed
11.277   0.330  12.276

Definitivamente mucho mas rapido, eficiente, y versatil (sin mencionar lo
amigable con la RAM) que mi aproximacion via read.table(); solo para leer
los datos esta tardaba ~30X lo que ahora tarda awk haciendo el proces
completo.

Un saludo,
Jorge.-


2012/10/12 Carlos Ortega <>

> Hola,
>
> Sería algo así como:
>
> gawk ' { print $1, $2, $6 } ' fichero_entrada > fichero_salida
>
> Para gawk el separador natural es el espacio. Si no es así tienes que
> indicarle cuál es el separador.
> Y cada campo se obtiene con el símbolo "$".
>
> Otra opción, que recuerdo vagamente, es utilizar el comando "cut" pero no
> recuerdo el detalle de su sintaxis.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 11 de octubre de 2012 15:44, Jorge I Velez <> escribió:
>
> Hola Carlos.  Gracias por tu respuesta.  Alguna vez alguien me menciono
>> awk/gawk para hacer algo similar pero honestamente no me puse en la tarea
>> de aprender.  Disculpa mi atrevimiento, pero tenes algun ejemplo donde se
>> haga algo similar a la situacion que acabo de plantear?  Muchas gracias!
>> --JIV
>>
>>
>> 2012/10/12 Carlos Ortega <>
>>
>> Hola,
>>>
>>> Con awk/gawk esta selección es inmediata de programar, vaya sobre la
>>> misma línea de comandos de la consola lo puedes ejecutar...(una 
>>> línea)...
>>>
>>> Saludos,
>>> Carlos Otega
>>> www.qualityexcellence.es
>>>
>>> El 11 de octubre de 2012 15:28, Jorge I Velez 
>>> <jorgeivanvelez en gmail.com>escribió:
>>>
>>>>  Apreciados miembros de R-help-es,
>>>>
>>>> Estoy trabajando con un archivo de texto que contiene ~10K filas y 
>>>> ~120K
>>>> columnas.  Especificamente, me gustaria utilizar R (u otro programa
>>>> GNU, si
>>>> es el caso) para seleccionar solo las columnas 1, 2 y 6 de ese archivo 
>>>> y
>>>> exportarlas como un nuevo archivo.  Cualquier sugerencia es bienvenida.
>>>>
>>>> Trabajo en Mac OS X (10.6.8, Snow Leopard) y mi sessionInfo() es
>>>>
>>>> > sessionInfo()
>>>> R version 2.15.0 Patched (2012-04-18 r59094)
>>>> Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
>>>>
>>>> locale:
>>>> [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
>>>>
>>>> attached base packages:
>>>> [1] stats     graphics  grDevices utils     datasets  methods   base
>>>>
>>>> Muchas gracias,
>>>> Jorge.-
>>>>
>>>>         [[alternative HTML version deleted]]
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]







_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es