[R-es] como importar una base de datos grande a R

Carlos J. Gil Bellosta cgb en datanalytics.com
Vie Abr 19 15:22:39 CEST 2013


Para seleccionar filas y columnas independientes para leer (sin leer
todo el fichero) puedes probar el paquete colbycol.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 19 de abril de 2013 15:12, Reverté Calvet, Gerard
<greverte en ajmataro.cat> escribió:
> Gracias por las respuestas.
>
> Miguel me miraré el paquete ff. Muchas gracias.
>
> Javier, ya intenté la opción de conectar el fichero de txt a Access 2010,
> pero son demasiados campos (Acces 2010 me admite como máximo 255 campos). Me
> dice que elimine campos, pero sólo me enseña los 255 primeros, que son
> justamente los que más me interesan. No se, supongo que con MySQL no tendría
> este problema, pero no he trabajado nunca con MySQL.
>
> Carlos, no dispongo de 6GB de RAM. Temiendome esto, planteé la segunda
> pregunta, ¿puedo conectarme con R al fichero de texto, y seleccionar los
> datos que me interesan a través de consultas con el paquete sqldf o con la
> función subset? Otra pregunta, con read.table puedo seleccionar el número de
> filas a importar (nrows) y el numero de filas que tiene que saltarse antes
> de empezar a importar datos (skip), pero con columnas como lo puedo hacer?
>
> Gracias.
>
>
>
> Gerard
>
>
> -----Missatge original-----
> De: gilbellosta en gmail.com [mailto:gilbellosta en gmail.com] En nom de Carlos J.
> Gil Bellosta
> Enviat: dijous, 18 / abril / 2013 18:58
> Per a: Reverté Calvet, Gerard
> a/c: r-help-es en r-project.org
> Tema: Re: [R-es] como importar una base de datos grande a R
>
>
> Hola, ¿qué tal?
>
> Según
>
> 410 * 2e6 * 8 / 1024^3
> [1] 6.109476
>
> necesitarías un mínimo de 6GB de RAM (como mínimo) para almacenar el objeto
> que quieres cargar. ¿Los tienes?
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
> El día 18 de abril de 2013 11:59, Reverté Calvet, Gerard
> <greverte en ajmataro.cat> escribió:
>> Buenos dias,
>>
>> En primer lugar decir que soy un novato con R.
>>
>> Dispongo de una base de datos txt con 2 millones de registros y 410
>> variables. De las 410 variables, 409 son numéricas y 1 es de texto.
>> Las preguntas son las siguientes:
>>
>> 1) ¿Como puedo importar a R toda la base de datos? Con "read.table"
>> puedo importar todas las variables pero solo unos 300.000 registros.
>>
>> 2) Si quiero seleccionar sólo algunos datos de la base de datos, ¿qué
>> tengo que hacer? ¿conectarme a la base de datos con la función file()
>> y luego hacer consultas a través del paquete sqldf?
>>
>> Gracias.
>>
>> Gerard
>>
>>
>>
>> Avís legal/Aviso legal
>>
>> La present informació s'envia únicament a la persona a la que va
>> dirigida i pot contenir informació privilegiada o de caràcter
>> confidencial. Qualsevol modificació, retransmissió, difusió o altre ús
>> d'aquesta informació per persones o entitats diferents a la persona a
>> la que va dirigida està prohibida. Si vostè l'ha rebut per error, si
>> us plau contacti amb el remitent i esborri el missatge de qualsevol
>> ordinador. En el cas que aquest missatge vagi a ser contestat per la
>> mateixa via, ha de saber-se que la seva resposta podria ser coneguda
>> per tercers a l'entrar a la xarxa. Per això, si el missatge inclou
>> contrasenyes, números de targetes de crèdit o qualsevol altra
>> informació que vostè consideri confidencial, seria més segur contestar
>> per una altra via i cancel·lar la seva transmissió. L'Ajuntament de
>> Mataró i els seus organismes dependents no poden assumir la
>> responsabilitat derivada del fet de què terceres persones puguin arribar a
>> conèixer el contingut d'aquest missatge durant la seva transmissió.
>> ________________________________
>> La presente información se envía únicamente a la persona a la que va
>> dirigida y puede contener información privilegiada o de carácter
>> confidencial. Cualquier modificación, retransmisión, difusión u otro
>> uso de esta información por persones o entidades diferentes a la
>> persona a la que va dirigida está prohibida. Si usted la ha recibido
>> por error, por favor contacte con el remitente y borre el mensaje. En
>> el caso de que este mensaje vaya a ser contestado por la misma vía, ha
>> de saberse que su respuesta podría ser conocida por terceros al entrar
>> en la red. Por este motivo, si el mensaje incluye contraseñas, números
>> de tarjetas de crédito o cualquier otra información que considere
>> confidencial, sería más seguro contestar por otra vía y cancelar su
>> transmisión. El Ayuntamiento de Mataró y sus organismos dependientes
>> no pueden asumir la responsabilidad derivada del hecho de que terceras
>> personas puedan llegar a conocer el contenido de este mensaje durante su
>> transmisión.
>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> Avís legal/Aviso legal
>
> La present informació s'envia únicament a la persona a la que va dirigida i
> pot contenir informació privilegiada o de caràcter confidencial. Qualsevol
> modificació, retransmissió, difusió o altre ús d'aquesta informació per
> persones o entitats diferents a la persona a la que va dirigida està
> prohibida. Si vostè l'ha rebut per error, si us plau contacti amb el
> remitent i esborri el missatge de qualsevol ordinador. En el cas que aquest
> missatge vagi a ser contestat per la mateixa via, ha de saber-se que la seva
> resposta podria ser coneguda per tercers a l'entrar a la xarxa. Per això, si
> el missatge inclou contrasenyes, números de targetes de crèdit o qualsevol
> altra informació que vostè consideri confidencial, seria més segur contestar
> per una altra via i cancel·lar la seva transmissió. L'Ajuntament de Mataró i
> els seus organismes dependents no poden assumir la responsabilitat derivada
> del fet de què terceres persones puguin arribar a conèixer el contingut
> d'aquest missatge durant la seva transmissió.
> ________________________________
> La presente información se envía únicamente a la persona a la que va
> dirigida y puede contener información privilegiada o de carácter
> confidencial. Cualquier modificación, retransmisión, difusión u otro uso de
> esta información por persones o entidades diferentes a la persona a la que
> va dirigida está prohibida. Si usted la ha recibido por error, por favor
> contacte con el remitente y borre el mensaje. En el caso de que este mensaje
> vaya a ser contestado por la misma vía, ha de saberse que su respuesta
> podría ser conocida por terceros al entrar en la red. Por este motivo, si el
> mensaje incluye contraseñas, números de tarjetas de crédito o cualquier otra
> información que considere confidencial, sería más seguro contestar por otra
> vía y cancelar su transmisión. El Ayuntamiento de Mataró y sus organismos
> dependientes no pueden asumir la responsabilidad derivada del hecho de que
> terceras personas puedan llegar a conocer el contenido de este mensaje
> durante su transmisión.
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es