[R-es] Tibble o data.table?

Carlos Ortega cof en qualityexcellence.es
Mie Nov 22 22:37:12 CET 2017


PostgresSQL (es una base de datos relacional opensource)
Y Presto es un motor de base de datos distribuida que se entiende con Hive,
Cassandra, etc..

Vaya, lo que quería aportar es otra idea.
Leía hace poco en este blog:

http://winvector.github.io/FluidData/DataWranglingAtScale.html

*"R its is packages"*

Que me parece una de las mejores definiciones a la tradicional de "entorno
y lenguaje para análisis de datos"...
data.table es en sí otro "lenguaje" dentro de "R", su creador ahora está en
H2O que también lo han integrado en la lectura de ficheros.

No veo mucho problema en que RStudio apoye todo el "tidyverse", casi al
contrario es una forma de garantizar consistencia entre toda su sintaxis
con la que puedes hacer gran parte de las actividades que requiere un
proceso de análisis. Y esto que con "dplyr" puedas conectarte a casi
cualquier fuente de datos (ahora tiene conectores empresariales para las
bases de datos BigData: Hive, Impala, ...) es una gran ventaja. O todo lo
que están haciendo con "sparklyr", o más recientemente con "keras" y
"tensorflow". Y con el fichaje de Max Kuhn, y su paquete "recipes", "caret"
también formará parte del ecosistema "tidy".


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 22 de noviembre de 2017, 22:07, Jesús Para Fernández <
j.para.fernandez en hotmail.com> escribió:

> Que es postgres y presto?? Se uqe google tiene la respuesta,....
> ------------------------------
> *De:* José Luis Cañadas <canadasreche en gmail.com>
> *Enviado:* miércoles, 22 de noviembre de 2017 22:01
> *Para:* Jesús Para Fernández
> *Cc:* Carlos Ortega; r-help-es en r-project.org
>
> *Asunto:* Re: [R-es] Tibble o data.table?
>
>
> Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
> conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
> front.
>
>
> El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
> j.para.fernandez en hotmail.com> escribió:
>
> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> ________________________________
> De: Carlos Ortega <cof en qualityexcellence.es>
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-es en r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
> 2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
> 7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
> aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
> 2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
>         [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org<mailto:R-help-es en r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%
> 2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=
> 02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7
> b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%
> 7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKS
> v89psbhpA489A%3D&reserved=0>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
> 2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
> 7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
> aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
> 2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es