[R-es] Muestreo de bases de datos.-
Freddy Omar López Quintero
freddy.vate01 en gmail.com
Lun Mayo 4 20:15:33 CEST 2015
¡Hola!
Mi duda surge por la siguiente anécdota: un amigo (empleado de una enorme
consultora que tiene SAS) migró a R y ansioso me contó que iba a ejecutar
las rutinas que había traducido de SAS a R y luego de intentar ejecutarlas
nada le funcionó porque, ingenuamente, quería hacer cosas para las cuales R
no está diseñado (operaciones en la base de datos) y porque leyó TODOS los
datos de una consulta (millones de registros) e intentó correr algún
procedimiento (!). Me dijo que SAS corre todo lo que él necesita y pues
quedó tristemente decepcionado.
Yo le dije que es corriente tomar una muestra de los datos para calibrar
los modelos que se van a necesitar y que no es necesario utilizar los
millones de registros enteros. Esto me hizo pensar ¿existen normas o buenas
prácticas para el muestreo de las bases de datos?¿existen
normativas?¿lineamientos? Es claro que mi primera respuesta sería ocupar
los métodos ya desarrollados para encuestas, pero quién sabe.
Si existen: ¿tienen su contraparte en R?
Gracias y disculpen las molestias.
¡Salud!
--
«No soy aquellas sombras tutelares
que honré con versos que no olvida el tiempo.»
JL Borges
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es