[R-es] Error: protect(): protection stack overflow

Manuel Mendoza mmendoz@ @end|ng |rom |u|br|ghtm@||@org
Vie Abr 1 12:47:04 CEST 2022


Gracias Carlos, te hice caso pero me da este otro error, que creo que está
relacionado también con la memoria:
Error: cannot allocate vector of size 12.5 Gb.
He resuelto el problema aplicando XgBoost, que utiliza todos los nodos del
ordenador. Aunque no hace lo mismo (es un boosting y no un bootstrap), mi
intención era seleccionar las variables más importantes para no tener que
trabajar con todas. XgBoost también da la importancia, y Gain,
concretamente, lo hace de forma parecida a IncNodePurity. Me salen, además,
las mismas que con random forest, cuando funcionó con 9107 genes de los
58036, por lo que me quedaré con esas variables.

Gracias, una vez más,
Manuel




El vie, 1 abr 2022 a las 9:32, Carlos Ortega (<cof using qualityexcellence.es>)
escribió:

> Hola Manuel,
>
> Yo probaría con "ranger", la implementación de "randomForest" pero en C++,
> tiene una mucha mejor gestión de la memoria.
> Y sin duda, para un problema de este tipo, notarás una gran diferencia en
> velocidad de ejecución.
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El vie, 1 abr 2022 a las 5:03, Manuel Mendoza (<mmendoza using fulbrightmail.org>)
> escribió:
>
>> Buenos días, por primera vez he necesitado trabajar con una df que
>> incluye nada menos que 58036 variables, que son grados de expresión génica
>> (el nº de muestras es 933) y al hacer un random forest (paquete
>> randomForest) me ha dado un error hasta ahora para mi desconocido: Error:
>> protect(): protection stack overflow
>>
>> Parece ser debido a la falta de memoria del ordenador, que es un laptop,
>> aunque bastante potente. Con 9197 variables no tuve problemas y tardó mucho
>> menos de lo que yo esperaba.
>> ¿Es posible hacer algo?
>> Gracias,
>> Manuel
>>
>>
>> Memnory Usage Report
>>
>> [image: image.png]
>>
>>
>>  Con gc() me salió esto:
>>
>>                   used      (Mb)         gc trigger        (Mb)
>>  max used        (Mb)
>> Ncells  1120419      59.9           2413118      128.9
>> 1717277         91.8
>> Vcells 56595010   431.8     1723373484   13148.3     1793563775    13683.9
>>
>>
>>
>>
>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es using r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20220401/f1aa4f06/attachment-0001.html>

------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: image.png
Type: image/png
Size: 53597 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20220401/f1aa4f06/attachment-0001.png>


Más información sobre la lista de distribución R-help-es