[R-es] acerca de cómo se calculan los PDP para un random forest ...

Eric er|cconch@munoz @end|ng |rom gm@||@com
Vie Feb 19 16:28:00 CET 2021


Hola chicos, cómo van ? espero q todos bien, aquí en Chile con 
cuarentena muy prolongada por el covid, así es que mientras estoy 
encerrado forzosamente trato de aprender algunas cosas nuevas. Estoy 
dándole una mirada y jugando con R y algunos paquetes para machine 
learning, he usado random forest para un caso real de estimación del 
desarrollo de ciertas capacidades en los niños a partir de las 
condiciones de crianza, como la calidad del hogar y algunas aptitudes de 
la madre. Ahora estoy tratando de entender cómo funciona la idea de los 
Partial Dependence Plots para explicar la influencia de un subconjunto 
de predictores sobre la vble dependiente y estoy revisando el artículo 
de Brandon M. Greenwell llamado pdp: An R Package for Constructing 
Partial Dependence Plots (lo encuentran en este enlace 
https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-2017-016.pdf, 
ya que es muy grande para adjuntarlo al correo) ... llegado a la 
ecuación 2 quisiera saber cómo se lee/interpreta correctamente el 
término después del primer signo = . Entiendo la idea general de los 
PDP, pero quisiera una comprensión al detalle y he estado muchos años 
lejos de la matemática ... "E" supongo que es la esperanza, y Ezc, 
imagino es la esperanza de lo q está dentro del paréntesis cuadrado 
calculada sobre el subconjunto zc ... luego, "f con el acento 
circunflejo" es la función de predicción, y aquí viene mi mayor duda, 
cómo se lee f(zs,zc) ? ... f(zc) es simple, no? pero cómo se interpreta 
"f" con zs y zc dentro ? es el producto de f(zs) y f(zc) ? es la suma de 
la función de predicción de ambos términos ? qué es ? ... luego el mismo 
término aparece en la sumatoria de la ec. 3, así es q mejor tratar de 
entenderlo, no ?

Adjunto una imagen del texto donde aparecen la ecuación para seguir más 
fácilmente mi preguntas ... muchas gracias por su ayuda.

Eric.



------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20210219/01dc8b3e/attachment-0001.html>

------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: ppndldgmcnlkghlg.png
Type: image/png
Size: 113670 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20210219/01dc8b3e/attachment-0001.png>


Más información sobre la lista de distribución R-help-es