Los árboles de regresión aditivos bayesianos (BART, Bayesian Additive Regression Trees) son un método de aprendizaje automático o aprendizaje de máquinas (machine learning) con aplicaciones muy prometedoras en el modelado de distribución de especies basado en datos de presencia y ausencia de observaciones.
A diferencia de la mayoría de métodos, la capacidad predictiva de BART suele mostrar un buen equilibrio entre los dos aspectos principales de la evaluación de modelos: la discriminación (que implica distinguir las localidades con presencia de las demás) y la calibración (que implica que la probabilidad de presencia refleje la variación gradual en la frecuencia de ocurrencia de la especie).
Los BART generan predicciones acertadas sin sobreajustarse al ruido ni a casos particulares en los datos. En este curso se explicará:
1) Una introducción o repaso sobre modelos de nicho ecológico y modelos de distribución de especies
2) La construcción de modelos de diferente complejidad, incluyendo métodos de regresión estadística y métodos de aprendizaje de máquinas (tanto bayesianos como no bayesianos)
3) Validación cruzada y comparación de los modelos enfocando varios aspectos de su capacidad predictiva, en particular la discriminación y la calibración o fiabilidad
4) La identificación de variables relevantes, curvas y mapas de respuesta parcial, y predicciones con intervalos de confianza y niveles de incertidumbre. Las prácticas se harán en R, utilizando paquetes como ’embarcadero’, ‘fuzzySim’, ‘blockCV’ y ‘modEvA’.
Durante el curso, los participantes podrán aplicar estas técnicas a sus propios datos de presencia de especies, o si no los tienen a datos de ejemplo que serán proporcionados por la profesora.