Modelización del Riesgo Crédito en R y Python

 

 

OBJETIVO

 

Los objetivos del curso son: mostrar al participante metodologías que permitan identificar, medir y gestionar el riesgo de crédito en tiempos de crisis financieras. Específicamente el participante: 

  • Aprender técnicas de vanguardia para estimar, calibrar y validar modelos y parámetros de riesgo como PD, LGD y EAD.

 

  • Desarrollar modelos de capital económico, correlación de activos y stress testing de riesgo crédito.

  • Desarrollar modelos de credit scoring y score de comportamiento usando novedosas técnicas de machine learning.

 

  • Los ejercicios del cursos se entregan en el lenguaje de programación R y Python, mismos, que están listos para aplicar directamente en el trabajo. R y Python han crecido de forma importante en los recientes años, ambos son software libre y de código abierto que ofrecen al usuario un entorno amigable, estadístico y gráfico muy potente.

  • Se aprovecha R para desarrollar modelos estadísticos y de Machine Learning y Python para realizar potentes simulaciones de riesgo crédito.

  • El curso ofrece al participante una importante cantidad de modelos econométricos avanzados para gestionar el riesgo de crédito.

 

  • Se exponen metodologías de validación de modelos y parámetros.

 

  • Se explica desde como instalar R y Python hasta realizar algunas funciones importantes de programación, además de mostrar librerías útiles para la medición del riesgo crédito.

 

 

¿QUIÉNES DEBEN ASISTIR?

 

El Curso esta dirigido a profesionistas de riesgo de crédito de entidades financieras. Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística inferencial y Excel. No es necesario dominar el lenguaje R y Python.

 

 

 

 

 

Horarios:

  • Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h

  • España, Portugal: L a V 19-22 h

 

  • Ciudad de México, Lima, Quito, Bogotá, San JoséL a V 19-22 h

Precio: 4.900 €

Nivel: Avanzado

Duración: 30 h

Material: 

  • Presentaciones PDF

  • Ejercicios Excel

  • Ejercicios en R 

  • Ejercicios en Python

  • Ejercicios en Jupyter Notebook

 

AGENDA Modelización del Riesgo Crédito en R y Python 



Credit Scoring 

 

Módulo 0: Programación en Pyhton

 

  • ¿Que es Python? 

  • Crecimiento exponencial del uso de Python

  • Pyhton en el sector bancario

  • Instalación de Python

  • Importación de archivos

  • Tratatamiento de datos

  • Variables y programación

  • Construcción de funciones

  • Principales sentencias de programación

  • Datos fuentes de internet

  • Numpy, Scipy, Scikit-lern,panda y Matplotlib

  • Instalación y uso  de Anaconda

  • Instalación de Jupyter Notebook

  • Ejercicio a1: Cálculadora financiera

  • Ejercicio a2: Importación y modelos de series temporales

  • Ejercicio a3: Simulación de Monte Carlo en Python 

 

Módulo 1: Programación en R

 

  • Introducción de R

  • ¿Porque usar R en la Banca?

  • Instalación y Actualización de R

  • R con Windows

  • R con Linux y Unix

  • Programación en R

    • Principales Sentencias

    • Operadores 

    • Dataframes 

    • Arrays

    • Matrices

    • Principales funciones

  • Librerias, Paquetes y CRAN 

  • Importar Bases de datos en R

  • Manipulación y gestión de bases de datos en R

  • Gestión de Outputs

  • Procedimientos Estadísticos

    • Estadística Descriptiva

    • Análisis Exploratorio

  • Machine Learning en R

  • Ejercicio 1: Ejercicios de programación en R

  • Ejercicio 2:Fusión,Unión e Intersección de Bases de Datos R/SQL

  • Ejercicio 3:Tratamiento de Base de Datos de Credit Scoring

  • Ejercicio 4:Eliminación de duplicados

  • Ejercicio 5:Imputación de valores Missing

  • Ejercicio 6:Estadísticos y tablas de contigencia en R

  • Ejercicio 7:Gráficos Estadísticos en R

 

Módulo 2: Análisis Univariante

 

  • Definición de variable objetivo

  • Tratamiento de datos

  • Muestra y Segmentación

  • Horizonte temporal

  • Punto de observación y desempeño

  • Análisis del Análisis Univariante

  • Ejercicio 8: Análisis univariante percentiles en R 

  • Ejercicio 9: Análisis univariante óptimo en Excel

  • Ejercicio 10: Estimación del KS, Gini e IV  por variable en Excel y R

  • Ejercicio 11: Estimación Curva ROC en R

  • Ejercicio 12: Estimación Weight of Evidence WOE en Python y R 

 

Módulo 3: Segmentación, Clustering y Análisis de Componentes Principales

 

  • Clusters Jerárquicos

  • Dendrograma

  • Model Based Clustering

  • Density Based Clustering

  • Comparativo de Clusters

    • Distancia Interclusters

    • Distancia Intraclusters

  • Gráfico de disimilitud

  • Validación de Clusters

  • Análisis de Componentes principales (PCA)

  • Visualización avanzada de PCA

  • Ejercicio 14: Componentes principales en R y Python

  • Ejercicio 15: Visualización de componentes principales en R

Módulo 4:Algoritmos de Clasificación 

  • Árboles de Decisión

    • Modelización

    • Ventajas e inconvenientes

    • Procesos de Recursión y Particionamiento

    • Recursive partitioning tree

    • Pruning Decision tree

    • Conditional inference tree

    • Visualización de árboles

    • Medición de la predicción de árboles de decisión

    • Modelo CHAID

    • Modelo C5.0

  • K-Nearest Neighbors

    • Modelización

    • Ventajas e inconvenientes

    • Distancia Euclidiana

    • Distancia Manhattan

    • Selección del valor K

  • Modelo Probabilístico: Naive  Bayes

    • Teorema de Bayes

    • Estimador de Laplace

    • Clasificación con Naive Bayes

    • Ventajas e inconvenientes

  • Ejercicio 16: Árbol de decisición Chaid en R

  • Ejercicio 17: K means Clustering en R 

  • Ejercicio 18: Naive Bayes en R

Módulo 5: Algoritmos Avanzados NN y SVM

 

  • Support Vector Machine

    • Hiperplano óptimo

    • Support Vectors

    • Añadir costes

    • Ventajas e Inconvenientes

    • Visualiización del SVM

    • Tuning SVM

    • Truco de Kernel

  • Redes Neuronales (Neural Networks NN)

    • Entrenamiento de Perceptron

    • Perceptrón Multicapa

    • Algoritmo de backpropagation

    • Procedimientos de entrenamiento

    • Tuning NN 

    • Visualización de NN

    • Ventajas e inconvenientes

  • Ejercicio 19: Support Vector Machine en Python y R

  • Ejercicio 20: Redes Neuronales: perceptron en Python y R

Módulo 6: Ensemble Learning

 

  • Modelos de conjuntos

  • Bagging

  • Random Forest

  • Boosting

  • Adaboost

  • Boosting y Bagging para modelos de regresión

  • Ventajas e inconvenientes

  • Ejercicio 21: Random Forest en Python y R

  • Ejercicio 22: Adaboost en R

 

Módulo 7: Desarrollo de Scorecards

 

  • Asignación de puntuación

  • Clasificación del Scorecard

    • Scorecard WOE

    • Scorecard Binario

    • Scorecard Continuo

  • Reescalamiento del Scorecard

    • Análisis del Factor y Offset

    • Scorecard WOE

    • Scorecard Binario

  • Técnicas de Reject Inference

    • Cut-Off

    • Parcelling

    • Fuzzy Augmentation

  • Técnicas Avanzadas de punto de corte 

  • Ejercicio 23: Scorecard WOE en Excel y R

  • Ejercicio 24: Selección del Punto de Corte en Excel y SAS

Módulo 8: Validación de Modelos

 

  • Confusion Matrix

  • Poder Discriminante:

    • Indice Gini

    • ROC

    • KS

    • Brier Score

    • Kullback- Leibler

    • CIER 

  • Técnica de Bootstrapping

  • Indice de estabilidad

  • Estadístico Kappa

  • K-Fold Cross Validation

  • Ejercicio 25:Estimación de: KS, ROC y Gini del Modelo en R 

  • Ejercicio 26:Bootstrapping e intervalos de confianza en R

  • Ejercicio 27: K-Fold Cross Validation en R

 

Módulo 9: Behaviour Score I

 

  • Fuentes de datos

  • Tipología de variables en el scoring de comportamiento

  • Horizonte temporal

  • Segmentación

  • Definición del Default

  • Score de Comportamiento usando Regresión Logística

  • Score Proactivo

  • Transactional Scoring

  • Ejercicio 28: Behaviour Score con Regresión Logística con dataos de panel en stata y tramado univariante de variables en R

  • Ejercicio 29: Behaviour Score con Regresión Cox para panel data en R

Módulo 10: Behaviour Score Avanzado II

  • Modelos Multivariantes

  • Datos de Panel

  • Variables Macroeconómicas

  • Score de Comportamiento con Cox Regressión

  • Score de Comportamiento con machine learning

  • Ejercicio 30: Árbol de decisición Chaid en R

  • Ejercicio 31: Behavior Score Support Vector Machine en  R

  • Ejercicio 32: Behavior Score Redes Neuronales en R

  • Ejercicio 33: Random Forest en R

  • Ejercicio 34: Adaboost en R

  • Ejercicio 35: comparativo de resultados en Excel

Probabilidad de Default (PD)

 

Módulo 11: PD en carteras de consumo

 

 

  • PD en Basilea IV

  • Modelización de la Probabilidad de Default

  • PD Histórica

  • Modelos Econométricos de la PD: 

    • PD Regresión Logistica

    • PD Regresión COX

    • PD Log-log Complementary

  • Calibración de PD

    • PD PIT

    • PD TTC

  • Ajuste a la tendencia central

  • Análisis de la Probabilidades de Default: 

    • PD Marginal

    • PD Forward

    • PD Acumulada

  • Análisis Vintage de PD

  • Ejercicio 36Estimación PD modelo econométrico

  • Ejercicio 37Ajuste a la tendencia central en Excel

  • Ejercicio 38: Calibración de la PD por edad de operación en Excel

  • Ejercicio 39: Estimación de la PD PIT/ TTC en Excel

  • Ejercicio 40: Regresión Cox en R 

  • Ejercicio 41: Regresión Log-Log Complementary en R

  • Ejercicio 42: Análisis Vintage de PD en Excel

 

Módulo 12: PD en Corporate, Soberanos y Bancos

 

  • PD en Basilea IV

  • PD en empresas Corporate

  • PD en Bancos

  • PD en soberanos 

  • PD y relación con el Rating Externo

  • Calibración de PD

  • Calibración de curvas exponenciales

  • Mapping de Rating Externo

  • Técnicas de Mapping:

    • Tasas de default histórico

    • Quantiles

    • Acercamiento a la media

    • Técnicas de Mapeo de PD´s a las estructuras temporales

  • Definición de  Escala Maestra

  • Concentración y Granuralidad en la Escala Maestra

  • Ejercicio 43: Calibración de PD con técnicas de mapping en Excel

  • Ejercicio 44: Non-Linear Curve Fitting de PD en R

Módulo 13: Matrices de Transición y PD

  • Propiedades de las matrices de transición

  • Multi-year transition matrix

    • Tiempo discreto

    • Tiempo continuo

    • Matriz Generatriz

    • Exponencial de una matriz

  • Método de duración 

  • Método Cohort

  • Gestión del error

  • Ejercicio 45: Ejercicio análisis y error de Matriz de transición usando enfoque cohort en SAS

 

Módulo 14PD Low Default Portfolio

 

 

  • Estimación de PD sin correlaciones 

  • Estimación de PD con correlaciones 

  • Calibración de LDP usando Curvas CAP 

  • Técnicas de Mapping de PD a Escala Maestra

  • Estimación Bayesiana de PD para LDP

    • Correlación de defaults

    • Correlación de defaults y multiperiodo

    • Neutral Bayesian y Conservative Bayesian

  • Ejercicio 46: Calibración curva CAP Escala Maestra en Excel

  • Ejercicio 47: PD Neutral y Conservative Bayesian en R

 

Loss Given Default (LGD)

 

Módulo 15: Loss Given Default Avanzado (LGD)

 

 

  • LGD en Basilea IV

  • Workout approach

  • Definición de Cura y Ciclos de Default

  • Gastos de recuperación.

  • Downturn LGD

  • Modelos Avanzados de LGD

  • LGD en Retail

  • LGD en Empresas

  • LGD en Securities

  • CDS Spread

  • LGD Implicita

  • Ejercicio 48: Estimación de LGD en Excel 

 

Módulo 16: Modelos Econométricos de la LGD

 

  • Ventajas e inconvenientes de los Modelos Predictivos de LGD

  • Modelos paramétricos, no parámetricos y transformation regressions

  • Tipología de Modelos Multivariantes de LGD

    • Regresión Lineal y transformación Beta

    • Regresión Lineal y transformación Logit

    • Regresión Líneal y trasnsformación Box Cox

    • Regresión Logística y Lineal

    • Regresión Lógistica y no Lineal

    • Censored Regression

    • Generalized Additived Model

    • Redes Neuronales

    • Regresión Beta

    • Inflated beta regression

    • Fractional Response Regression

  • Ejercicio 49: Regresión lineal LGD en R

  • Ejercicio 50: Regresión Logística LGD en R

  • Ejercicio 51: Two stage: Regresión Logística + lineal LGD en R

  • Ejercicio 52: Redes Neuronales en Python

  • Ejercicio 53: Generalized Additived Model LGD en R

  • Ejercicio 54: Beta Regression Model LGD en R 

  • Ejercicio 55: Comparativo del performance de los modelos usando test de Calibración y precisión.

Exposure at Default (EAD)

 

Módulo 17: Exposure At Default (EAD)

 

  • EAD en Basilea IV

  • Directivas para la estimación del CCF

  • Directivas para la estimación del CCF Downturn 

  • Horizonte temporal

  • Transformaciones para modelizar el CCF

  • Enfoques para estimar el CCF

  • Enfoque Fixed Horizon

  • Enfoque Cohort

  • Enfoque Variable time horizon

  • Modelos Econométricos

    • Regresión lineal

    • Regresión Hiperbólica

    • Regresión Logística

    • Generalized Additived Model

    • Regresión Beta

    • Inflated beta regression

  • Modelo de intensidad para medir el retiro de líneas de crédito

  • Ejercicio 56: Modelo CCF de regresión OLS en R

  • Ejercicio 57: Modelo CCF Two Stages OLS+Logístico en R

  • Ejercicio 58: Modelo CCF Red Neuronalen R

  • Ejercicio 59: Comparativo del performance de los modelos de EAD

 

Validación de PD, LGD y EAD

 

Módulo 18Validación cuantitativa: PD, LGD y EAD

 

  • Validación cuantitativa: PD, LGD y EAD

  • Validación de Calibracion de PD

    • Hosmer Lameshow test

    • Normal test

    • Binomial Test

    • Spiegelhalter test

    • Traffic Light Approach

    • Analisis Semafórico y Cuadro de mando de la PD

    • PD Stability Test

  • Forecasting vs. Estimacion proyectada de la PD

  • Backtesting de la LGD con curvas vintage

  • Backtesting LGD/CCF

    • Ratio de precision

    • Indicador absoluto de precision

    • Intervalos de Confianza

    • Analisis de transicion

    • Analisis de RR usando Triangulos

  • Ejercicio 60: Backtesting de PD en Excel

  • Ejercicio 61: Backtesting Avanzado de LGD con enfoque vintage en Excel

  • Ejercicio 62: Comparativo del performance de los modelos usando test de Calibración y precisión

 

Módulo 19: Capital Económico 

  • Definición y Objetivo

  • Horizonte temporal

  • Correlación de Default

  • Estimación de Correlación de activos

  • Pérdida Inesperada

  • Pérdida Inesperada Contributoria

  • Modelos de capital regulatorio y RWA

  • Stress Testing RWA

  • Modelos de Capital Económico ASRF

  • Modelos  Comerciales

    • Credit Risk+

    • KMV

    • Creditmetrics

    • Credit Portfolio View

  • Modelos Multifactoriales

  • Capital Económico para retail usando Charge off

  • Modelización de Dependencia usando copulas

  • Estimación de VaR y Expected Shortfall

  • Stress Testing del capital económico

  • Simulación de pérdida por riesgo de crédito

  • Ejercicio 63: Matriz de correlación de Default en Excel 

  • Ejercicio 64: Correlación de default: carteras de consumo 

  • Ejercicio 65: Correlación de activos 

  • Ejercicio 66: Creditrisk + en y R

  • Ejercicio 67: Creditmetrics en Python

  • Ejercicio 68: Credit Portfolio Views en SAS y Excel

  • Ejercicio 69: Modelo Unifactorial en Excel, R y Python

  • Ejercicio 70: Modelo Multifactorial en Excel y Python

  • Ejercicio 71: T-student en Excel en R

  • Ejercicio 72: Comparativo de capital económico y regulatorio

 

Stress Testing

Módulo 20: Validación de Modelos Econométricos

  • Revisión de supuestos de los modelos econométricos

  • Revisión de los coeficientes y errores estándar de los modelos

  • Medidas de la confiabilidad del modelo

  • Gestión de los errores

  • Heterocedasticidad

  • Detección de colinealidad multivariante en regresión lineal

  • Detección de colinealidad multivariante en regresión logística

  • Ejercicio 73: Detección series no estacionarias y cointegración

  • Ejercicio 74:Medición de colinealidad multivariante de modelo de regresión logística y líneal 

 

Módulo 21: Determinación de escenarios Macroeconómicos

en el Stress Testing y Machine Learning

 

  • EBA y ESRB en el stress testing

  • Requerimientos regulatorios de la Reserva Federal de EEUU

  • Diseño de escenarios adversos

  • Shocks financieros y económicos

  • Variables macroeconómicas

  • Modelos macroeconómicos

  • Medición de la Severidad del escenario adverso macroeconómico

  • Score de la severidad del escenario

  • Análisis de redes

  • Modelos Gráficos Probabilistas

  • Ejercicio 75: Escenarios macroeconómicos del PIB en SAS y R

  • Ejercicio 76: Análisis de redes en el stress testing

  • Ejercicio 77: Redes bayesianas en el stress testing en R

Módulo 22: Stress Testing Riesgo Crédito Consumo

  • Horizonte temporal

  • Enfoque Multiperíodo

  • Data requerida

  • Impacto en P&L, RWA y Capital

  • Escenarios Macroeconómicos de Estrés en consumo

    • Experto

    • Estadístico

    • Regulatorio

  • Stress Testing de la PD:

    • Credit Porfolio View 

    • Mutiyear Approach

    • Reverse Stress Testing

    • Rescaling

    • Regresión Cox

  • Stress Testing de la Matriz de Transición

    • Enfoque Credit Portfolio View 

    • Índice de ciclo de crédito

    • Extensión Multifactorial

  • Stress Testing de la  LGD:

    • LGD Downturn: Enfoque Mixtura de distribuciones

    • Modelización PD/LGD Multiyear Approach

    • Stress test de LGD para carteras hipotecarias

  • Stress Testing de:

    • Defaults

    • Charge-Off

    • Net Charge Off 

    • Roll Rates​

    • Matrices de transición de Rating/Scoring

    • Matrices de transición de buckets de morosidad

    • Tasa de Recuperación Y LGD

    • Pérdidas por activos deteriorados nuevos  

    • Pérdidas por activos deteriorados antiguos

  • ​Ejercicio 78: Stress Testing PD en Excel y SAS modelo multifactorial Credit Portfolio Views

  • Ejercicio 79: Stress Testing PD en R enfoque Multiyear Approach

  • Ejercicio 80: Stress test de PD y Vectores Autoregresivos en Python

  • Ejercicio 81: Stress Test del Net Charge Off en R

  • Ejercicio 82: Stress Test  de la LGD modelo econométrico en R  

  • Ejercicio 83: Stress Test de Matrices de Transición de Buckets de Morosidad

  • Ejercicio 84: Stress Test conjunto de la PD&LGD en Python

Módulo 23: Stress Testing de Riesgo Crédito para Portfolios Corporate

  • Horizonte temporal

  • Data requerida

  • Principales variables Macroeconómicas

  • Impacto en P&L, RWA y Capital

  • Modelo ASRF

  • Modelo de Creditmetrics

  • Uso de Matrices de transición

  • Forecasting del default

  • Metodología de Stress Test para portfolios corporate

  • Credit Index

  • Impacto en el RWA y Capital

  • Ejercicio 85: Stress Test de cartera corporativa usando matriz de transición