Credit Scoring para Fintech en SAS y R

 

OBJETIVO

 

El crecimiento del mercado Peer to Peer (P2P) lending o financiación peer to peer online de las Fintech y Bigtech ha sido exponencial y continuará produciéndose en toda Europa y España, consideramos que el crecimiento no cesará de cara al futuro, incluso, en otras latitudes como América Latina. Las plataformas P2P son una parte creciente de las nuevas empresas de Fintech, no obstante, las mismas no están exentas de riesgos financieros, particularmente riesgo de crédito y riesgo de default.

 

Este curso de vanguardia tiene como objetivo mostrar herramientas de credit scoring para los procesos de admisión y seguimiento del default en la financiación Fintech así como modernas metodologías de riesgo crédito y machine learning. 

Los objetivos específicos son los siguientes:

 

  • El objetivo del curso es enseñar al participante a desarrollar modernas y potentes herramientas de credit scoring empleando bases de datos de plataformas P2P de préstamos de consumo. Y comparar estos modelos frente a las herramientas de credit scoring usadas en banca.

  • Se desarrollan dos modelos de credit scoring reales, de una cartera de Fintech y otra bancaria, respectivamente, para comparar y analizar diferencias y similitudes.  

 

  • Mostrar una amplia gama de modelos de scoring que pueden usarse para objetivos distintos como son el behavior score, score de fraude, score de recobro, score de ingresos y score de Abandono. El curso, es completamente práctico, y tras terminar el curso el participante puede construir modelos de scoring inmediatamente en el trabajo. 

 

  • Se expone un módulo, sobre el tratamiento avanzado de los datos, explicando entre otros temas, el muestreo, análisis exploratorio, segmentación y detección de outliers. 

 

  • Se muestran metodologías avanzadas de Machine Learning, como lo son los árboles de decisión, random forest, redes neuronales, redes bayesianas, Support Vector Machines etc. Más adelante se explica, pormenorizadamente, la validación de estos modelos.

 

  • Además se explican las ventajas y desafíos de desarrollar un Credit Scoring con Big Data y como ayuda la analítica  de redes sociales en la financiación P2P.

  • El participante conocerá técnicas de vanguardia para estimar, calibrar y validar modelos y parámetros de riesgo como PD, LGD y EAD para la financiación online de consumo peer to peer. 

 

  • Disponemos de un ejercicio global de Pricing para la financiación P2P y la respectiva estimación de la pérdida esperada a 12 meses y lifetime usando metodologías avanzadas de riesgo crédito, incluyendo modelos PD, LGD, EAD, prepago y curvas de tipo de interés,

  • Los ejercicios del curso se entregan tanto en el lenguaje de programación R como en SAS y pueden aplicarse directamente en el trabajo. 

¿QUIÉNES DEBEN ASISTIR?

 

El Curso está dirigido a profesionistas de riesgo de crédito de entidades financieras que quieran profundizar en este tipo de financiación P2P así como a los responsables de riesgos de empresas fintech P2P.

Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística inferencial y Excel. 

 

Horarios:

  • Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h

  • España, Portugal: L a V 19-22 h

 

  • Ciudad de México, Lima, Quito, Bogotá, San JoséL a V 19-22 h

Precio: 3.900 €

Nivel: Intermedio-Avanzado

Duración: 30 h

Material: 

Presentaciones PDF

Ejercicios en R, SAS y Excel

AGENDA Credit Scoring para Fintech en SAS y R

 

Módulo 1: Fintech, financiación Peer to Peer P2P

  • Que son las Fintech

  • Quienes son y que hacen las Bigtech

  • Relación Fintech y Banca

  • Crecimiento del Fintech 

  • Definición y carateristicas Financiación P2P

  • Crecimiento y Análisis de la:

    • Financiación P2P en EEUU y Europa

    • Financiación P2P en España

    • Financiación P2P en América Latina

  • Análisis Principales Plataformas P2P

  • Modelos de Negocio de los Online Lenders

  • Procesos de contratación Inversor y Prestatario

  • Riesgos Financieros en la financiación P2P​

    • Riesgo Liquidez

    • Riesgo de Default

    • Riesgo de Crédito

    • Riesgo de Mercado

    • Riesgo Operacional

    • Ciber Riesgos

  • Diferencias en la financiación de la banca y P2P

  • Factores Tecnológicos P2P

  • Tipología Financiación P2P​

  • Posibles escenarios de cara a futuro

  • Factores de crecimiento del P2P

  • Sistema de decisión de crédito P2P

  • Regulación de los Online Lenders

Credit Scoring Fintech 

Módulo 2: Credit Scoring y Modelos Predictivos

 

  • Credit Scoring para Banca

  • Credit Scoring para Fintech

  • Diseño y Construcción de Modelos de Credit Scoring

  • Ventajas y Desventajas de los modelos

  • Modelos para afrontar nuevas crisis financierias

  • Variables en la Financiación P2P

  • Posibles diferencias entre la Banca y P2P

  • Machine Learning en P2P

  • Información de Redes Sociales en P2P

  • Importancia del Bureau Score en P2P

Módulo 3: Machine Learning en Financiación FINTECH

 

  • Definición del Machine Learning 

  • Metodología del Machine Learning

    • Almacenamiento de la Data

    • Abstracción

    • Generalización

    • Evaluación

  • Aprendizaje Supervisado y No Supervisado

  • Tipología de algoritmos de Machine Learning

  • Pasos para implementar un algoritmo

    • Recogida de información

    • Análisis Exploratorio

    • Entrenamiento del modelo

    • Evaluación del Modelo

    • Mejoras al modelo

    • Machine Learning en riesgo crédito de consumo

  • Machine Learning en modelos de credit scoring

  • Principales Herramientas: Microsoft Azure, SAS  Enterprise Miner, SAS Visual Analytics, Knime, IBM SPSS Modelller, R, Python, Spark, etc.

Módulo 4: Análisis Exploratorio y Análisis Univariante

  • Tipología de datos del Peer to Peer

  • Datos transaccionales

  • Unstructured data embebida en documentos de texto

  • Social Media Data

  • Fuentes de datos

  • Revisión del dato

  • Definición del Target

  • Horizonte temporal de la variable objetivo

  • Muestreo

    • Muestreo Aleatorio

    • Muestreo Estratificado

    • Muestreo Rebalanceado

  • Análisis Exploratorio:

    • Histogramas

    • Q-Q Plot

    • Análisis de momentos

    • Box Plot

  • Tratamiento de los valores Missing

    • Imputación

    • Borrar

    • Mantener

  • Técnicas avanzadas de detección de Outliers y tratamiento

    • Z-Score

    • Distancia de Mahalanobis

  • Estandarización de los Datos

  • Categorización de variables

    • Equal Interval Binning

    • Equal Frecuency Binning

    • Prueba Ji-Cuadrada

  • Binary Coding

  • WOE Coding

    • Definición WOE

    • Análisis Univariante con variable Target

    • Selección de variables

    • Tratamiento de Variables continuas

    • Tratamiento de Variables Categóricas

    • Fisher Score

    • Gini

    • Information Value

    • Pearson Correlation

    • Cramer Von Misses

    • Optimización de variables continuas

    • Optimización de variables categóricas

  • Ejercicios Globales:

  • Credit Scoring con data de Plataforma P2P

  • Credit Scoring con data para Préstamos Bancarios

  • ​Ejercicio 1: Análisis Exploratorio en R

  • Ejercicio 2: Detección y tratamiento de Outliers Avanzado

  • Ejercicio 3: Muestreo estratificado y Aleatorio en R

  • Ejercicio 4: Análisis del Weight of Evidence WOE en Excel

  • Ejercicio 5: Análisis univariante en percentiles en R

  • Ejercicio 6: Análisis univariante óptimo variable continua en Excel

  • Ejercicio 7: Estimación del KS, Gini e IV de cada variable en Excel

  • Ejercicio 8: Validación de variables usando Pearson correlation y Fisher Score

  • Ejercicio 9: Análisis Word Cloud de variables en R

Módulo 5: Segmentación, Clustering y Análisis de Componentes Principales

 

  • Clusters Jerárquicos

  • Dendrograma

  • Model Based Clustering

  • Density Based Clustering

  • Comparativo de Clusters

    • Distancia Interclusters

    • Distancia Intraclusters

  • Gráfico de disimilitud

  • Validación de Clusters

  • Análisis de Componentes principales (PCA)

  • Visualización avanzada de PCA

  • Ejercicio 10: Componentes principales en R y SAS

  • Ejercicio 11: Visualización de componentes principales en R

Módulo 6: Algoritmos de Clasificación 

 

  • Árboles de Decisión

    • Modelización

    • Ventajas e inconvenientes

    • Procesos de Recursión y Particionamiento

    • Recursive partitioning tree

    • Pruning Decision tree

    • Conditional inference tree

    • Visualización de árboles

    • Medición de la predicción de árboles de decisión

    • Modelo CHAID

    • Modelo C5.0

  • K-Nearest Neighbors

    • Modelización

    • Ventajas e inconvenientes

    • Distancia Euclidiana

    • Distancia Manhattan

    • Selección del valor K

  • Modelo Probabilístico: Naive  Bayes

    • Teorema de Bayes

    • Estimador de Laplace

    • Clasificación con Naive Bayes

    • Ventajas e inconvenientes

  • Ejercicio 12: Árbol de decisión en SAS y R

  • Ejercicio 14: KNN en R y SAS

  • Ejercicio 15: Naive Bayes en R

Módulo 7: Algoritmos Avanzados NN ySVM

 

  • Support Vector Machine

    • Hiperplano óptimo

    • Support Vectors

    • Añadir costes

    • Ventajas e Inconvenientes

    • Visualiización del SVM

    • Tuning SVM

    • Truco de Kernel

  • Redes Neuronales (Neural Networks NN)

    • Entrenamiento de Perceptron

    • Perceptrón Multicapa

    • Algoritmo de backpropagation

    • Procedimientos de entrenamiento

    • Tuning NN 

    • Visualización de NN

    • Ventajas e inconvenientes

  • Ejercicio 16: Support Vector Machine en R

  • Ejercicio 17: Support Vector Machine en SAS

  • Ejercicio 18: Redes Neuronales: perceptron en R y SAS

Módulo 8: Ensemble Learning

 

  • Modelos de conjuntos

  • Bagging

  • Random Forest

  • Boosting

  • Adaboost

  • Boosting y Bagging para modelos de regresión

  • Ventajas e inconvenientes

  • Ejercicio 19: Ensemble models en R y SAS

  • Ejercicio 20: Random Forest en R y SAS

  • Ejercicio 21: Adaboost en R

 

Módulo 9: Desarrollo de Scorecards

 

  • Asignación de puntuación

  • Clasificación del Scorecard

    • Scorecard WOE

    • Scorecard Binario

    • Scorecard Continuo

  • Reescalamiento del Scorecard

    • Análisis del Factor y Offset

    • Scorecard WOE

    • Scorecard Binario

  • Técnicas de Reject Inference

    • Cut-Off

    • Parcelling

    • Fuzzy Augmentation

  • Técnicas Avanzadas de punto de corte 

  • Ejercicio 22: Scorecard WOE en Excel y R 

  • Ejercicio 23: Reject Inference BBDD P2P en R

  • Ejercicio 24: Selección del Punto de Corte en Excel y R

Módulo 10: Validación del modelos

  • Verificación p-values en regresiones

  • R cuadrado, MSE, MAD

  • Diagnóstico de los residuos

  • Test de Bondad de Ajuste

    • Deviance

    • Bayesian Information Criterion (BIC)

    • Akaike Information Criterion 

  • Multicolinealidad Multivariante

  • Validación cruzada

  • Bootstrapping del error

  • Matriz de confusión caso binario

  • Matriz de confusión caso multinomial

  • Prueba de Estabilidad

  • Principales test de poder discriminante:

    • KS

    • Curva ROC

    • Curva Lift

    • Gini Index

    • Cumulative Accuracy Profile

    • Distancia de Kullback-Leibler

    • Pietra Index

    • Entropía condicional

    • Valor de Información

    • Tau de Kendall

    • Brier Score

    • Distancia de Mahalanobis

    • Divergencia

    • Hosmer Lemeshow

  • Intervalos de confianza

  • Jackknifing con test de poder discriminante

  • Bootstrapping con test de poder discriminante

  • Estadístico Kappa

  • K-Fold Cross Validation

  • Ejercicio 25: Test de Bondad de Ajuste Regresión líneal

  • Ejercicio 26: Test de Bondad de Ajuste Regresión Logística

  • Ejercicio 27: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia en  Excel

  • Ejercicio 28: Bootstrapping Gini/Roc R

  • Ejercicio 29: Jackkinifng en R

  • Ejercicio 30: Kappa y Matriz de confusión en R

  • Ejercicio 31: K-Fold Cross Validation en R

Módulo 11: Analítica Social en Facebook

  • Analítica en las Redes Sociales para modelos de Credit Scoring

  • Definiciones de redes

  • Gráficos

  • Sociogramas

  • Visualización y analítica

  • Analítica Social en Facebook usando R

  • Analítica Social en Twitter usando R

  • Analítica Social en Google Analytics usando R

  • Ejercicio 32: Modelización avanzada de redes en Facebook: grado, diametro, densidad, centralidad, trazado de grafos dirigidos por fuerza,etc.

Módulo 12: Text Mining con data P2P

 y Redes Sociales en Twitter

  • Definición Text Mining

  • Unstructured Data

  • Análisis Exploratorio

  • Treemaps

  • Modelización predictiva en el Text Mining

    • K-Nearest Neighbors

  • Text Mining en las Redes Sociales

    • Keyword Search

    • Algortimos de clasificación

    • Algoritmos Clustering

  • Sentimiento en lingüística y Psicología

    • Subjetividad

    • Facticidad

  • Lingüística Computacional

    • Lexicón y Corpora

    • Enfoque basado en reglas

    • Enfoque Machine Learning 

  • Análisis de Sentimientos en Twitter

    • Análisis  y Score de polaridad

    • Support Vector Machine

  • Ejercicio 33: Text Mining aplicado a la data P2P 

  • Ejercicio 34: Score de polaridad en Twitter

  • Ejercicio 35: Análisis de Sentimientos en Twitter con SVM

Módulo 13: Modelos de Score para FINTECH

 

  • Modelos predictivos en consumo

  • Tipología de scores:

    • Response Scoring

    • Income Score

    • DTI Score

    • Credit Scoring de Admisión de Consumo P2P

    • Behavior Score

      • Behavior Score con variables macroeconómicas

      • Matrices de transición

      • Behavior Score con matrices de transición 

      • Transaction Score

    • Bureau Score

    • Score de veracidad de Ingresos

    • Score de Abandono

    • Score de Fraude en Admisión

    • Score de Fraude en Seguimiento

    • Collection Score

    • Recovery Score

    • Revenue Score

    • Big Data Scoring

    • Profit Scoring P2P

  • Combinación de modelos

  • Matrices duales

  • CREDIT SCORING FINTECH y CREDIT SCORING BANCA 

  • Ejercicio 36: Regresión Logística en SAS

  • Ejercicio 37: Redes Neuronales: perceptron en R y SAS

  • Ejercicio 38: Árboles de decisión CHAID en R

  • Ejercicio 39: Support vector machines en R

  • Ejercicio 40: Ensemble models Credit Scoring en SAS

  • BEHAVIOR SCORE FINTECH y BEHAVIOR SCORING BANCA

  • Ejercicio 41: Regresión Logística Panel Data en R

  • Ejercicio 42: Support vector machines en SAS

  • Ejercicio 43: Árboles de decisión C5.0 en R
  • Ejercicio 44: Random Forest en SAS
  • ​Ejercicio 45: Ensemble models Behavior Scoring en R

  • PROFIT SCORING FINTECH

  • Ejercicio 46: Regresión Logística Panel Data en R

  • Ejercicio 47: Redes Neuronales  en R

Expected Credit Losses

 

Módulo 14: Modelos de PD para financiación P2P

 

Riesgo de Default en la Financiación P2P

  • Definición de Default

  • Triggers del Default

  • Proceso efectivo y robusto para detectar al default

  • Defaults técnicos y filtros técnicos del default

  • Modelo de datos indispensable

  • Análisis Unifactorial

  • Análisis Multifactorial

  • Selección del Modelo

  • PD Histórica 

 Modelos Econométricos y de Machine Learning de la PD  

  • Fatores de riesgo que afectan el default

    • Macroeconómicos

    • Idiosincráticos

  • PD Regresión Logística

  • PD Regresión COX

  • PD Log-log Complementary

  • PD Regresión Logística Data Panel

  • Machine Learning para estimar la PD

​Calibración de la PD  

  • Introducción a la Calibración

  • Estimación Anchor Point

  • Mapping de Score a PD

  • Estructura temporal de la PD

    • PD Marginal

    • PD Forward

    • PD Acumulada

  • Técnicas de Mapeo de PD´s a estructura temporal

  • Añadas o cosechas de PD

​Ajuste al Ciclo Económico de la PD

  • Introducción de Ajuste al Ciclo Económico

  • Directivas sobre el ciclo económico en la PD

  • Modelos de PD Trough The Cycle (PD TTC)

  • Consideraciones del Ajuste al ciclo enfoque “Variable escalar”

Matrices de Transición y PD 

  • Propiedades de las matrices de transición

  • Multi-year transition matrix

    • Tiempo discreto

    • Tiempo continuo

    • Matriz Generatriz

    • Exponencial de una matriz

  • Método de duración 

  • Método Cohort

  • Gestión del error

Modelización PD Lifetime

  • Probability Weighted

  • Forward Looking

  • Modelización del Lifetime PD 

  • Modelización PD Forecasting

  • PD Point in Time Forecasting

  • Cadenas de Markov

  • Ejercicio 48: Regresión Cox en R y SAS

  • Ejercicio 49: Regresión Log-Log Complementary en SAS

  • Ejercicio 50: Calibración de la PD por edad de operación en SAS

  • Ejercicio 51: Calibración de PD con regresión COX en SAS

  • Ejercicio 52: Calibración de PD con log-log complementary en SAS

  • Ejercicio 53: Calibración de PD con modelo logístico en SAS

  • Ejercicio 54: Calibración de la PD por cosecha o añada en SAS

  • Ejercicio 55: Estimación de la PD Point in Time en Excel

  • Ejercicio 56: Machine Learning para estimar PD

  • Ejercicio 57: Ajuste al ciclo para empresas en Excel y Solver.

  • Ejercicio 58: Estimación PD TTC Cointregración

  • Ejercicio 59: Regresión logística PD TTC en SAS

  • Ejercicio 60: Modelo de Supervivencia PD TTC en SAS

  • Ejercicio 61: Integral en SAS para estimar PD de LDP correlación

  • Ejercicio 62: Calibración curva CAP Escala Maestra en Excel

  • Ejercicio 63: PD Bayesiana en R

  • Ejercicio 64: Matrices de transición en Excel y SAS

  • Ejercicio 65: Regresión Multinomial para estimar PD Lifetime

  • Ejercicio 66: Multistage Cadenas de Markov en R

Módulo 15: LGD en carteras Retail 

 

  • Procesos de recuperación en financiación P2P 

  • Defaulted Weighted Average LGD 

  • LGD para performing y no performing exposures

  • Tratamiento de los colaterales en el IRB

  • Enfoque Workout

    • Técnicas para determinar la tasa de descuento

    • Tratamiento de las recuperaciones, gastos y costes de recuperación

    • Ciclos de Default

    • Gastos de recuperación

  • LGD en carteras de consumo

 

Módulo 16: Modelos de Scoring Econométricos

y Machine Learning para  la LGD

 

  • Ventajas e inconvenientes de los Modelos Predictivos de LGD

  • Modelos Forward Looking incorporando variables Macroeconómicas

  • Modelos paramétricos, no paramétricos y transformation regressions

Modelos Econométricos y de Machine Learning LGD

  • Regresión Lineal y transformación Beta

  • Regresión Lineal y transformación Logit

  • Regresión Líneal y trasnsformación Box Cox

  • Regresión Logística y Lineal

  • Regresión Logística y no Lineal

  • Censored Regression

  • Generalized Additived Model

  • Redes Neuronales

  • SVM

  • Regresión Beta

  • Inflated beta regression

  • Fractional Response Regression

  • Ejercicio 67: Regresión Logística y lineal LGD en SAS

  • Ejercicio 68: Redes Neuronales y SVM LGD

  • Ejercicio 69: Generalized Additived Model LGD en R

  • Ejercicio 70: Beta Regression Model LGD en R y SAS

  • Ejercicio 71: Censored Regression Model LGD en R

  • Ejercicio 72: Inflated Beta Regression en SAS

  • Ejercicio 73: Comparativo del performance de los modelos usando test de Calibración y precisión

Módulo 17: Modelos de EAD

 

  • EAD para líneas de crédito

  • Horizonte temporal

  • Transformaciones para modelizar el CCF

  • Enfoques para estimar el CCF

  • Enfoque Fixed Horizon

  • Enfoque Cohort

  • Enfoque Variable time horizon

Modelos Econométricos y de Machine Learning de la CCF

  • Regresión lineal

  • Regresión Logística

  • Generalized Additived Model

  • Redes Neuronales

  • SVM

  • Regresión Beta

  • Inflated beta regression

  • Fractional Response Regression

EAD para P2P

  • Ajustes en la EAD

  • Interest Accrual

  • Estimación CCF PIT

  • Modelización de la utilización lifetime

  • Modelización del prepago lifetime

  • Ejercicio 74: Estimación y ajustes para EAD IFRS 9 en excel y R

  • Ejercicio 75: Redes Neuronales y SVM CCF

  • Ejercicio 76: Generalized Additived Model CCF en R

  • Ejercicio 77: Beta Regression Model CCF en R y SAS

VALIDACIÓN de PD, LGD y EAD
 
 Módulo 18: Backtesting PD

 

  • Validación de la PD en IRB

  • Validación de la PD en IFRS 9

  • Backtesting PD

  • Validación de Calibración de PD

  • Hosmer Lameshow test

  • Normal test

  • Binomial Test

  • Spiegelhalter test

  • Redelmeier Test

  • Traffic Light Approach

  • Análisis Semafórico y Cuadro de mando de la PD

  • PD Stability Test

  • Forecasting PD vs PD Real en el tiempo

  • Validación con simulación de Monte Carlo

  • Ejercicio 78: Backtesting de PD en Excel

  • Ejercicio 79: Forecasting PD y PD real en Excel

  • Ejercicio 80: Validación usando Simulación de Monte Carlo


Módulo 19: Backtesting LGD

 

  • Backtesting LGD en IRB e IFRS 9

  • Ratio de precisión

  • Indicador absoluto de precisión

  • Intervalos de Confianza

  • Análisis de transición

  • Análisis de RR usando Triángulos

  • Backtesting Avanzado de LGD con enfoque vintage

  • Backtesting para modelos econométricos

  • Ejercicio 81: Comparativo del performance de los modelos usando test de Calibración y precisión.

Módulo 20: Backtesting EAD

 

  • Performance EAD 

  • Backtesitng en IRB e IFRS 9

  • R cuadrada

  • Coeficiente de Pearson

  • Spearman correlation

  • Validación usando ROC, KS y Gini

  • Ejercicio 82: Comparativo del performance de los modelos de EAD

Módulo 21: Calculadora de Pricing para Fintech

 

  • Modelo de Pricing para financiación P2P

  • Escenarios Macroeconómicos

  • Pronosticos Económicos

  • Loss Forecasting

  • Lifetime Loss Forecasting usando variables macroeconómicas

  • Ejercicio Global 83: Pricing de financiación para FINTECH: 

    • Definición de escenarios macroeconómicos

    • Impacto de los escenarios en la estimación

    • Uso del Credit Scoring

    • Modelización de LGD usando escenarios económicos

    • Modelización del CCF usando escenarios económicos

    • Modelización del Abandono

    • Modelización del Prepago

    • Modelización PD PIT con escenarios económicos

    • Modelización Lifetime PD

    • Estimación de ingresos financieros

    • Modelización flujos de caja

    • Estimación tasa de supervivencia

    • Estimación Pérdida Esperada ECL a 12 meses

    • Estimación Pérdida Esperada ECL Lifetime 

    • Modelización del tipo de interés

    • Calculadora de Pricing

    • Interpretación de Resultados en cuadro de mando