Credit Scoring, Machine Learning y Validación en Python y R Nivel Básico
OBJETIVO
El objetivo del curso es mostrar toda la tipología de modelos de scoring y rating usados en las entidades financieras en el ciclo de crédito. En cuanto a portfolios de consumo se exponen modelos predictivos durante la fase del ciclo de crédito y el marketing incluyendo: propensión a la compra, admisión, seguimiento, fraude, recobro, pricing y rentabilidad. En las carteras de pequeños negocios, emprendedores y pymes se muestran diversas herramientas de scoring y rating.
-
Se abordan innovadoras técnicas para la construcción de algoritmos como árboles decisión, random forest, support vector machine, redes neuronales. Así como modelos econométricos como regresiónes, no líneales, logísticas para panel data, de cox, beta, etc. Y otras más savanzadas como el credit scoring bayesiano y el análisis multicriteria
-
Se explica comó construir scorings de Admisión, Ingreso, Abandono, Fraude, Recobro, Rentabilidad, transaccionales, comportamentales, Customer Lifetime Value, Marketing entre otros. Empleando el uso de redes y la analítica social.
-
Aprovechando la experiencia tanto en Europa como América de Fermac Risk, el curso expone los procedimientos, estrategias, políticas y estructura organizativa del Recobro y la admisión.
-
Se aborda pormenorizadamente como construir modelos de credit rating y scoring para pymes. Conteniendo scoring para las recientes pymes dedicadas a la tecnología. Además de exponen modelos psicométricos aplicados en microfinanzas, a emprendedores y startups.
-
Se han añadido modelos avanzados y recientes para construir modelos tipo scoring para estimar la LGD y EAD en las carteras de consumo y pymes.
-
Finalmente se muestran herramientas de rating para portfolios corporativos, soberanos y de project finance.
-
Los ejercicios están hechos en R, SAS y Excel con VBA.
¿QUIÉNES DEBEN ASISTIR?
El Curso esta dirigido a profesionistas de riesgo de crédito, directivos de entidades financieras, así como a los responsables de los departamentos de recobro y finanzas. Responsables de crédito y cobranzas de empresas con carteras de crédito al consumo, PYMES y Corporativos. Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística.
Horarios:
-
Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h
-
España, Portugal: L a V 19-22 h
-
Ciudad de México, Lima, Quito, Bogotá, San José: L a V 19-22 h
Precio: 4.900 €
Nivel: Avanzado
Duración: 30 h
Material:
Presentaciones PDF, Ejercicios Excel, R y SAS
AGENDA
Credit Scoring, Machine Learning y Validación en Python y R Nivel Básico
Agenda Total
CONSUMO
Módulo 1: Credit Scoring y Modelos Predictivos
-
Modelos Predictivos en el entorno actual
-
Aplicaciones del Credit Scoring
-
Diseño y Construcción de Modelos de Credit Scoring
-
Ventajas y Desventajas
-
Modelos para afrontar crisis financierias
Módulo 2: Gestión avanzada de los datos
-
Tipología de datos
-
Datos transaccionales
-
Unstructured data embebida en documentos de texto
-
Social Media Data
-
Fuentes de datos
-
Revisión del dato
-
Definición del Target
-
Horizonte temporal de la variable objetivo
-
Muestreo
-
Muestreo Aleatorio
-
Muestreo Estratificado
-
Muestreo Rebalanceado
-
-
Análisis Exploratorio:
-
Histogramas
-
Q-Q Plot
-
Análisis de momentos
-
Box Plot
-
-
Tratamiento de los valores Missing
-
Imputación
-
Borrar
-
Mantener
-
-
Técnicas avanzadas de detección de Outliers y tratamiento
-
Z-Score
-
Distancia de Mahalanobis
-
-
Estandarización de los Datos
-
Categorización de variables
-
Equal Interval Binning
-
Equal Frecuency Binning
-
Prueba Ji-Cuadrada
-
-
Binary Coding
-
WOE Coding
-
Definición WOE
-
Análisis Univariante con variable Target
-
Selección de variables
-
Tratamiento de Variables continuas
-
Tratamiento de Variables Categóricas
-
Fisher Score
-
Gini
-
Information Value
-
Pearson Correlation
-
Cramer Von Misses
-
Optimización de variables continuas
-
Optimización de variables categóricas
-
Àrboles de Decisión
-
-
Segmentación
-
Decisión Experta
-
Estadística
-
Àrboles de Decisión
-
K Means Clustering
-
Finite Mixture Model
-
Mixtura gaussiana Univariante
-
Mixtura gaussiana Bivariante
-
-
-
Ejercicio 1: Análisis Exploratorio en SAS
-
Ejercicio 2: Detección y tratamiento de Outliers usando Z-score
-
Ejercicio 3: Técnicas de Muestreo rebalanceado en SAS
-
Ejercicio 4: Muestreo estratificado y Aleatorio
-
Ejercicio 5: Análisis del Weight of Evidence en Excel
-
Ejercicio 6: Análisis univariante en percentiles en SAS
-
Ejercicio 7: Análisis univariante óptimo variable continua en Excel
-
Ejercicio 8: Estimación del KS, Gini e IV de cada variable en Excel
-
Ejercicio 9: Validación de variables usando Pearson correlation y Fisher Score
-
Ejercicio 10: Optimización de variables categóricas en SAS
-
Ejercicio 11: Análisis Univariante con árboles de decisión en SPSS
-
Ejercicio 12: Segmentación con árboles de decisión
-
Ejercicio 14: Segmentación usando K means Clustering en R
-
Ejercicio 15: Segmentación con Mixtura gaussiana univariante y bivariante
Módulo 3: Modelos Predictivos
-
Definición del Target
-
Default
-
Abandono
-
Concesión
-
Fraude
-
Gross Response
-
Customer Lifetime Value
-
Debt to Income
-
Recuperación
-
Pago de la deuda
-
Ingresos
-
Originación préstamo/línea crédito
-
Loyalty
-
Prepago
-
-
Definición del horizonte temporal del modelo predictivo
-
Componentes Principales para reducir variables
-
Modelos Econométricos
-
Regresión lineal
-
Regresión Logística
-
Regresión Logística Multinomial
-
Regresión Piecewise
-
Regresión Logística Panel Data
-
Regresión Cox
-
-
Interpretación de los coeficientes
-
Interpretación de los Odds Ratios
-
Uso de Random Forest
-
Árboles de Decisión
-
CART
-
CHAID
-
-
Redes Neuronales
-
Perceptrón Multicapa
-
-
Algoritmos Genéticos
-
Redes Bayesianas
-
Support Vector Machines
-
Ejercicio 15: Análisis de Componentes principales en SAS
-
Ejercicio 16: Regresión Logística método stepwise en SAS
-
Ejercicio 17: Regresión logística multinomial
-
Ejercicio 18: Regresión Piecewise en Excel y SAS
-
Ejercicio 19: Redes Neuronales: perceptron en SAS
-
Ejercicio 20: Árboles de decisión CHAID en SAS
-
Ejercicio 21: Regresión Logística Panel Data en Stata
-
Ejercicio 22: Cox Regression en R y SAS
-
Ejercicio 23: Redes Bayesianas en R
-
Ejercicio 24: Support vector machines en R
-
Ejercicio 25: Random Forest en R
Módulo 4: Validación del modelo
-
Verificación p-values en regresiones
-
R cuadrado, MSE, MAD
-
Diagnóstico de los residuos
-
Test de Bondad de Ajuste
-
Deviance
-
Bayesian Information Criterion (BIC)
-
Akaike Information Criterion
-
-
Multicolinealidad Multivariante
-
Validación cruzada
-
Bootstrapping del error
-
Matriz de confusión caso binario
-
Matriz de confusión caso multinomial
-
Prueba de Estabilidad
-
Principales test de poder discriminante:
-
KS
-
Curva ROC
-
Curva Lift
-
Gini Index
-
Cumulative Accuracy Profile
-
Distancia de Kullback-Leibler
-
Pietra Index
-
Entropía condicional
-
Valor de Información
-
Tau de Kendall
-
Brier Score
-
Distancia de Mahalanobis
-
Divergencia
-
Hosmer Lemeshow
-
-
Intervalos de confianza
-
Jackknifing con test de poder discriminante
-
Bootstrapping con test de poder discriminante
-
Ejercicio 26: Test de Bondad de Ajuste Regresión líneal
-
Ejercicio 27: Test de Bondad de Ajuste Regresión Logística
-
Ejercicio 28: Validación cruzada en SAS
-
Ejercicio 29: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia en SAS
-
Ejercicio 30: Bootstrapping de parámetros SAS
-
Ejercicio 31: Jackkinifng en SAS
-
Ejercicio 32: Bootstrapping de Gini/ROC en SAS
Módulo 5: Desarrollo de Scorecards
-
Asignación de puntuación
-
Clasificación del Scorecard
-
Scorecard WOE
-
Scorecard Binario
-
Scorecard Continuo
-
-
Reescalamiento del Scorecard
-
Análisis del Factor y Offset
-
Scorecard WOE
-
Scorecard Binario
-
-
Técnicas de Reject Inference
-
Cut-Off
-
Parcelling
-
Fuzzy Augmentation
-
Extrapolation
-
-
Definición del punto de corte
-
Mantenimiento del punto de corte
-
Modelos tradicionales para establecer el punto de corte
-
Modelo de optimización para establecer el Cut-Off
-
Metodología ROC para el punto de corte (Cut-Off)
-
-
Ejercicio 33: Scorecard Binario en Excel y SAS
-
Ejercicio 34: Scorecard WOE en Excel, R y SAS
-
Ejercicio 35: Reject Inference Fuzzy Augmentation en SAS
-
Ejercicio 36: Selección del Punto de Corte en Excel y SAS
-
Ejercicio 37: Estimación optima del Cut-Off en Excel
-
Ejercicio 38: Estimación del Cut Off y la curva ROC
Módulo 6: Tipología de Scores
-
Response Scoring
-
Income Score
-
DTI Score
-
Credit Scoring de Admisión
-
Score de Tarjetas de crédito
-
Score de Hipotecas
-
Score de consumo
-
Score de Automóvil
-
-
Behavior Score
-
Response Score
-
Transaction Score
-
Score de Ingresos
-
Score de Abandono
-
Score de Fraude en Admisión
-
Score de Fraude en Seguimiento
-
Collection Score
-
Recovery Score
-
Revenue Score
-
Big Data Scoring
-
Ventajas y criticas
-
-
Ejercicio 39:Bevavior Score con regresión logìstica en SAS
-
Ejercicio 40: Behavior Score Regresión Cox
-
Ejercicio 41: Behaviour Score con Árboles de Decisión
-
Ejercicio 42: Behavior Score Regresión Logística Panel Data
-
Ejercicio 43 : Fraud Score con redes neuronales
-
Ejercicio 44: Score de Ingresos en SAS
-
Ejercicio 45: Collection Score en SAS
-
Ejercicio 46: Recovery Score Excel y SAS
-
Ejercicio 47: Debt To Income Score en SAS
-
Ejercicio 48 :Score de Abandono en SAS
Módulo 7: Customer Life Time Value (CLV)
-
Definición CLV
-
Estrategias para incrementar el CLV
-
Customer Loyalty
-
Enfoque RFM
-
Past Customer Value
-
Share Of Wallet
-
-
Modelización del CLV
-
Enfoque Agregado
-
Enfoque Individual
-
Componentes del CLV
-
Drivers del CLV
-
Modelo de Retención simple
-
Modelo de Retención General
-
Modelos Supervivencia
-
Scoring CLV
-
Ejercicio 49: Estimación CLV en Excel
-
Ejercicio 50: Modelo de Scoring de Retención simple en SAS
-
Ejercicio 51: Modelo de Scoring de Retención General y análisis de supervivencia y Hazard rates en SAS
Módulo 8: Analítica Social para construir Modelos de Scoring
-
Analítica en las Redes Sociales
-
Definiciones de redes
-
Gráficos
-
Sociogramas
-
Vértices, bordes, nodos, pesos
-
Principales Métricas en la Analítica Social
-
Medidas de centralidad en las redes
-
Social Network learner
-
Local Model
-
Network Model
-
Probabilistic Relational Neighbor Classifier
-
Relational Logisitic Regression
-
Collective Inferencing
-
Visualización de las Redes Sociales
-
Taxonomía de las visualizaciones
-
Visualización y analítica
-
Analítica Social en Facebook usando R
-
Analítica Social en Twitter usando R
-
Analítica Social en Google Analytics usando R
-
Ejercicio 52: Carga de datos y Gráficos en R
-
Ejercicio 53: Añadir Vértices en los gráficos R
-
Ejercicio 54: Visualización de Social Networks en R
-
Ejercicio 55 : Score de Abandono en SAS
Módulo 9: Metodologías Avanzadas de Credit Scoring
-
Scoring de Comportamiento Bayesiano
-
Distribución a priori y Posteriori
-
-
Scoring de Múltiples respuestas
-
Scoring Multicriteria Analysis
-
Credit Scoring usando variables macroeconómicas
-
Ejercicio 56: Credit Scoring con variables macroeconómicas
-
Ejercicio 57: Behavior Score Bayesiano vs. Behavior Score Determinístico
-
Ejercicio 58: Credit Scoring Multicriteria
Módulo 10: Scoring para LGD y EAD de Consumo
-
Ventajas e inconvenientes de los Modelos Predictivos de LGD
-
Modelos paramétricos, no paramétricos y transformation regressions
-
Tipología de Modelos Multivariantes de LGD
-
Regresión Lineal y transformación Beta
-
Regresión Lineal y transformación Logit
-
Regresión Lineal y trasnsformación Box Cox
-
Regresión Logística y Lineal
-
Regresión Logística y no Lineal
-
Censored Regression
-
Generalized Additived Model
-
Redes Neuronales
-
Regresión Beta
-
Inflated beta regression
-
Fractional Response Regression
-
-
Ejercicio 59: Regresión Logística y lineal LGD en SAS
-
Ejercicio 60: Redes Neuronales LGD
-
Ejercicio 61: Generalized Additived Model EAD en R
-
Ejercicio 62: Beta Regression Model LGD y EAD en R y SAS
-
Ejercicio 63: Censored Regression Model LGD en R
-
Ejercicio 64: Inflated Beta Regression en SAS
-
Ejercicio 65: Comparativo del performance de los modelos usando test de Calibración y precisión.
Módulo 11: Credit Scoring Psicométricos para Emprendedores
-
Fuentes de Información
-
Muestra
-
Variables Estándar
-
Variables Psicológicas
-
Inteligencia Emocional
-
Análisis Univariante de las variables Psicológicas
-
Modelos Multivariante
-
Regresión Logística
-
Árbol de Decisión
-
Análisis Discriminante
-
Validación Credit Scoring Psicométrico
-
Ejercicio 66: Comparativo entre Regresión Logística, Árbol de Decisión y Análisis discriminante
Módulo 12: Credit Scoring para Start Up
-
Definición de Start Up
-
Start Up en España y América Latina
-
Start Up lideradas por Mujeres
-
Fuentes de Información
-
Análisis del Sector
-
Variables Relevantes
-
Variables Económicas
-
Regresión Logística
-
Árbol de Decisión
-
Validación del Credit Scoring
-
Ventajas e Inconvenientes del credit scoring para las StartUps
-
Ejercicio 67: Comparativo entre Regresión Logística y Árbol de Decisión
PYMES
Módulo 14: Credit Scoring para PYMES
-
Información en países desarrollados
-
Información en países emergentes
-
PYMES lideradas por Mujeres y Hombres
-
Principales bloques de variables
-
Financieras
-
Perfil del Negocio
-
Situación frente al Mercado
-
Reputación y Calidad
-
Información del Propietario
-
Variables de control
-
-
Análisis Univariante
-
Modelos Predictivos
-
Árboles de Decisión
-
Support Vector Machine
-
Regresión Logística
-
Redes Neuronales
-
-
Diagnóstico en regresión logística
-
Medidas de performance
-
Ejercicio 68: Scorecard para PYMES con análisis univariante y los siguientes modelos predictivos:
-
Regresión logística
-
Árboles de decisión
-
Redes neuronales
-
Support Vector Machine
-
Multicriteria analysis
-
Medidas de performance
-
Módulo 15: Credit Rating para PYMES.
-
Análisis de Modelos comerciales de Rating SME:
-
Moody´s RiskCalc
-
Z-score
-
S&P
-
Axesor España
-
-
Principales Ratios Financieros
-
Tratamiento de datos
-
Análisis Univariante
-
Transformación Beta
-
-
Selección de Bloques de variables
-
Análisis de Componentes Principales
-
-
Variables Cualitativas
-
Definición de Default
-
Horizonte Temporal
-
Modelos Multivariante
-
Regresión Logística
-
Regresión Multinomial
-
-
Peso de Factores cualitativos y cuantitativos
-
Pruebas de Coherencia
-
Estimación y Calibración de PD
-
Definición y creación de Escala Maestra
-
Mapeo de PD a Escala Maestra
-
Ejercicio 69: Análisis Univariante con Ratios Financieros en Excel
-
Ejercicio 70: Análisis de Componentes principales en SAS
-
Ejercicio 71: Modelo Multivariante en SAS
-
Ejercicio 72: Prueba de Coherencia en Excel
-
Ejercicio 73: Factores cualitativos y Cuantitativos del Rating
-
Ejercicio 74: Estimación de PD y mapeo a Escala Maestra
Módulo 16: Credit Scoring para PYMES Tecnológicas
-
Definición PYME Tecnológica
-
Sector de Tecnología e importancia reciente en mercados desarrollados y emergentes
-
Principales variables y bloques de información
-
Inclusión de variables económicas en el modelo
-
Modelos de Regresión logística
-
Calidad de la Regresión logística
-
Validación del credit scoring
-
Stress Testing en el Credit Scoring
-
Ejercicio 75: Credit Scoring incluyendo variables económicas en SAS
-
Ejercicio 76: Análisis de Stress Testing en las variables económicas en SAS
Módulo 17: Modelo de Credit Scoring de Vanguardia para MicroEmpresas
-
Empresas de Microfinanzas
-
Principales dificultades del credit scoring en microcréditos
-
Variable Target
-
Fuentes de datos
-
Principales Variables en microcréditos
-
Selección de variables
-
Análisis Univariante WOE
-
Análisis Univariante Dummy
-
Modelo Multivariante
-
Regresión Logística WOE vs. Regresión Logística Dummy
-
Ajustes Estadísticos al credit scoring de microcréditos
-
Calidad de la Regresión logística
-
Validación del credit scoring
-
Caso de Estudio: Scoring de microcréditos de país emergente con análisis univariante, modelo multivariante, scorecard y validación del modelo
-
Ejercicio 77: Comparativo entre Regresión Logística WOE frente a la Regresión Logística Dummy
Módulo 18: LGD Score para PYMES
-
Definición y Uso de la LGD para PYMES
-
Estimación de la LGD en PYMES
-
LGD por industria
-
LGD en mercado desarrollados y Emergentes
-
Variable Target
-
Variables predictivas
-
Variables Económicas
-
Horizonte Temporal
-
Modelos Predictivos de LGD
-
Regresión OLS
-
Regresión Logística
-
-
Interacción de Recovery y Collection Scoring
-
Ejercicio 78: Recovery Score en Excel y SAS
-
Caso Estudio: Estudio de LGD para PYMES en país emergente
CORPORATE, SOBERANOS Y PROJECT FINANCE
Módulo 19: Rating Empresas Corporate
-
Factores cualitativos y cuantitativos en el Rating Corporate
-
Análisis del Rating Externo
-
Metodología de jerarquía experta
-
Tratamiento Análisis Univariante tipo "U-Shape"
-
Factores Financieros y Cualitativos
-
Integración de enfoque estadístico y componentes expertos
-
Rating Replica
-
Ejercicio 79: Rating Corporate Replica
Módulo 20: Rating Soberano
-
Riesgo Soberano
-
Riesgo de transferencia
-
Modelización Rating País
-
Modelo de Rating Soberano países emergentes
-
Modelo de Rating Soberano países desarrollados
-
Análisis Univariante
-
Shadow AR
-
Modelo Multivariante Avanzado para Rating Soberano
-
Ejercicio 80: Rating Soberano en SAS
Módulo 21: Rating Financiación Especializada
-
Rating Project Finance: Fases y Stand Alone
-
Principales variables financieras y cualitativas del proyecto
-
Variables en Basilea II
-
Rating Object Finance
-
Rating en LBO
-
Rating en embarcaciones y aerolíneas
-
Rating en operadores de telecomunicaciones
-
Tratamiento de Matrices y Filiales
-
Ejercicio 81: Rating Project Finance en Excel