Credit Scoring, Validación y Machine Learning Nivel 1

 

 

 

OBJETIVO

 

El objetivo del curso es mostrar aplicaciones de la analítica de datos en la banca, por lo que se muestra, una amplia variedad de modelos de score aplicados al marketing, crédito, rentabilidad, fraude y recuperaciones. Además se explican las ventajas e inconvenientes de desarrollar un Credit Scoring con Big Data. 

El curso ayudará a los participantes a comprender mejor la información contenida en los datos, y a desarrollar modelos analíticos que ayuden a la toma de decisiones en la banca. 

 

Se exponen las definiciones, características y métricas sobre la analítica de Datos, la analítica Web y la analítica social.

 

Respecto a la analítica de datos, se expone un módulo, sobre el tratamiento avanzado de los datos, explicando entre otros temas, el muestreo, análisis exploratorio, segmentación y detección de outliers. 

 

Se muestran modelos predictivos de tipo econométricos, árboles de decisión, redes neuronales, redes bayesianas, Support Vector Machines etc. Más adelante se explica, detalladamente, la validación de estos modelos.

 

Se muestran metodologías y ejercicios prácticos de Customer Life Time Value. Y, en otro contexto, se exponen temas como la analítica en las redes sociales mostrando las principales métricas y desarrollando ejercicios de visualización de gráficos.

 

El curso incluye metodologías como Text Mining, análisis de sentimientos y lingüística computacional. Así como ejercicios de Text Mining para tratar datos no estructurados.

 

¿QUIÉNES DEBEN ASISTIR?

 

El Curso esta dirigido a profesionistas de entidades financieras interesados en el Big Data Analytics, así como a los responsables de los departamentos de marketing, crédito, riesgos, fraude, finanzas y recuperaciones. Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística.

 

Horarios:

  • Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h

  • España, Portugal: L a V 19-22 h

 

  • Ciudad de México, Quito, Bogotá, San JoséL a V 19-22 h

Precio: 2.900 €

Nivel: Intermedio

Duración: 21 h

Material: 

Presentaciones PDF

Ejercicios en R, SAS y Excel

AGENDA Credit Scoring, Validación y Machine Learning 

 

 

Módulo 1: BIG DATA ANALYTICS

 

  • Analítica de datos

    • Tecnologías, herramientas y tendencias en Big Data Analytics

    • Proveedores de analítica de Big Data

    • Tecnologías de código abierto

    • Características de una plataforma de Biga Data

    • Ejemplos de aplicaciones de Big Data Analytic

    • Modelo de proceso analítico

      • Actores en el Big Data Analytics

      • Data warehouse administrator

      • Experto en Negocios

      • Data Scientist

      • Software tool vendors

  • Analítica Web

    • Analítica Web 2.0

    • Métricas: visitas, visitantes, tasa de salida, etc.

    • KPIs

    • Google Analytics

    • Informes

    • Segmentación

    • Herramientas de analítica Web

    • Analítica Web móvil

  • Analítica Social

    • Definición

    • Métricas sociales

    • KPIs

    • Herramienta de analítica social

    • Estadística social

    • Herramienta de investigación y monitorización

    • Herramienta de analítica de Web social

    • Herramienta de reputación e influencia social

    • Herramientas de análisis de actividad en redes sociales

    • Facebook

    • Twitter

    • Análisis de sentimientos

    • Casos de estudio de analítica social

    • Internacional Privacy Regulations

 

 

Módulo 2: Gestión avanzada de los datos

 

  • Tipología de datos

  • Datos transaccionales

  • Unstructured data embebida en documentos de texto

  • Social Media Data

  • Fuentes de datos

  • Revisión del dato

  • Definición del Target

  • Horizonte temporal de la variable objetivo

  • Muestreo

    • Muestreo Aleatorio

    • Muestreo Estratificado

    • Muestreo Rebalanceado

  • Análisis Exploratorio:

    • Histogramas

    • Q-Q Plot

    • Análisis de momentos

    • Box Plot

  • Tratamiento de los valores Missing

    • Imputación

    • Borrar

    • Mantener

  • Técnicas avanzadas de detección de Outliers y tratamiento

    • Z-Score

    • Distancia de Mahalanobis

  • Estandarización de los Datos

  • Categorización de variables

    • Equal Interval Binning

    • Equal Frecuency Binning

    • Prueba Ji-Cuadrada

  • Binary Coding

  • WOE Coding

    • Definición WOE

    • Análisis Univariante con variable Target

    • Selección de variables

    • Tratamiento de Variables continuas

    • Tratamiento de Variables Categóricas

    • Fisher Score

    • Gini

    • Information Value

    • Pearson Correlation

    • Cramer Von Misses

    • Optimización de variables continuas

    • Optimización de variables categóricas

    • Àrboles de Decisión

  • Segmentación

    • Decisión Experta

    • Estadística

      • Àrboles de Decisión

      • K Means Clustering

      • Finite Mixture Model

      • Mixtura gaussiana Univariante

      • Mixtura gaussiana Bivariante

  • ​Ejercicio 1: Análisis Exploratorio en SAS

  • Ejercicio 2: Detección y tratamiento de Outliers usando Z-score

  • Ejercicio 3: Técnicas de Muestreo rebalanceado en SAS

  • Ejercicio 4: Muestreo estratificado y Aleatorio

  • Ejercicio 5: Análisis del Weight of Evidence en Excel

  • Ejercicio 6: Análisis univariante en percentiles en SAS

  • Ejercicio 7: Análisis univariante óptimo variable continua en Excel

  • Ejercicio 8: Estimación del KS, Gini e IV de cada variable en Excel

  • Ejercicio 9: Validación de variables usando Pearson correlation y Fisher Score

  • Ejercicio 10: Optimización de variables categóricas en SAS

  • Ejercicio 11: Análisis Univariante con árboles de decisión en SPSS

  • Ejericicio 12: Segmentación con árboles de decisión 

  • Ejercicio 13: Segmentación usando K mans Clustering en R

  • Ejercicio 14: Segmentación con Mixtura gaussiana univariante y bivariante

 

Módulo 3: Modelos Predictivos

 

  • Definición del Target 

    • Default

    • Abandono

    • Concesión

    • Fraude

    • Gross Response

    • Customer Lifetime Value

    • Debt to Income

    • Recuperación

    • Pago de la deuda

    • Ingresos

    • Originación préstamo/línea crédito

    • Loyalty

    • Prepago

  • Definición del horizonte temporal del modelo predictivo

  • Componentes Principales para reducir variables

  • Modelos Econométricos

    • Regresión lineal

    • Regresión Logística

    • Regresión Logística Multinomial

    • Regresión Piecewise

    • Regresión Logística Panel Data

    • Regresión Cox

  • Interpretación de los coeficientes

  • Interpretación de los Odds Ratios

  • Uso de Random Forest

  • Árboles de Decisión

    • CART

    • CHAID

  • Redes Neuronales

    • Perceptrón Multicapa

  • Algoritmos Genéticos

  • Redes Bayesianas

  • Support Vector Machines

  • Ejercicio 15: Análisis de Componentes principales en SAS

  • Ejercicio 16: Regresión Logística método stepwise en SAS

  • Ejercicio 17: Regresión logística multinomial

  • Ejercicio 18: Regresión Piecewise en Excel y SAS

  • Ejercicio 19: Redes Neuronales: perceptron en SAS

  • Ejercicio 20: Árboles de decisión CHAID en SAS

  • Ejercicio 21: Regresión Logística Panel Data en Stata

  • Ejercicio 22: Cox Regression en R y SAS

  • Ejercicio 23: Redes Bayesianas en R 

  • Ejercicio 24: Support vector machines en R

  • Ejercicio 25: Random Forest en R

 

 

 

Módulo 4: Validación del modelo

 

  • Verificación p-values en regresiones

  • R cuadrado, MSE, MAD

  • Diagnóstico de los residuos

  • Test de Bondad de Ajuste

    • Deviance

    • Bayesian Information Criterion (BIC)

    • Akaike Information Criterion 

  • Multicolinealidad Multivariante

  • Validación cruzada

  • Bootstrapping del error

  • Matriz de confusión caso binario

  • Matriz de confusión caso multinomial

  • Prueba de Estabilidad

  • Principales test de poder discriminante:

    • KS

    • Curva ROC

    • Curva Lift

    • Gini Index

    • Cumulative Accuracy Profile

    • Distancia de Kullback-Leibler

    • Pietra Index

    • Entropía condicional

    • Valor de Información

    • Tau de Kendall

    • Brier Score

    • Distancia de Mahalanobis

    • Divergencia

    • Hosmer Lemeshow

  • Intervalos de confianza

  • Jackknifing con test de poder discriminante

  • Bootstrapping con test de poder discriminante

  • Ejercicio 26: Test de Bondad de Ajuste Regresión líneal

  • Ejercicio 27: Test de Bondad de Ajuste Regresión Logística

  • Ejercicio 28: Validación cruzada en SAS

  • Ejercicio 29: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia en SAS

  • Ejercicio 30: Bootstrapping de parámetros SAS

  • Ejercicio 31: Jackkinifng en SAS

  • Ejercicio 32: Bootstrapping de Gini/ROC en SAS

 

 

Módulo 5: Desarrollo de Scorecards

 

  • Asignación de puntuación

  • Clasificación del Scorecard

    • Scorecard WOE

    • Scorecard Binario

    • Scorecard Continuo

  • Reescalamiento del Scorecard

    • Análisis del Factor y Offset

    • Scorecard WOE

    • Scorecard Binario

  • Técnicas de Reject Inference

    • Cut-Off

    • Parcelling

    • Fuzzy Augmentation

  • Técnicas Avanzadas de punto de corte 

  • Ejercicio 33: Scorecard Binario en Excel y SAS

  • Ejercicio 34: Scorecard WOE en Excel, R y SAS

  • Ejercicio 35: Reject Inference Fuzzy Augmentation en SAS

  • Ejercicio 36: Selección del Punto de Corte en Excel y SAS

 

 

Módulo 6: Tipología de Scores

 

  • Response Scoring

  • Income Score

  • DTI Score

  • Credit Scoring de Admisión

    • Score de Tarjetas de crédito

    • Score de Hipotecas

    • Score de consumo

    • Score de Automóvil

  • Behavior Score

  • Transaction Score

  • Score de Ingresos

  • Score de Abandono

  • Score de Fraude en Admisión

  • Score de Fraude en  Seguimiento

  • Collection Score

  • Recovery Score

  • Revenue Score

  • Big Data Scoring

    • Ventajas y criticas

  • Ejercicio 37:Bevavior Score con regresión logìstica en SAS

  • Ejercicio 38: Behavior Score Regresión Cox

  • Ejercicio 39: Behavior Score Regresión Logística Panel Data

  • Ejercicio 40: Score de Ingresos en SAS

  • Ejercicio 41: Collection Score en SAS

  • Ejercicio 42: Recovery Score Excel y SAS

  • Ejercicio 43: Debt To Income Score en SAS

 

 

Módulo 7: Customer Life Time Value (CLV)

 

  • Definición CLV

  • Estrategias para incrementar el CLV

  • Customer Loyalty

    • Enfoque RFM

    • Past Customer Value

    • Share Of Wallet

  • Modelización del CLV

  • Enfoque Agregado

  • Enfoque Individual

  • Componentes del CLV

  • Drivers del CLV

  • Modelo de Retención simple

  • Modelo de Retención General

  • Modelos Supervivencia

  • Ejercicio 44: Estimación CLV en Excel

  • Ejercicio 45: Modelo de Retención simple en SAS

  • Ejercicio 46: Modelo de Retención General  y análisis de supervivencia y Hazard rates en SAS

 

Módulo 8: Analítica Social 

 

 

  • Analítica en las Redes Sociales

  • Definiciones de redes

  • Gráficos

  • Sociogramas

  • Vértices, bordes, nodos, pesos

  • Principales Métricas en la Analìtica Social

  • Medidas de centralidad en las redes

  • Social Network learner

  • Local Model

  • Network Model

  • Probabilistic Relational Neighbor Classifier

  • Relational Logisitic Regression

  • Collective Inferencing

  • Visualización de las Redes Sociales

  • Taxonomía de las visualizaciones

  • Visualización y analítica

  • Analítica Social en Facebook usando R

  • Analítica Social en Twitter usando R

  • Analítica Social en Google Analytics usando R

  • Ejercicio 47: Carga de datos y Gráficos en R

  • Ejercicio 48: Añadir Vértices en los gráficos R

  • Ejercicio 49: Visualización de Social Networks en R

 

Módulo 9: Text Mining

 

 

  • Definición Text Mining

  • Unstructured Data

  • Análisis Exploratorio

  • Modelización predictiva en el Text Mining

    • K-Nearest Neighbors

  • Text Mining en las Redes Sociales

    • Keyword Search

    • Algortimos de clasificación

    • Algoritmos Clustering

  • Análisis de Sentimientos

  • Sentimiento en lingüística y Psicología

    • Subjetividad

    • Facticidad

  • Lingüística Computacional

    • Lexicón y Corpora

    • Enfoque basado en reglas

    • Enfoque Machine Learning 

  • Ejercicio 50: Text Mining de un documento en R

  • Ejercicio 51: Text Mining de un documento la Web en R

  • Ejercicio 52: Cleaning Text Data en R

  • Ejercicio 53: Modelo predictivo Text Mining