Ensayos. Revista de economía
41(1), 17-52, 2022
ISSN-E: 2448-8402 | ISSN-I: 1870-221X
DOI: 10.29105/ensayos41.1-2
Artículos

Modelo de puntuación crediticia para tarjeta de crédito en México: una aproximación logística

Credit Scoring Model for Credit Card in Mexico: A Logit Approach

Marco Antonio Reyes Morales*✉:marco_antonio1125@hotmail.com

Miriam Sosa


UNAM
 

* marco_antonio1125@hotmail.com

Resumen

El riesgo de crédito es una de las principales preocupaciones de los organismos de supervisión y regulación financiera, así como de las instituciones bancarias. Por lo que, se propone un modelo de puntuación crediticia basado en una regresión logística, para analizar la probabilidad de incumplimiento por segmentos de una cartera de clientes de tarjeta de crédito de una institución mexicana. Los resultados muestran que el modelo propuesto tiene un alto nivel de predictibilidad y de estabilidad, tanto fuera como dentro del periodo de modelado, la comprobación de monotonicidad, también asegura que el modelo tenga un alto nivel de precisión. La originalidad subyace en que existen escasos estudios sobre modelos de puntuación crediticia para México, el resultado del modelo tiene alto nivel de precisión y arroja como resultado una tabla de puntuación de fácil interpretación para el personal bancario. Se concluye que el modelo es confiable y con alto nivel de ajuste.

Palabras clave: 
Puntuación Crediticia; Tarjeta de Crédito; México; Modelo Logístico.

Clasificación JEL: 
G21; G32; D81.
Abstract

Credit risk is one of the main concerns of the financial institutions and supervision and regulation organisms. Thus, it is proposed a credit scoring model based on logit approach to analyze the default risk for a credit card portfolio in a Mexican financial institution. Findings show that the model proposed has a high level of prediction and stability, in and out of the sample. The monotonicity property evidences that the model has a high level of precision. The originality lies in the fact that, there is scarce literature on credit scoring models for Mexico. Results of the model are highly accurate in terms of predictability and the evidence is presented in a scoring table that is easy to interpret for all bank employees. We conclude that the model is reliable and highly accurate.

Keywords: 
Credit Scoring; Credit Card; Mexico; Logit Model.

JEL Classification: 
G21; G32; D81.

Recibido: 23  septiembre  2021; Aceptado: 08  abril  2022

Citar así: Morales, M.A. y Sosa, M. (2022). Modelo de puntuación crediticia para tarjeta de crédito en México: una aproximación logística. Ensayos Revista de Economía, 41(1), 17-52, https://doi.org/10.29105/ensayos41.1-2

CONTENIDO

Introducción

 

Una de las principales actividades y negocios bancarios es la concesión de crédito. Sin embargo, esta actividad expone a las instituciones financieras a diversos tipos de riesgos, entre los que destacan el riesgo de crédito (Caruso, Gattone, Fortuna y Di Battista, 2021[6] Caruso, G., Gattone, S. A., Fortuna, F., y Di Battista, T. (2021). “Cluster Analysis for mixed data: An application to credit risk evaluation”. Socio-Economic Planning Sciences, 73, 100850. https://doi.org/10.1016/j.seps.2020.100850
). El riesgo crediticio es aquella probabilidad de que el sujeto no cumpla con las obligaciones derivadas de una deuda (Bystrôm, 2019[4] Byström, H. (2019). “Blockchains, real-time accounting, and the future of credit risk modeling”. Ledger, 4. https://doi.org/10.5195/ledger.2019.100
). Si una gran cantidad de sujetos incumplen con sus obligaciones, no solamente se incrementarán los costos financieros de la operación, sino que, también se generarán costos administrativos asociados a la recuperación de dichos créditos; afectando, los flujos de efectivo proyectados por dichas instituciones, pudiendo generar problemas de liquidez e insolvencia (Chuan y Lin, 2009[8] Chuang, C. L., y Lin, R. H. (2009). “Constructing a reassigning credit scoring model”. Expert Systems with Applications, 36(2), 1685-1694. https://doi.org/10.1016/j.eswa.2007.11.067
).

En el contexto financiero global contemporáneo, caracterizado por una profunda interconexión entre instituciones y agentes localizados en diversos espacios geográficos, los problemas que se presenten en cierta entidad tenderán a esparcirse en el resto del sistema, incrementando el riesgo de un colapso generalizado, tal como ha ocurrido en episodios anteriores de crisis financieras: crisis mexicana de 1994; crisis asiática, 1997; crisis rusa, 1998; crisis brasileña, 1999; crisis dot com, 2001; crisis subprime, 2007 y crisis de la deuda soberana de 2012.

Ante la contingencia sanitaria generada por el COVID19 y el deterioro económico, causado por las medidas de prevención de contagio, cobra una especial importancia el análisis que las instituciones bancarias realizan sobre sus clientes, para disminuir la probabilidad de riesgo crediticio. No obstante, una sobreestimación del riesgo podría tener efectos importantes en la rentabilidad, la participación de mercado y la competitividad de los bancos. Por lo que, las instituciones financieras están sumamente interesadas en detectar las necesidades del cliente, y ofrecerle productos de acuerdo con sus capacidades financieras (Papouskova y Hajek, 2019[16] Papouskova, M., y Hajek, P. (2019). “Two-stage consumer credit risk modelling using heterogeneous ensemble learning.” Decision support systems, 118, 33-45. https://doi.org/10.1016/j.dss.2019.01.002
).

Socialmente y en el nivel macroeconómico, las decisiones de concesión de crédito son muy importantes, ya que expanden la capacidad de consumo de los individuos, y las de producción de las empresas; incrementando el nivel de actividad económica. Sin embargo, la expansión del crédito de manera irresponsable podría generar una sobrecarga financiera para los diversos agentes, derivando en fragilidad y vulnerabilidad locales, lo cual incrementaría el riesgo de una crisis bancaria.

Teóricamente, el riesgo crediticio se hace presente en una situación de información asimétrica, la cual hace referencia a que una de las contrapartes de un contrato (el banco en este caso) no posee suficiente información sobre la otra contraparte (el cliente), por lo que, se tiende a otorgar crédito a malos pagadores o malos proyectos y se niega crédito a aquellos sujetos/proyectos que tienen altas probabilidades de cumplir con sus compromisos (Vega, Santoyo, Muñoz y Altamirano, 2017[22] Vega Mena, M. D. L., Santoyo Cortés, V. H., Muñoz Rodríguez, M., y Altamirano Cárdenas, J. R. (2017). “Reducción de costos de transacción e información asimétrica: experiencias de financiamiento rural en México”. Estudios sociales (Hermosillo, Son.), 27(49), 181-209. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-45572017000100181&lng=es&tlng=es
). Para sobreponerse a dicha situación, las instituciones financieras han desarrollado y afinado técnicas de análisis de riesgo, para tratar de predecir el comportamiento de los individuos dado un conjunto de características.

Una de las técnicas más empleadas en la banca para mitigar el riesgo de crédito es el credit scoring, el cual consiste en un sistema de valoración crediticia que evalúa automáticamente el riesgo de cada solicitud de crédito (Puertas y Martí, 2012[17] Puertas Medina, R. M., y Martí Selva, M. L. (2013). “Análisis del credit scoring.” RAE-Revista de Administração de Empresas, 53(3), 303-315. http://hdl.handle.net/10251/59864). Dicho riesgo se encuentra en función de un conjunto de variables asociadas al producto y al individuo. Los modelos automáticos de calificación crediticia optimizan el análisis de la información, disminuyendo los recursos asociados a dicha actividad, permitiendo análisis y decisión oportunos. Asimismo, tienen como propósito evitar la autorización de créditos a clientes que podrían ser incumplidos, lo cual ocasionaría grandes quebrantos para la institución concededora (Siddiqi, 2017[19] Siddiqi, N. (2017). Intelligent credit scoring: Building and implementing better credit risk scorecards. John Wiley & Sons.
).

Uno de los problemas que se presenta en los sistemas de calificación crediticia es el análisis del resultado para la toma de decisión, ya que requiere de transformar los parámetros de sensibilidad de cada variable β, en la probabilidad y la creación de una tabla de puntajes. Por lo que, en el presente trabajo, se propone la sistematización de dicha información, de forma que pueda ser entendida y empleada en las distintas áreas de la entidad.

Con base en lo previamente señalado, el objetivo de esta investigación es diseñar un modelo de puntación del comportamiento crediticio, empleando una regresión logística binaria, la cual permite obtener mediante una ecuación, la probabilidad de realización de un evento (variable dependiente), dado un conjunto de variables independientes. Se ha elegido dicho modelo por la economía en términos de los recursos necesarios para estimarlo, a diferencia de modelos más complejos que requieren mayor tiempo y capacidad de procesamiento. La principal contribución radica en que existen escasos estudios sobre modelos de puntuación crediticia para México. El resultado del modelo tiene alto nivel de precisión y arroja como resultado una tabla de puntuación de fácil interpretación para el personal bancario.

El modelo de puntuación crediticia transforma la probabilidad resultante de la regresión en un puntaje, el cual se interpreta como una calificación donde a mayor puntaje, menor el riesgo o menor la probabilidad asociada. Se utilizan datos del portafolio de tarjeta de crédito de una institución financiera mexicana de abril 2017 a marzo 2018, por cuestiones de confidencialidad a los datos se les aplica un factor solo para su presentación en la presente investigación.

La hipótesis que se desprende de la presente investigación es que los modelos de credit scoring son adecuados para la toma de decisiones de crédito debido a su alto nivel de precisión, a su alta predictibilidad y a su fácil entendimiento.

La originalidad y contribución de la presente investigación subyacen en la propuesta de tabla de puntajes generada a partir del modelo y en la comprobación del ajuste de este, mediante una prueba fuera del periodo de construcción, lo cual asegura la robustez del modelo en cuanto a estabilidad en el tiempo, asegurando que el modelo califica cada cuenta del portafolio de tarjetas de crédito según su probabilidad de impago.

El trabajo se estructura en cinco partes, la segunda sección revisa la literatura relacionada, la tercera parte describe la metodología y datos empleados, la sección cuatro analiza los resultados y la última sección concluye la investigación.

1. Revisión de la literatura

 

El tema del riesgo crediticio y los indicadores asociados a su categorización, así como la toma de decisiones a partir de ellos, ha sido de sumo interés para las instituciones financieras, las autoridades económicas encargadas de la supervisión y regulación bancaria y para la sociedad en su conjunto.

La banca tiene un papel primordial en términos económicos, por las operaciones de financiamiento, pero también es la encargada de resguardar los ahorros de la sociedad, por lo que, su adecuado funcionamiento y la minimización de riesgos asociados a su operación han sido temas extensamente tratados por la literatura. Así que, existe una gran cantidad de estudios enfocados en predecir una situación de banca rota (Alaka, et al., 2018[1] Alaka, H. A., Oyedele, L. O., Owolabi, H. A., Kumar, V., Ajayi, S. O., Akinade, O. O., y Bilal, M. (2018). “Systematic review of bankruptcy prediction models: Towards a framework for tool selection.” Expert Systems with Applications, 94, 164-184. https://doi.org/10.1016/j.eswa.2017.10.040
; Davi y Radhika, 2018[9] Davi, S. S., y Radhika, Y. (2018). “A survey on machine learning and statistical techniques in bankruptcy prediction”. International Journal of Machine Learning and Computing, 8(2), 133-139. doi: 10.18178/ijmlc.2018.8.2.676
; Ansari, Ahmad, Bakar y Yaakub, 2020[3] Ansari, A., Ahmad, I. S., Bakar, A. A., y Yaakub, M. R. (2020). “A hybrid metaheuristic method in training artificial neural network for bankruptcy prediction.” IEEE Access, 8, 176640-176650. doi: 10.1109/ACCESS.2020.3026529.
, y Zhang et al., 2021[23] Zhang, Y., Liu, R., Heidari, A. A., Wang, X., Chen, Y., Wang, M., & Chen, H. (2021). “Towards augmented kernel extreme learning models for bankruptcy prediction: algorithmic behavior and comprehensive analysis.” Neurocomputing, 430, 185-212. https://doi.org/10.1016/j.neucom.2020.10.038
).

El análisis de riesgo de crédito ha sido desarrollado para organizaciones con diversos productos financieros. En términos de microcréditos, Ampountolas, Nyarko Nde y Constantinescu (2021)[2] Ampountolas, A., Nyarko Nde, T., y Constantinescu, C. (2021). “A Machine Learning Approach for Micro-Credit Scoring.” Risks, 9(3), 50. https://doi.org/10.3390/risks9030050
proponen un modelo de credit-scoring basado en aprendizaje automático, “machine learning”, sus resultados apuntan a que la metodología propuesta da resultados confiables, sobre todo, en ausencia de historiales crediticios o antecedentes de los clientes. De manera similar, Medina-Olivares, et al. (2021)[14] Medina-Olivares, V., Calabrese, R., Dong, Y., y Shi, B. (2021). “Spatial dependence in microfinance credit default.” International Journal of Forecasting. https://doi.org/10.1016/j.ijforecast.2021.05.009
, desarrollan un modelo de credit scoring para microfinancieras, la originalidad de su propuesta radica en la inclusión de efectos espaciales, para así lograr mejorar el nivel de predicción del modelo.

En línea con el objeto de estudio del presente trabajo, Okesola et al. (2017)[15] Okesola, O. J., Okokpujie, K. O., Adewale, A. A., John, S. N., & Omoruyi, O. (2017, December). An improved bank credit scoring model: a naïve Bayesian approach. In 2017 International Conference on Computational Science and Computational Intelligence (CSCI) (pp. 228-233). IEEE. https://doi.org/10.1109/CSCI.2017.36
, proponen un modelo basado en algoritmos bayesianos para evaluar el riesgo crediticio de tarjeta de crédito, empleando variables demográficas e indicadores materiales como variables de entrada. Los resultados muestran que el modelo y variables propuestas mejoran el resultado en rapidez, eficiencia y memoria efectiva.

Torvekar y Game (2019)[20] Torvekar, N., & Game, P. S. (2019). “Predictive analysis of credit score for credit card defaulters.” Int. J. Recent Technol. Eng, 7(1), 4. https://www.researchgate.net/profile/Pravin-Game/publication/332557433_Predictive_analysis_of_credit_score_for_credit_card_defaulters/links/5f44ec63458515b7294fc74c/Predictive-analysis-of-credit-score-for-credit-card-defaulters.pdf
aplican diversas técnicas de aprendizaje automático para identificar el comportamiento de los clientes, con el objetivo de predecir los clientes morosos de tarjeta de crédito. Asimismo, Ignatius et al. (2018)[12] Ignatius, J., Hatami-Marbini, A., Rahman, A., Dhamotharan, L., & Khoshnevis, P. (2018). “A fuzzy decision support system for credit scoring.” Neural Computing and Applications, 29(10), 921-937. https://doi.org/10.1007/s00521-016-2592-1
, desarrollan una herramienta para la decisión sobre un modelo de puntuación de crédito basado en los principios de toma de decisiones multicriterio. Los resultados de la implementación son robustos y permiten la toma de decisión y adaptación del modelo ante diversas circunstancias.

En términos de economías emergentes, como es el caso de la economía mexicana y en la cual se basa la presente investigación, Trejo, Ríos y Martínez (2016)[21] Trejo-García, J. C., Ríos-Bolívar, H., y Martínez-García, M. Á. (2016). “Análisis de la administración del riesgo crediticio en México para tarjetas de crédito.” Revista mexicana de economía y finanzas, 11(1), 103-121. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1665-53462016000100103&lng=es&tlng=es.
analizan la administración del riesgo crediticio en México para tarjetas de crédito. Implementan un modelo predictivo de incumplimiento en línea con la regulación local. La metodología empleada es un modelo logit y los resultados sugieren que provee un buen ajuste para la predicción de incumplimiento de clientes de tarjeta de crédito.

Trejo, et al. (2017), desarrollan una técnica de calificación crediticia, minimizando la pérdida esperada en el mercado de tarjeta de crédito a partir de una regresión logística. Los resultados apuntan a que, con el modelo propuesto, los costos de mantener créditos con niveles de riesgo mayores son más altos que para riesgos moderados.

Siguiendo la investigación realizada en México, el presente estudio propone una metodología de calificación crediticia basada en una regresión logística, empleando los datos de una cartera de clientes de una determinada institución bancaria. Dicho modelo permite predecir adecuadamente el incumplimiento de clientes de tarjetas de crédito, y transforma los resultados en indicadores que cualquier empleado de dicha institución, puede utilizar para la toma de decisiones.

2. Datos y metodología

 

2.1 Datos

 

Se utilizan datos del portafolio de tarjeta de crédito de una institución financiera mexicana de abril 2017 a marzo 2018; por cuestiones de confidencialidad, a los datos se les aplica un factor solo para su presentación en esta investigación. A dicha población, se le realizan ciertas exclusiones, las cuales se detallan en la tabla 1. Dichas exclusiones tienen el objetivo de realizar un modelado más apegado a la realidad y de desarrollar un modelo más limpio, sin sesgos en el comportamiento de las cuentas.

Tabla 1.  Exclusiones
Decantación de cuentas # Cuentas
Universo Inicial 27,795,663
Cuentas inactivas -15,487,191
2 pagos vencidos o más 1Se excluyen las cuentas con impago, ya que su probabilidad de incumplir es muy cercana a uno. -504,319
Universo Final 11,804,153

Fuente: elaboración propia.

Con el objetivo de incrementar la predictibilidad en el modelo, se segmenta el portafolio en grupos y subgrupos considerando características homogéneas entre las cuentas de cada uno de ellos. La segmentación se aprecia en el siguiente diagrama (figura 1), en donde se muestra que la primera variable que se segmenta es la antigüedad de la cuenta y la segunda, la probabilidad de incumplimiento (PI).

Fuente: Elaboración propia.
Nota: Los rangos de la PI son determinados por la institución con base en la circular única de bancos.
Figura 1.  Segmentos del modelo

Como se aprecia en el diagrama de la figura 1, la primera partición o grupo es por la antigüedad en meses que tienen las cuentas al momento de su calificación, es importante esta división ya que, la información de cada subconjunto es diferente debido a la disponibilidad y la precisión de tal información.

Por otro lado, la división por antigüedad en meses de la cuenta deja a la institución en incertidumbre del riesgo, ya que normalmente las cuentas prematuras conllevan un mayor riesgo que las cuentas con mayor maduración. Dado lo anterior, se crean tres grupos como se observa en el diagrama, el primero con cuentas con una antigüedad menor a tres meses, un segundo grupo con aquellas cuentas que tienen de tres a seis meses de antigüedad y, por último, el tercer grupo con cuentas que tienen más de seis meses de haber realizado su apertura.

La Comisión Nacional Bancaria y de Valores (CNBV) establece metodologías generales para la calificación de la cartera crediticia de las instituciones bancarias, con el fin de calcular las reservas que los bancos deben constituir. Dentro de estas metodologías, es obligación de la institución bancaria contar con una probabilidad de incumplimiento para cada cuenta de tarjeta de crédito. El cálculo de dicha Probabilidad de Incumplimiento (PI) es obligatoria e imprescindible para las instituciones financieras en México, por lo que se aprovecha dicha Probabilidad de Incumplimiento (PI) como variable para segmentar el presente modelo, con el objetivo de focalizar aún más la información a cada subgrupo de probabilidad.

Los subgrupos quedan como se muestra en el diagrama 1. El primer subgrupo, con una probabilidad menor al 1.6% de PI; un segundo grupo, con un rango de 1.6% a 5.94%; el tercer grupo, con una probabilidad de 5.94% a 17.97% y, un último grupo, con una probabilidad mayor a 17.97%.

La variable objetivo o variable dependiente se define como, toda aquella cuenta que haya incumplido 90 días o más en los 12 meses posteriores a su calificación, esta definición está alineada a las metodologías generales para la calificación de la cartera crediticia de las instituciones bancarias de la CNBV2En las disposiciones de carácter general, aplicables a las instituciones de crédito de la CNBV, se especifica que todos los créditos en etapa 3 son aquellos que presentan un atraso mayor o igual que 90 días., así como a las recomendaciones de los acuerdos de Basilea II.

Para la construcción del modelo son utilizados dos periodos, el de Desarrollo y el de Desempeño, los cuales se muestran en el diagrama de la figura 2. Se parte de t0 momento en el cual se califica con base en la información obtenida del periodo tn a t0, con el objetivo de pronosticar los resultados del periodo t0 a t+12.

Fuente: Elaboración propia.
Figura 2.  Periodos de información

El periodo de desarrollo (histórico), se refiere a la información sobre el comportamiento y las características de las cuentas en n-meses previos a la fecha de referencia (t0). Dicha información se analiza con el fin de generar variables históricas que pudieran explicar mejor la variable objetivo.

Periodo de desempeño (observación), es el intervalo de doce meses posteriores a la fecha de referencia (t0). El propósito es comprobar el cumplimiento de la variable objetivo de cada cuenta, en donde toma el valor de 1 cuando la cuenta haya incumplido 90 días o más en dicho periodo y en caso contrario, se le asigna el valor de 0.

Se construyen 131 variables con base en el periodo de desarrollo, en la tabla 2 se muestra la clasificación de dichas variables y el número de estas, consideradas en cada categoría. Dichas categorías se explican a continuación.

Tabla 2.  Variables construidas
Categoría Número de variables
Información de comportamiento interno 51 variables
Información de apertura 34 variables
Información de comportamiento externo 42 variables
Sociodemográfica 4 variables

Fuente: Elaboración propia.

  • Información de comportamiento interno. -Se refiere al comportamiento de las propias cuentas de tarjeta de crédito en cada cierre de mes, es decir, son variables propias del manejo del crédito, como pueden ser: su porcentaje de uso, el porcentaje de pago, moras históricas, perfil de la tarjeta de crédito (clásica, oro, premium), pagos requeridos, etc.

  • Información de apertura. -Este tipo de variables, se construye tomando los datos que el cliente otorga al momento de solicitar la apertura de la cuenta de tarjeta de crédito, dicha información puede ser: monto de sus ingresos, créditos vigentes, porcentaje de uso de créditos vigentes, etc.

  • Información de comportamiento externo. -Esta información se refiere al comportamiento que el cliente muestra, sobre otros créditos en el mercado, como, por ejemplo: porcentaje de uso de todas sus tarjetas de crédito, suma del total de sus pagos requeridos de los créditos hipotecarios, morosidades en sus créditos de nómina, entre otros.

  • Información sociodemográfica. -Es la información actualizada que el cliente otorga a la institución referente a su edad, sexo, lugar de referencia, etc.

3. Metodología

 

La técnica con la que se realiza el modelo es una regresión logística binaria, la cual permite obtener mediante la ecuación (1), la probabilidad de ocurrencia de un evento (variable dependiente) dado un conjunto de variables independientes. El modelo de credit scoring transforma la probabilidad resultante de la regresión en un puntaje, el cual se interpreta como una calificación donde a mayor puntaje, menor el riesgo o menor la probabilidad asociada.

“El modelo logístico establece la siguiente relación entre la probabilidad de que ocurra el suceso, dado que el individuo presenta los valores (X = x1, X = x2,…, X = xk):

P [ Y = 1 /   x 1 , x 2 , , x k ] = 1 1 +   e - ( β 0 + β 1 X 1 + β 2 X 2 + β k X k )  (1)

El objetivo es hallar los coeficientes ( β 0 , β 1 , β k ,) que mejor se ajusten a la expresión funcional”. (De la Fuente, 2011, p.7[10]De la Fuente, S. (2011). Regresión Logística. Disponible en: https://www.fuenterrebollo.com/Economicas/ECONOMETRIA/CUALITATIVAS/LOGISTICA/regresion-logistica.pdf
)

En el diagrama de flujo del proceso de la figura 3, se explica detalladamente los pasos de la metodología aplicada.

Fuente: Elaboración propia.
Figura 3.  Diagrama de flujo del proceso 1

4. Análisis de los resultados

 

Con el fin de conocer los estadísticos principales, tales como: frecuencia total, frecuencia de nulos, media, moda, mediana, desviación estándar, percentiles, máximo y mínimo, las variables son sometidas a un análisis univariado (véase apéndice 1). Lo anterior permite, principalmente, identificar la tasa de ausentes y con esto definir su posterior tratamiento en caso de ser necesario.

Para encontrar las variables que mejor explican la variable objetivo (que la cuenta en un periodo de 12 meses haya caído en 90 o más días de impago), se realiza un análisis de significancia estadística. Dentro de dicho análisis se realizan las siguientes pruebas: Índice de GINI, Information Value y Prueba de Kolmogorov-Smirnov.

Dado el análisis de significancia estadística se determina que, de las 131 variables, solo 22 explican estadísticamente a la variable objetivo, tienen un p-value menor a 0.0001, (apéndice 2 para la descripción de cada una de estas).

En las siguientes tablas (3 y 4) se muestran las variables con mayor significancia de cada segmento y sus atributos, así como el resultado del análisis estadístico de cada variable.

Tabla 3.  Variables explicativas Segmento antigüedad <3 meses

Fuente: Elaboración propia.

Como se observa, en el primer segmento del modelo referente a las cuentas de recién apertura, se tienen variables explicativas basadas en información interna y, sobre todo, en variables de apertura. Lo anterior tiene sentido, ya que han transcurrido a lo más dos meses desde que la cuenta de tarjeta de crédito fue abierta.

Para el segmento de antigüedad de entre tres y seis meses de antigüedad, las variables con mayor predicción se muestran en la tabla 4.

Tabla 4.  Variables explicativas: Segmento antigüedad 3-6 meses

Fuente: Elaboración propia.

Como se aprecia en la tabla anterior, las variables que pueden explicar con mayor exactitud a la variable objetivo son variables con información de creación, así como de información histórica. Dado que en este segmento ya se cuenta con más información interna, las variables explicativas son promedios de a lo más seis meses de información de desarrollo, esto permite discriminar mejor las cuentas que presentan una mayor probabilidad de evento.

Como se explica, para los segmentos cuya antigüedad es mayor a seis meses, se realizan cuatro subsegmentos por la probabilidad incumplimiento regulatoria de la CNBV. Las variables explicativas con mayor predictibilidad se muestran a continuación.

Tabla 5.  Variables explicativas: Segmento antigüedad >6 meses Grupo 1

Fuente: Elaboración propia.

Tabla 6.  Variables explicativas: Segmento antigüedad >6 meses Grupo 2