El Dataset "Credit Risk Classification" contiene información demográfica y crediticia de los clientes riesgosos y no riesgosos, las observaciones contenidas corresponden al período de tiempo de 1987-2016, año en que se realiza la última actualización del dataset. El dataset está compuesto por dos tablas, la primera contiene los datos demográficos y la segunda las variables relacionadas con el pago. Algunas de las variables son los clientes riesgosos, los pagos retrasados de tipo 1, 2 y 3, los dias de retrado, el total de pagos a tiempo, el producto crediticio, el límite de crédito el balance, la fecha de actualización de la cuenta y ocho variables demográficas codificadas por cuestión de protección a los datos personales de los clientes del banco. Nuestro objetivo principal al trabajar con este dataset es contestar a las siguientes preguntas: ¿Qué factores contribuyen al riesgo crediticio de los clientes?, ¿Cuál es el comportamiento del cliente digno de crédito?, ¿Cantidad de clientes morosos?, ¿Qué características demográficas tienen los clientes considerados como riesgosos?, ¿Existe una relación entre las características demográficas de los clientes y el límite de crédito?, ¿Cuáles de estas características demográficas inciden mayormente en el límite crediticio?, ¿Qué tipo de pagos retrasados tiene un mayor impacto sobre la definición de si se es un cliente riesgoso o no? Para hacerlo, se tendrá como variable dependiente "label" que expresa si el cliente es considerado riesgoso o no y se realizará una serie de análisis estadísticos con el fin de conocer el comportamiento de cada una de nuestras variables, dependiente e independientes, como visualización de los datos, estadística descriptiva y correlaciones entre variables.