Принятие кредитного решения
В данном проекте проведен исследовательский анализ данных кредитных историй 9578 человек Loan_data_research.ipynb (Jupiter Notebook), а также создано web-приложение, которое принимет решение о выдаче(невыдаче) займа в соответствии с критериями оценки загружаемыми в виде файла формата .csv Для иллюстрации работы приложения представлен файл test list.csv. В проекте использовано машинное обучение модели случайного леса. Данные для обучения взяты из открытого источника www.kaggle.com.
Здесь можно посмотреть работу Web-приложения данного проекта (скорость работы приложения невелика, т.к.оно развернуто на собственном “домашнем” сервере). В приложение необходимо загрузить приведенный выше файл, либо файл критериев оценки других заемщиков, сформированный аналогично ему.
Проект носит ознакомительный характер и не преследует цель однозначно оценивать кредитоспособность заемщика. Он был создан для тренировки навыков программирования, методов обработки данных, создания и проверки различных моделей машинного обучения.
Принцип работы приложения
-
В приложение загружается файл данных по заемщикам формата .csv (test list.csv) либо другой файл данных, сформированный аналогично прилагаемому образцу.
-
Исходя из загруженных данных приложение выносит кредитное решение по каждому заемщику: одобрить/не одобрить (approve/not approve)
-
Расшифровка названий критериев оценки:
- credit.policy: 1, если клиент соответствует критериям LendingClub.com, и 0 в противном случае.
- purpose: Цель ссуды (принимает значения “credit_card”, “debt_consolidation”, “educational”, “major_purchase”, “small_business” и “all_other”).
- int.rate: Процентная ставка по ссуде, как пропорция (ставка 11% будет сохранена как 0,11). Заемщикам, которых LendingClub.com считает более рискованными, назначаются более высокие процентные ставки.
- installment: Ежемесячные платежи, причитающиеся заемщику, если кредит финансируется.
- log.annual.inc: Натуральный журнал самооценки годового дохода заемщика.
- dti: Отношение долга к доходу заемщика (сумма долга, деленная на годовой доход).
- fico: Кредитный рейтинг FICO заемщика.
- days.with.cr.line: Количество дней, в течение которых у заемщика была кредитная линия.
- revol.bal: Оборотный баланс заемщика (сумма, не выплаченная в конце цикла выставления счетов по кредитной карте).
- revol.util: Коэффициент использования возобновляемой линии заемщика (сумма использованной кредитной линии по отношению к общему доступному кредиту).
- inq.last.6mths: Количество запросов заемщика от кредиторов за последние 6 месяцев.
- delinq.2yrs: Количество случаев просрочки платежа заемщиком на 30+ дней за последние 2 года.
- pub.rec: Количество нарушающих публичных записей заемщика (заявления о банкротстве, налоговые залоги или судебные решения).
Проект является масштабируемым прототипом.