Содержание
Введение
Глава 1. Теоретические основы оценки вероятности банкротства
1.1 Классические методы прогнозирования банкротства
1.2 Альтернативные методы прогнозирования банкротства
1.3 Применение существующих методик оценки вероятности дефолта / отзыва лицензии на осуществление банковской деятельности для коммерческих банков
Глава 2. Оценка вероятности банкротства коммерческого банка в России
2.1 Подбор объясняющих переменных
2.2 Описание данных для эмпирического анализа
2.3 Решение проблемы несбалансированности данных и построение модели оценки вероятности отзыва лицензии у коммерческого банка
Заключение
Список использованной литературы
Приложения
Введение
Эффективное и постоянное взаимодействие банковского сектора и материального производства как в ведущих промышленно развитых, так и в развивающихся странах, играет существенную роль в стимулировании экономического роста. Мировой опыт показывает, что данное взаимодействие можно считать эффективным, только тогда, когда коммерческие банки способны обеспечить бесперебойное перераспределение временно свободного капитала в реальный сектор экономики, нуждающийся в проведении модернизации основных фондов или увеличении производственных мощностей. Наличие недобросовестных коммерческих банков, ведущих высокорискованную кредитную политику и несоблюдающих законы и нормативные акты, регламентирующие банковскую деятельность, способствует нарушению функционирования всей банковской системы, что, в свою очередь, может привести к стагнации экономического развития. В связи с этим, центральные банки во всех странах, в том числе и в России, уделяют огромное внимание одной из основных своих функций - осуществлению надзора за деятельностью кредитных организаций.
Объектом исследования данной выпускной квалификационной работы является Российская банковская система, которая имеет двухуровневую структуру. К первому уровню относится Центральный банк Российский Федерации, наделенный полномочиями по регулированию финансового рынка и выполняющий функции денежно-кредитного регулирования, банковского надзора и управления системой платежей и расчетов в стране. Второй уровень банковской системы включает в себя коммерческие банки, которые делятся на государственные, частные и имеющие иностранный капитал, и небанковские кредитные организации, которые подразделяются на расчетные, платежные и небанковские депозитно-кредитные организации.
Предметом исследования являются коммерческие банки Российской Федерации, в том числе лишенные лицензии на осуществление банковских операций.
Исследование факторов, определяющих и характеризующих устойчивое функционирование банковской системы, а также разработка вероятностно-статистических моделей, выявляющих потенциальных банкротов, позволило бы регулятору заблаговременно провести все мероприятия по «оздоровлению» деятельности коммерческого банка. В связи с этим, зарубежный и российский опыт (Bluhm C., Overbeck L., Wagner C., Lanine G., Vennet R., А. М. Карминский, А. В. Костров и А. А. Пересецкий и другие) вероятностно-статистического моделирования по данной тематике уже давно стал объектом пристального интереса. В основу предшествующих исследований легло построение модели бинарного и множественного выбора для прогноза вероятности отзыва лицензии у коммерческого банка по экономическим причинам на основе основных макроэкономических показателей страны местонахождения и финансовых показателей коммерческого банка.
Целью и отличительной особенностью данной выпускной квалификационной работы является оценка вероятности отзыва лицензии у коммерческого банка по неэкономическим причинам, то есть из-за неоднократного осуществления коммерческим банком операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также из-за нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма» с помощью непараметрического метода «Деревья решений» (регрессионное дерево).
Для достижения поставленной цели в данной работе планируется решить ряд задач:
ѕ изучить предшествующий опыт оценки вероятности дефолта организаций, в частности отзыва лицензий у коммерческих банков;
ѕ собрать эмпирические данные о предмете исследования и провести их предварительный анализ;
ѕ построить модель на основе сформулированных гипотез об объясняющих факторах для выявления значимых переменных;
ѕ создать алгоритм для построения регрессионного дерева для оценки вероятности отзыва лицензии у коммерческого банка;
ѕ оценить качество построенного регрессионного дерева.
Структура данной выпускной квалификационной работы полностью соответствует поставленным задачам. В первой главе рассматриваются теоретические основы, которые используются для оценки вероятности банкротства организации и отзывов лицензий у коммерческих банков в настоящее время. Вторая глава посвящена непосредственно анализу и сбору эмпирических данных, а также созданию алгоритма для построения регрессионного дерева и оценке его качества.
Глава 1. Теоретические основы оценки вероятности банкротства
1.1 Классические методы прогнозирования банкротства
Построение моделей, прогнозирующих банкротство организаций, уже достаточно давно обсуждается во многих зарубежных исследованиях. Самые первые шаги в изучении данной темы были сделаны на рубеже тридцатых годов. Проанализировав большое количество показателей деятельности как нормально функционирующих компании, так и банкротов, П. Фитцпатрик пришел к выводу, что у последних значение рассматриваемых показателей находится на достаточно низком уровне. Именно его труды и открыли большие горизонты другим ученым и экономистам для будущих исследовательских работ.
За последние восемьдесят пять лет было разработано несколько десятков моделей с использованием множества методологических подходов. Большое количество работ на данную тематику объясняется тем, что моделирование вероятности дефолта организаций затрагивает интересы широкого круга участников рыночных отношений - модель может быть полезна как собственникам бизнеса, так и его кредиторам.
На сегодняшний день существует два вида методов прогнозирования банкротства: классические (статистические) и альтернативные Ким Дж. О., Мьюллер Ч. У., Королев С. Б. и др.; под ред. Хотинский А. М. / Факторный, дискриминантный и кластерный анализ: пер. с англ. -- М.: Финансы и статистика, 1989, с. 215.. Помимо этого, их еще делят на параметрические (статистические) и непараметрические (аналитические) модели.
Параметрическая статистика используется для анализа непрерывных (численных) переменных, значения которых распределены нормально. Непараметрические методы анализа данных применяются к непрерывным и дискретным данным.
На Рисунке № 1 показана блок-схема с основными классическими и альтернативными методами.
Рисунок № 1.
Одномерный дискриминантный анализ.
К одним из самых первых и простых по своей сути методов относят одномерный дискриминантный анализ американского ученого Уильяма Бивера, который был опубликован в статье в Journal of Accounting Research в 1966 году Beaver W. H. «Financial ratios as predictors of failure» // Journal of Accounting Research, 1966, p. 71.. В основе его работы лежит система показателей, которая используется для определения вероятности дефолта организации. Данная модель состоит из пяти факторов: рентабельность активов (ROA), удельный вес заемных средств в общем объеме пассивов компании, коэффициент текущей ликвидности (Current Ratio), доля чистого оборотного капитала в общем объеме активов, отношение суммы чистой прибыли и амортизации к заемным средствам (коэффициент Бивера). Данные коэффициенты рассчитываются для рассматриваемого на предмет прогнозирования дефолта предприятия и сравниваются с предварительно рассчитанными У. Бивером нормативными значениями трех стадий существования организации: нормально функционирующая в настоящее время, обанкротившаяся в течение последнего финансового года и обанкротившаяся в течение последних пяти финансовых лет.
Множественный дискриминантный анализ.
Как показала практика, анализ каждого показателя деятельности организации по отдельности может привести к неверным результатам и ложным выводам. Решение данной проблемы было описано в одном из фундаментальных исследований, опубликованных в Journal of Finance в 1968 году, Э. И. Альтманом Altman E. I. «Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy» // Journal of Finance, 1968, p. 589.
Суть множественного дискриминантного анализа заключается в расчете основных показателей, характеризирующих финансовое положение и результаты хозяйственной деятельности предприятия, которые затем объединяют в один индекс кредитоспособности (Z), заранее присваивая каждому из показателей свой вес. В общем виде это была первая скоринговая модель, которая широко используется и по сей день.
Для построения данной модели был осуществлен пошаговый анализ 66 американских компаний за период 1946 - 1965 годов. В выборку попали 33 обанкротившихся и 33 успешно работающих промышленных предприятий. На первом этапе был произведен расчет двадцати двух основных финансовых коэффициентов, из которых в дальнейшем было выделено пять коэффициентов, которые, по мнению Э. И. Альтмана, наиболее точно и полно характеризуют результаты деятельности организации. Это были такие коэффициенты, как: доля чистого оборотного капитала в активах (Х1), отношение накопленной прибыли к активам (Х2), рентабельность активов (Х3), отношение рыночной стоимости всех обычных и привилегированных акций предприятия к заемным средствам (Х4) и оборачиваемость активов (Х5). На втором этапе с помощью множественного дискриминантного анализа (Multiple Discriminant Analysis - MDA) были определены весовые значения у каждого коэффициента в будущей пятифакторной модели. Таким образом, модель Э. И. Альтмана выглядит следующим образом:
По результатам подсчета индекса кредитоспособности (Z) анализируемой компании, можно сделать вывод о степени вероятности ее дефолта:
ѕ высокая степень вероятность дефолта в случае, если значение данного индекса меньше 1,8;
ѕ средняя степень вероятность дефолта в случае, если значения находится в пределах 1,8 и 2,8;
ѕ низкая степень вероятность дефолта в случае, если значения данного индекса больше 2,8.
Несмотря на всю привлекательность данного метода, в результате многочисленных исследований моделей, которые были построены на основе дискриминантного анализа, экономистами было выявлено множество недостатков, не позволявших использовать полученные результаты на практике. Одним из недостатков стало отсутствие у модели возможности дать количественную оценку вероятности банкротства, из чего следует вывод, что модель может определить только степень вероятности, но не ее номинальное значение. К другому недостатку следует отнести наличие «зоны неопределенности», благодаря которой появляются сложности при интерпретации результатов модели. Все эти недостатки привели к внезапному отказу большинства аналитиков и экономистов из разных стран от использования данного подхода при прогнозировании или оценке вероятности банкротства организаций. Взамен данному подходу пришло эконометрическое моделирование вероятности дефолта, а именно - логистический регрессионный анализ.
Логистический регрессионный анализ.
Основным подходом к эконометрическому моделированию вероятности дефолта компаний является построение бинарной логистической регрессионной модели (logit - модель) на основе исторических данных о банкротстве аналогичных по роду деятельности организаций. Впервые термин «logit» был использован в 1944 году ученым Joseph Berkson Berkson J. «Application of the Logistic Function to Bio-assay» // Journal of the American Statistical Association, 1944, p. 357, а одним из первых экономистов, который применил метод логистического регрессионного анализа для оценки вероятности банкротства, был Джеймс Олсон Ohlson J. S. «Financial Ratios and the Probabilistic Prediction of Bankruptcy» // Journal of Accounting Research, 1980, p. 109.. Бинарная логистическая регрессия является разновидностью множественной регрессии, общее назначение которой состоит в анализе связи между несколькими независимыми переменными (х; регрессорами или предикторами) и зависимой переменной (у). Построение такой модели позволяет сделать прогноз значения непрерывной зависимой переменной, при условии, что ее значение находится в интервале [0; 1]. Иными словами, с помощью данного вида регрессии можно оценить вероятность того, произойдет ли событие или нет.
Логистическая функция в общем виде выглядит следующим образом:
При построении логистической регрессии делаем предположение, что вероятность наступления события (y = 1) равна:
,
где , и - вектора - столбцы независимых переменных и параметров (коэффициентов регрессии) - вещественных чисел .
Так как зависимая переменная принимает только значения «0» ил «1», то вероятность первого возможного значения равна:
Таким образом, функцию распределения зависимой переменной при заданных регрессорах можно записать в следующем виде:
,
В отличие от рассмотренных ранее дискриминантных моделей прогнозирования, существенными преимуществами использования логистической регрессии являются возможность строить модели нелинейной зависимости наступления банкротства от нескольких факторов и отсутствие «зоны неопределенности» Под термином «зона неопределенности» понимается множество вариантов развития системы, каждый из которых оптимален при некотором реально возможном сочетании внешних условий.. Кроме того, при применении logit - модели не возникает проблем с однозначной интерпретацией зависимой переменной, так как она может принимать только два значения.
Однако, использование logit - модели имеет и слабые стороны. Основным недостатком использования данной параметрической модели является зависимость результатов от распределения независимых переменных.
Избежать наложения ограничений по использованию данной модели возможно с помощью непараметрического метода, основанного на «распознании признаков», который будет описан в следующем разделе.
1.2 Альтернативные методы прогнозирования банкротства
Стремительное развитие информационных технологий в части способов сбора, хранения и обработки информации позволило использовать при исследовании огромные массивы данных, что, в свою очередь, породило спрос на разработку новых и усовершенствование действующих методов автоматического анализа.
В настоящее время существует несколько альтернативных методов анализа большого объема информации: анализ соответствий, многомерное шкалирование, причинное моделирование, нейронные сети, деревья решений и другие. В данном разделе выпускной квалификационной работе речь пойдет о последних, наиболее часто используемых методах - «распознавание признаков», проведение нейросетевого анализа и принятие решения методом построения деревьев.
Распознавание признаков.
Как отмечалось в предыдущем разделе, описываемый непараметрический метод используется при проведении логистического регрессионного анализа. Он основан на количественном описании всех возможных сочетаний переменных для выделения таких признаков, которые либо встречаются почти в каждой группе, либо появляются только в единственном случае. Первой областью, где начали применять данный метод, была геология Воронин Ю. А., Алабин Б. К., Гольдин С. В. «Геология и математика. Основные методологические, теоретические и организационные вопросы примирения математических методов и ЭВМ в геологии -- Н.: Наука, 1967, с. 29.. В дальнейшем, для того, чтобы использование данного метода было применимо при прогнозировании вероятности, алгоритм был немного изменен.
Использование данного метода при оценке вероятности отзыва лицензии у коммерческого банка было описано в статье Ж. Колари, М. Капуто, Д. Вагнера в 1996 году Kolari J., Caputo M., Wagner D. «Trait recognition: An alternative approach to early warning system in commercial banking» // Journal of Business Finance and Accounting, 1996, p. 1415.. Изначально авторами были выбраны критические значения для каждой переменной, которые выбирались так, чтобы в каждый из сегментов попадали только определенные типы банков. В верхний сегмент должны были попадать только банки - банкроты, в нижний сегмент, наоборот, банки - небанкроты. Средний сегмент представляет собой «зону неопределенности» и включает в себя как банки - банкроты, так и банки - небанкроты. Далее для каждого банка была составлена двоичная строка, которая отражала значения его финансовых показателей. На следующем этапе была составлена матрица признаков для каждого наблюдения, которая состояла из комбинаций одной, двух, трех и четырех переменных одновременно. После построения матрицы из всего набора признаков выделяются только те, которые присущи каждому типу банков и делятся на две категории: безопасные и небезопасные. На финальном этапе формируется матрица голосования, каждой ячейке которой соответствует разное число безопасных и небезопасных категорий. Если в ячейку попадают только банки - небанкроты, то она признаются безопасной, в противоположном случае - небезопасной. Вид ячейки, в которую входят и те и другие коммерческие банки, определяется по типу банков, которых содержится в ней больше. Таким образом, вероятность дефолта кредитной организации в следующем периоде может принимать только два значения - «0» или «1».
Нейросетевой анализ.
Использование искусственных нейронных сетей (ИНС) являются популярным подходом в области машинного обучения и восприятия. В основе данной математической модели лежит принцип организации и функционирования биологических нейронных сетей, то есть сетей нервных клеток живого организма. Первыми учеными, которые начали изучать процессы головного мозга для дальнейшего их моделирования, были американцы У. Мак-Калок и У. Питтс McCulloch W. S., Pitts W. «A Logical Calculus of the Ideas Immanent in Nervous Activity» // Bulletin of Mathematical Biophysics, 1943, p. 115.. В результате проведенного исследования была разработана модель нейрона, выполняющая вычисление переходной функции от скалярного произведения вектора входных сигналов и вектора весовых коэффициентов, и сформированы основные положения теории деятельности головного мозга. В данной модели каждый нейрон имеет два состояния: «0» и «1». Для определения своего состояния каждый нейрон рассчитывает взвешенное состояние других нейронов и сравнивает их с пороговым значением состояния. Если же значение рассчитанного скалярного произведения не достигает порогового значения, то нейрон «не срабатывает» и модель теряет интенсивность выходного сигнала данного нейрона, что снижает надежность итоговых результатов модели. Данный факт является основным недостатком искусственных нейронных сетей. Отличительной же особенностью модели, разработанной У. Мак-Калок и У. Питтс, перед традиционными алгоритмами является свойство самообучения, которое заключается в нахождении коэффициентов связей между нейронами.
Деревья классификации и регрессии.
Построение деревьев решений является еще одним методом автоматического анализа данных. Первые идеи создания метода, основанного на построении деревьев решений, принадлежат американским ученым - Э. Ханту, Д. Мэрину и Ф. Стоуну Hunt Earl B., Marin J., Stone P. J. «Experiments in induction» // Academic Press, 1966, p. 97..
Деревья решений бывают двух видов: деревья классификации и деревья регрессии. Так как входными параметрами для построения деревьев решений могут быть как дискретные, так и непрерывные величины, то определяющий фактором, от которого зависит вид дерева, является выходное значение. Дерево решений, результатом построения которого является конкретное значение (символы), называется деревом классификации. Напротив, дерево решений с непрерывными выходными данными (вещественные числа) именуется деревом регрессии.
Деревья решений организованы в виде иерархической структуры, состоящей из узлов принятия решений по оценке значений определенных переменных для прогнозирования результирующего значения. Таким образом, результатом любого дерева является прогнозируемое значение, полученное в результате анализа и оценки входных параметров. Узлы принятия решения соединяются друг с другом ребрами таким образом, чтобы создаваемая структура не превращалась в цикл. Основой дерева является особый узел, известный как корневой, от которого можно перейти по дереву к любому другому узлу. Помимо этого, дерево состоит из листовых узлов, которые находятся в конце любой цепочки подряд идущих ребер (см. Рисунок № 2).
Рисунок № 2. Схема простого дерева решений.
Каждое ребро в дереве является одним из возможных вариантов (т. е. взаимоисключающие друг друга результаты) наступления прогнозируемого события, а узел обеспечивает его проверку. Таким образом, любой уровень в дереве рассматривается как одно из возможных решений.
При построении дерева решений и проверке условий происходит сортировка выборок анализируемых данных таким образом, что каждый элемент определяется как соответствующий только одному ребру. Такой процесс разбиения всех данных выборки на меньшие части происходит до тех пор, пока не образуется листовой узел, который соответствует небольшой, но исключительной части исходного множества данных. Таким образом, секционирование набора данных (то есть разбивание на непересекающиеся подмножества) осуществляется на основе использования наиболее подходящей для этого переменной, что приводит к получению подмножества, содержащего минимальное количество посторонних включений.
В настоящее время существует несколько алгоритмов, используемых при построении дерева решений. К ним относятся C4.5, CART, ITrule, NewId, CN2 и так далее. Однако особое внимание в зарубежных исследованиях уделяют следующему алгоритму - CART (Classification And Regression Tree).
Алгоритм CART является самым простым из алгоритмов, так как каждый узел итогового дерева решений у него имеет только два варианта развития событий (потомки Right и Left). Поэтому, CART является алгоритмом построения бинарного дерева решений. Как видно из его названия, он решает задачи классификации и регрессии. Данный алгоритм был предложен американским математиком - статистиком Л. Брейманом в 1984 году Breiman L., Friedman J., Olshen R., Stone C. «Classification and Regression Trees» // Wadsworth, 1984, p. 81.. Оценочная функция, используемая в алгоритме CART, основывается на интуитивной идее уменьшения неопределенности, то есть на увеличении количества примеров одного класса в каждом узле. Такую неопределенность еще часто называют «нечистотой». Для уменьшения данной неопределенности при построении дерева решений используется индекс Gini, который имеет следующий вид:
где - это вероятность класса в T.
В случае, если множество T будет разбито на 2 части (Т1 и Т2) с числом примеров в каждом подмножестве (N1 и N2), показатель качества разбиения будет выглядеть следующим образом
Наилучшим считается такое разбиение, для которого вышеуказанный индекс принимает самое минимальное значение.
Для построения дерева решений с помощью данного алгоритма можно использовать как числовые, так и категориальные атрибуты. Так как в каждом узле разбиение возможно только по одному атрибуту, существуют два правила, на основе которых строится данный алгоритм:
ѕ если значение атрибута является числовым, то в узле формируется правило , где c - это некоторый порог, который рассчитывается как среднее арифметическое двух соседних упорядоченных значений переменной обучающей выборки;
ѕ если значение атрибута имеет категориальный тип, то в узле формируется правило вида , где - это некоторое непустое подмножество значений переменной обучающей выборки.
В отличие от других алгоритмов, CART имеет серьезное преимущество - при построении дерева решений целесообразно использовать механизм его отсечения (minimal cost-complexity tree pruning), который заключается в получении компромисса между созданием дерева оптимального размера и получением точной оценки вероятности ошибочной классификации.
Выбор финальной версии дерева осуществляется посредством тестирования на тестовой выборке с помощью перекрестной проверки (V-fold cross-validation). Данный тест проводится в тех случаях, когда набор данных для обучения либо мал, либо имеет только уникальные записи, так что дальнейшее разделение выборки для обучения и тестирования невозможно.
Данный алгоритм имеет свои сильные и слабые стороны. К основному достоинству следует отнести тот факт, что данный алгоритм позволяет отбирать переменные, которые будут использованы в анализе не заранее, а непосредственно при проведении анализа с помощью индекса Gini. Кроме того, данный непараметрический метод При использовании непараметрического метода нет необходимости рассчитывать различные параметры вероятностного распределения имеет большую скорость обработки данных. Недостатком является то, что CART неприменим для построения дерева с более сложной структурой, так как может не идентифицировать правильную структуру данных.
1.3 Применение существующих методик оценки вероятности дефолта / отзыва лицензии на осуществление банковской деятельности для коммерческих банков
банкротство банк дефолт лицензия
В отличие от первых двух разделов, где были рассмотрены самые распространенные методы, используемые для прогнозирования вероятности дефолта компании, в данном разделе рассмотрим основные исследования, нацеленные на оценку вероятности и прогнозирования банкротства / отзыва лицензии на осуществление банковской деятельности именно коммерческих банков. Следует отметить, что в данной выпускной квалификационной работе термин «банкротство» / «дефолт» коммерческого банка является синонимом термина «отзыв лицензии на осуществление банковской деятельности».
Основные подходы, используемые при построении моделей, оценивающих вероятность отзыва лицензии у коммерческого банка, исследованы в большом количестве работ как зарубежными, так и российскими экономистами. Несмотря на значительное количество методов оценки вероятности и прогнозирования вероятности банкротства, основной упор во всех периодических изданиях и учебной литературе делается на построение logit - модели.
Впервые данная модель бинарного типа была применена Д. Мартином в 1977 году Martin D. «Early warning of bank failure: A logit regression approach» // Journal of Banking and Finance, 1977, p. 249. для прогноза отзыва лицензии у коммерческих банков в США. После сравнения результатов с итогами, полученными с помощью использования модели дискриминантного анализа, были сделаны следующие выводы: помимо того, что построенная модель бинарного типа не предполагает нормального распределения регрессоров, с ее помощью можно определить вероятность дефолта, а не бинарный ответ - «дефолт» / «не дефолт».
Аналогичная модель для российского банковского сектора была использована в исследованиях А. М. Карминского А. А., Пересецкого и А. В. Кострова Карминский А. М., Пересецкий А. А., Костров А. В. «Модели вероятности дефолта российских банков. Предварительное разбиение банков на кластеры» // РЭШ, 2003.. Отличительной особенностью данной работы является наличие двух способов предварительного разделения банков на одинаковые по нескольким признаком кластеры: использование экспертного подхода и алгоритма построения функции максимального правдоподобия. В результате выборка коммерческих банков была разделена на 4 кластера: кластер малых банков; кластер крупных банков; кластер банков, не участвующих в спекулятивных операциях на рынке ГКО и ОФЗ; кластер банков со значительной долей вложения в ГКО и ОФЗ. Далее для каждого из кластеров была построенная своя модель. Отбор моделей, используемых в дальнейшем для прогнозирования вероятности отзыва лицензии, осуществлялся на основе анализа значений коэффициентов «MсFadden R-squared» и «LR statistic».
Во всех исследованиях в исходную выборку помимо «хороших» Под термином «хороший» коммерческий банк понимается такой банк, который имел лицензию на осуществление банковских операций в момент проведения исследования банков попадали и те, лицензия у которых была отозвана по экономическим причинам. Таким образом, каждый из экономистов старался выявить наиболее значимые финансовые показатели, с помощью которых можно было наиболее точно спрогнозировать или оценить вероятность наступления дефолта коммерческого банка в будущем. Помимо анализа данных показателей, некоторые авторы также включали в модель макроэкономические переменные, которые, по их мнению, позволяют улучшить прогнозное качество построенной модели Hosmer D., Lemeshow S. «Applied Logistic Regression» // N.Y.: John Wiley and Sons, 2000..
В одной из первых работ Lanine G., Vennet R. «Failure Prediction in the Russian Bank Sector with Logit and Trait Recognition Models» // Expert Systems with applications, 2006, p. 463, посвященной оценке вероятности отзыва лицензии у коммерческого банка, Г. Ланин и Р. Веннет выдвинули и доказали гипотезу о том, что вероятность дефолта российского банка с большим значением отношения капитала и активов намного меньше, чем у кредитной организации с преобладающей долей обязательств. Одновременно с этим, в исследовании доказано, что размер коммерческого банка вообще никаким образом не влияет на его банкротство.
В другой статье Mannasoo K., Mayes D. «Explaining Bank Distress in Eastern European Transition Economies» // Journal of Banking and Finance, 2009, p. 244 авторы отмечают, что темпы роста ВВП являются одним из основных факторов, который должен включаться в модель оценки вероятности и прогнозирования банкротства. Однако в похожем исследовании Bock R., Demyanets A. «Bank Assets Quality in Emerging Markets: Determinates and Spillovers» // International Monetary Fund, 2012 для определения значимости изменения ВВП была построена панельная регрессия, по результатам которой была отмечена отрицательная взаимосвязь между объясняемой переменной и темпами роста ВВП.
В работе А. А. Пересецкого Пересецкий А. А. «Модели причин отзыва лицензий российских банков. Влияние неучтенных факторов» // Прикладная эконометрика, 2013. проводилась оценка влияния как макроэкономических показателей, так и финансовых коэффициентов. В результате были выявлены следующие значимые переменные:
ѕ макроэкономические показатели: обменный курс, прирост ВВП и инфляция;
ѕ финансовые показатели: отношение объема негосударственных ценных бумаг и чистых активов, отношение собственного капитала и чистых активов, отношение сформированных резервов и общего объема кредитного портфеля, отношение объема межбанковских кредитов и чистых активов.
Помимо макроэкономических показателей, некоторыми экономистами были использованы и другие переменные с целью улучшения построенной модели. Согласно ряду статей, одним из ключевых характеристик коммерческого банка в России является его тип собственности и участие в системе страхования вкладов. Например, в одной статье Fangacova Z., Solanko L. «Risk-Taking by Russian Banks: Do Location, Ownership and Size Matter? » // Institute for Economies in Transition, 2009, p. 158. авторы выявили, что если обязательства кредитной организации перед населением застрахованы в специальном учреждении, то банкам легче увеличивать свои объемы депозитов от вкладчиков, которые изначально или в дальнейшем не будут интересоваться финансовым положением коммерческого банка. В этом же исследовании доказано, что у кредитных организаций, владельцами которых, полностью или частично является государство, риск лишиться лицензии на осуществление своей деятельности намного меньше, чем у банков с иностранным участием в капитале.
Однако в другом исследовании Micco A., Panizza U., Yanez M. «Bank Ownership and Performance. Does politics matter?» // Journal of Banking Finance, 2007, p. 219. наоборот оспаривается вышеуказанное утверждение. Экономист ссылался на то, что иностранные банки меньше подвержены государственному регулированию, таким образом, показывают лучшие операционные результаты. В статье Clarke G., Cull R., Shirley M. «Bank Privatization in Developing Countries: A Summary of Lessons and Findings» // Journal of Banking Finance, 2005, p. 1905. также приводятся доводы, почему государственные банки могут уступать иностранным кредитным организациям по уровню надежности. Основными причинами являются: вмешательство государственного аппарата в деятельность банка, агентские издержки и слабость конкурентной среды, под которой понимается отсутствие чистой конкуренции и субсидирование при наличии проблем.
Следующим значимым фактором является территориальный признак головного офиса коммерческого банка. В одном исследовании Claeys S., Schoors K. «Bank Supervision Russian Style: Evidence of Conflicts between Micro- and Macro-Prudential Concerns» // Journal of Comparative Economics, 2007, p. 63. была выявлена следующая тенденция: Банк России отзывал лицензии на осуществления операций у тех банков, которые расположены в регионах с большим количеством кредитных организаций. Это объясняется тем, что мегарегулятор финансового рынка не хотел ослаблять и без того слабую конкуренцию в регионах страны.
Глава 2. Оценка вероятности банкротства коммерческого банка в России
2.1 Подбор объясняющих переменных
Одной из основных задач, которая возникает перед каждым исследователем, занимающимся оценкой вероятности отзыва лицензии у кредитной организации, является выявление характеристик, которые присущи коммерческому банку, лишившемуся своей лицензии на осуществление операций.
Согласно законодательству Российской Федерации Федеральный закон от 25.02.1999 № 40-ФЗ (ред. от 14.10.2014) «О несостоятельности (банкротстве) кредитных организаций», «под несостоятельностью (банкротством) кредитной организации понимается признанная арбитражным судом ее неспособность удовлетворить требования кредиторов по денежным обязательствам и (или) исполнить обязанность по уплате обязательных платежей».
Однако во многих исследованиях авторы расширяют периметр причин, на основании которых они относят коммерческий банк в разные категории. Одними из первых, кто увеличил круг причин, были А. М. Карминский и А. А. Пересецкий. В свое работе Карминский А. М., Пересецкий А. А., Костров А. В. «Модели вероятности дефолта российских банков. Предварительное разбиение банков на кластеры» // РЭШ, 2003. они предложили свое определение «плохого» Под термином «плохой» коммерческий банк понимается такой банк, у которого была отозвана лицензия на осуществление банковских операций в момент проведения исследования банка, которое заключалось в том, что банк признавался банкротом даже в том случае, если он попал под управление АРКО (Агентство по реструктуризации кредитных организаций). В то же время, авторы исключали коммерческий банк из списка банкротов, если его состояние оценивалось как удовлетворительно при условии, что у него была отозвана лицензия.
В другом исследовании Дробышевский С. М., Зубарев А. В. «Факторы устойчивости российских банков» -- М.: Институт Гайдара, 2011, с. 124. авторы считали банк банкротом только в случае, если:
ѕ у него была отозвана лицензия на осуществление банковских операций;
ѕ осуществлялся переход коммерческого банка под руководство АСВ (Агентство по страхованию вкладов);
ѕ собственный капитал принимал отрицательное значение;
ѕ доля просроченных платежей (во всем объеме обязательств) превышал порог в 3,0%.
Стоит отметить, что, некоторые экономисты наоборот пытались сузить причины, по которым можно признать коммерческий банк дефолтным, а именно исключить из выборки те банки, у которых была отозвана лицензия с пометкой «отмывание денег», для улучшения прогнозной модели. Такой подход был использован при построении модели в одной из работ А. А. Пересецкого Пересецкий А. А. «Модели причин отзыва лицензий российских банков. Влияние неучтенных факторов» // Прикладная эконометрика, 2013..
Учитывая предшествующий опыт и цель данной выпускной квалификационной работы, было принято решение разделить все коммерческие банки на две группы и использовать в качестве банкротов только те банки, у которых была отозвана лицензия:
ѕ исключительно по причине ухудшения финансового состояния (нарушение банковского законодательства и нормативов Центрального банка Российской Федерации, достижение величины достаточности капитала отметки ниже 2,0% и достижение размера собственного капитала уровня ниже минимального значения уставного капитала);
ѕ исключительно по причине неоднократного осуществления коммерческим банком операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также из-за нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма».
Следующей задачей является выявление показателей, способных помочь при решении поставленных задач. Не смотря на большой опыт как зарубежных, так и российских авторов, ни один из них не может с точностью сказать, какие коэффициенты необходимо рассматривать. Наиболее распространенными и традиционными являются показатели, полученные из бухгалтерской отчетности и прочих финансовых документов коммерческого банка, доступных в открытых источниках. Дополнительно авторы используют еще и качественные показатели, характеризующие менеджмент, уровень конкуренции, территориальный признак и так далее.
В данной выпускной квалификационной работе в качестве объясняющих переменных были использованы показатели / коэффициенты, отраженные в Таблице № 1.
Таблица № 1. Объясняющие переменные, использованные в данной работе
№ |
Наименование переменной |
Обозначение переменной |
|
1. |
Отношение объема балансовой прибыли и объема чистых активов |
profit_na |
|
2. |
Отношение объема государственных ценных бумаг и объема чистых активов |
gbond_na |
|
3. |
Отношение объема кредитов, выданных юридическим лицам, и объема чистых активов |
loan_bus_na |
|
4. |
Отношение объема кредитов, выданных физическим лицам, и объема чистых активов |
loan_fiz_na |
|
5. |
Отношение объема привлеченных кредитов коммерческих банков и объема чистых активов |
mbk_priv_na |
|
6. |
Отношение объема предоставленных кредитов коммерческим банкам и объема чистых активов |
mbk_pred_na |
|
7. |
Отношение объема оборотов по корреспондентским счетам и объема чистых активов (натуральный логарифм) |
oborot_na |
|
8. |
Отношение объема резервов на возможные потери объема чистых активов |
rezerv_na |
|
9. |
Отношение объема резервов на возможные потери и объема кредитного портфеля коммерческого банка |
rezerv_loan |
|
10. |
Отношение значения собственного капитала и объема чистых активов |
capital_na |
|
11. |
Отношение объема депозитов физических лиц и объема чистых активов |
deposit_fiz_na |
|
12. |
Отношение объема депозитов юридических лиц и объема чистых активов |
deposit_bus_na |
|
13. |
Объем чистых активов (натуральный логарифм) |
net_assets |
|
14. |
Отношение объема привлеченных депозитов и объема обязательств |
deposit_obyazatel |
|
15. |
Рентабельность активов (ROA) Отношение нераспределенной прибыли за период и средней валюты баланса. |
ROA |
|
16. |
Рентабельность капитала (ROE) Отношение нераспределенной прибыли за период и среднего размера собственных средств. |
ROE |
|
17. |
Стоимость активов (Cost of assets) Отношение операционных расходов и среднего объема чистых процентных активов. |
cost_assets |
|
18. |
Операционная эффективность (Cost to Income) Отношение операционных расходов и операционных доходов до создания / восстановления резервов. |
cost_income |
|
19. |
Чистый спред Разница между доходностью активов и стоимостью пассивов. |
chistii_spread |
|
20. |
Отношение объема денежных средств и эквивалентов и объема активов |
cash_assets |
|
21. |
Показатель, характеризующий размер коммерческого банка |
razmer_banka |
|
22. |
Показатель, характеризующий территориальную расположенность размер коммерческого банка |
location |
Для того, чтобы подтвердить экономический смысл объясняющих переменных, они были распределены по группам в соответствии со схемой CAMELS Американская рейтинговая система оценки коммерческих банков США, созданная в 1978 году Федеральной резервной системой США и федеральными агентствами Office of the Comptroller of the Currency (OCC) и Federal Deposit Insurance Corporation (FDIC). .
Capital adequacy (С) - переменные, связанные с капиталом коммерческого банка. Данная группа состоит только из одного показателя - «capital_na». Предполагается, что большая доля собственного капитала в объеме чистых активов коммерческого банка указывает на наличие запаса прочности. Однако следует не забывать, что слишком большая доля может характеризовать деятельность коммерческого банка как малоэффективную.
Asset quality (A) - переменные, связанные с качеством активов коммерческого банка. Данная группа включает в себя наибольшее количество объясняющих переменных, а именно почти все переменные, в знаменателе которых стоит объем чистых активов, и натуральный логарифм чистых активов: «mbk_priv_na», «rezerv_na», «deposit_fiz_na», «deposit_bus_na», «net_assets», «cost_assets». Уровень депозитов физических и юридических лиц напрямую зависит от наличия информации у вкладчиков о возможном нарушении банковского законодательства в части совершения запрещенных операций. Предполагается, что переменные «deposit_fiz_na», «deposit_bus_na» будут значимыми в построенной модели.
Management (M) - переменные, связанные с качеством управления коммерческого банка. Данная группа включает в себя следующие переменные: «loan_bus_na», «loan_fiz_na», «mbk_pred_na», «rezerv_loan», «oborot_na», «razmer_banka», «location». Основной переменной из данной группы является «oborot_na», так как она считается основным индикатором банковской активности и стратегического поведения менеджмента коммерческого банка Пересецкий А. А. «Модели причин отзыва лицензий российских банков. Влияние неучтенных факторов» // Прикладная эконометрика, 2013.. Другими важными переменными являются «razmer_banka» и «location». Важность переменной «razmer_banka» обосновывается низкой вероятностью банкротства коммерческого банка с большой долей в банковском секторе. В исследовании Lanine G., Vennet R. «Failure Prediction in the Russian Bank Sector with Logit and Trait Recognition Models» // Expert Systems with applications, 2006, p. 463 данная переменная являлась значимой на 5,0% доверительном интервале. Как уже утверждалось ранее, предполагается, что мегарегулятор финансовой системы занимается отзывом лицензий у коммерческих банков в регионах с большим количеством кредитных организаций Claeys S., Schoors K. «Bank Supervision Russian Style: Evidence of Conflicts between Micro- and Macro-Prudential Concerns» // Journal of Comparative Economics, 2007, p. 63. В исследовании С. М. Дробышевского и А. В. Зубаревой Дробышевский С. М., Зубарев А. В. «Факторы устойчивости российских банков» -- М.: Институт Гайдара, 2011, с. 124. получены интересные результаты, связанные с объемом резервов по отношению к объему кредитного портфеля. С точки зрения экономического смысла, рост данного показателя наоборот свидетельствует об ухудшения финансового состояния коммерческого банка. Однако авторы обнаружили противоположный результат, который можно объяснить тем, что большие резервы не скрывают только крупные кредитные организации (в отличие от мелких игроков банковского сектора). Предполагается, что все три коэффициента будет значимы в построенной модели.
Earnings (E) - переменные, связанные с доходностью коммерческого банка. Данная группа представлена следующими переменными: «profit_na», «ROA», «ROE», «cost_income», «chistii_spread». Как высокие, так и низкие значения данных переменных сопровождаются дополнительными рисками для коммерческого банка. В случае если на протяжении анализируемого периода наблюдается сбалансированная прибыльность деятельности, то это может говорить об ориентации кредитной организации на устойчивое развитие. Значимость переменной «profit_na» подтвердилась в исследовании К. Кана и Н. Папаниколау Kahn C., Papanikolaou N. «What problem banks reveal about future financial distress: Evidence from the late 2000s financial crisis» // Journal of Banking Finance, 2011, p. 148.
Liquidity (L) и Sensitivity to risk (S) - переменные, связанные с ликвидностью и чувствительностью к риску. Данная группа состоит из «gbond_na», «deposit_obyazatel», «cash_assets». Любой коммерческий банк совершает операции с ценными бумагами, так как это является важным компонентом управления ликвидностью. При этом совершение операций с государственными ценными бумагами снижает общий риск деятельности коммерческого банка. Предполагается, что те банки, которые активно используют данный инструмент для хеджирования своих рисков, наименее склонны к дефолту в будущем. Наличие высокого значения «deposit_obyazatel» и «cash_assets» говорит о возможности коммерческого банка своевременно обслуживать свои обязательства.
Несмотря на рекомендации прошлых исследователей, в данной выпускной квалификационной работе макроэкономические показатели не будут использоваться в качестве объясняющих переменных, так как исходная выборка будет состоять только из коммерческих банков, зарегистрированных и ведущих банковские операции только на территории Российской Федерации, и ежедневно сталкивающихся с одними и теми же экономическими условиями.
2.2 Описание данных для эмпирического анализа
Данный раздел посвящен описанию процесса сбора и анализа информации, которая будет использована при оценке вероятности отзыва лицензии у российских коммерческих банков.
Анализ банковского сектора Российской Федерации
На 01.03.2016 в Российской Федерации зарегистрировано 1 010 кредитных организаций, в том числе 676 коммерческих банков, доля которых, начиная с 2014 года, начала заметно уменьшаться. Сокращение количества коммерческих банков обусловлено реализацией программы Центрального Банка Российской Федерации, направленной на оздоровление банковского рынка России. Таким образом, за последние два года было отозвано 196 лицензий (см. Приложение № 1). Динамика отзывов лицензий представлена на Графике № 1.
График № 1. Динамика отзывов лицензий за последние два года (с 01.03.2014 по 01.03.2016).
Как видно из Графика № 1 основной пик отзывов лицензии у коммерческих банков пришелся на середину 2014 года, июль и ноябрь 2015 года.
Для формирования гипотез и подбора объясняющих переменных был проведен анализ причин, по которым Банк России отзывал лицензии на осуществления банковской деятельности у коммерческих банков. Данные причины можно разделить на две группы: экономические (связанные с ухудшением количественных показателей) и неэкономические (связанные с ухудшением качественных показателей). Основными экономическими причинами являлись нарушения норматива по достаточности капитала кредитной организации и несоответствие требуемых размеров собственных средств и уставного капитала. Отзыв лицензий по неэкономическим причинам в основном являлся следствием неоднократного осуществления коммерческим банком операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также следствием нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма». Диаграмма распределения коммерческих банков по видам причин отзыва лицензии представлена на Рисунке № 3.
Рисунок № 3. Основные причины отзыва лицензий у коммерческих банков.
Как видно из Рисунка № 3, наиболее частыми причинами банкротства банка являются экономические причины, которые в основном заключаются в потере ликвидности и / или снижении величины собственных средств.
Действительно, при нехватке у кредитной организации ликвидных средств, возникает риск несвоевременного исполнения обязательств перед своими кредиторами и контрагентами. Волатильность остатка ликвидных средств, которые представлены остатками денежных средств на корреспондентских счетах в Банке России, можно увидеть на Графике № 2. Исходя из данных Графика № 2, высокая волатильность значений остатков денежных средств наблюдается в середине 2014 и 2015 годов, что не совсем совпадает с пиками отзывов лицензий у коммерческих банков. Это объясняется тем, что некоторые банки так и не смогли решить возникнувшие проблемы с нехваткой ликвидности, поэтому их признавали банкротами.
График № 2. Сведения об остатках средств на корреспондентских счетах кредитных организаций в Банке России (млрд. руб.).
Для более конкретного определения ситуации с ликвидностью необходимо также проанализировать изменение основных показателей банковской системы России.
Основные показатели банковской системы России по итогам февраля 2016 года, опубликованные на официальном сайте Центрального банка Российской Федерации, показывают слабую динамику (см. График № 3), что объясняется сокращением кредитной активности и ликвидных активов у коммерческих банков в настоящее время. Несмотря на продолжительный рост номинального объема активов банковского сектора на протяжении последних 12 месяцев, его значение на 01.03.2016 составило 83,3 трлн. руб., что меньше на 0,6% относительно объема активов на 01.02.2016. Кроме того, по итогам февраля наблюдается снижение объемов кредитования в корпоративном и розничном блоках (-0,6%), что подтверждается наличием определенных сложностей у коммерческих банков с фондированием денежных средств. В качестве позитивного фактора для оценки развития банковского сектора России выступает динамика и объем вкладов населения (+ 20,4% за последние 12 месяцев) и прибыли (83,0 млрд. руб.), полученной по результатам банковской деятельности.
График № 3. Основные показатели банковской системы России (трлн. руб.).
Помимо потери ликвидности, отзыв лицензии у коммерческих банков часто был сопряжен со снижением величины собственных средств. Основной проблемой коммерческих банков, которая как раз и привела к данной ситуации, являлось проведение высокорискованной кредитной политики без формирования необходимо объема резервов на возможные потери и / или отказ от использования инструментов хеджирования данного риска.
Основная доля (64,0%) обанкротившихся банков приходится на Московский регион, что не удивительно, так как за всю современную историю банковского сектора в России больше всего банков было зарегистрировано именно в Москве и Московской области. Помимо данного региона, большое количество отзывов лицензий (6,0%) было выявлено на Кавказе (представлен городами Махачкала и Владикавказ). В других регионах (Екатеринбург, Нижний Новгород, Самара, Новосибирск и так далее) доля банков, лишившихся своей лицензии, составляет 26,0%. Более наглядно данная информация представлена на Рисунке № 4.
Рисунок № 4. Регионы присутствия банков - банкротов за последние два года (с 01.03.2014 по 01.03.2016).
Структура и состав исходной выборки.
Исходная выборка включает в себя значения финансовых показателей, перечисленных в предыдущем разделе, за последние четыре квартала для 160 коммерческих банков, 90 из которых на момент анализа не были лишены лицензии на совершение банковских операций. Временной горизонт сбора информации составляет последние три года (с марта 2013 года по март 2016 года). Статус каждого банка фиксировался на конец квартала, предшествующего дате отзыва лицензии. Банки - банкроты, из которых состоит обучающая выборка, делятся на два типа:
ѕ коммерческие банки, лишенные лицензии из-за неоднократного осуществления операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также из-за нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма» (наименование зависимой переменной - laundering);
ѕ коммерческие банки, лишенные лицензии по экономическим причинам, а именно: нарушение банковского законодательства и нормативов Центрального банка Российской Федерации, достижение величины достаточности капитала отметки ниже 2,0% и достижение размера собственного капитала уровня ниже минимального значения уставного капитала (наименование зависимой переменной - finance).
В состав банков - банкротов вошли последние 70 коммерческих банков (35 банков - только по экономическим причинам; 35 банков - только по неэкономическим причинам), у которых была отозвана лицензия. При выборе финансово устойчивых кредитных организаций основной акцент ставился на включение в обучающую исходную выборку подобных банкротам банков. Критерием данного подобия являлась валюта баланса на последний доступный в открытых источниках квартал. Это было сделано для того, чтобы обучающая выборка состояла не из «маленьких» и «больших» банков, а из «хороших» и «плохих». Таким образом, в исходную выборку не вошли крупные коммерческие банки, такие как Сбербанк, ВТБ, Газпромбанк, Россельхозбанк и другие.
В исходную выборку так же не попали кредитные организации, по которым был зафиксирован факт предоставления недостоверной отчетности, так как это может заметно снизить результаты исследования, что приведет к неправильной интерпретации построенной модели. Кроме того, из выборки были исключены такие банки - банкроты, по которым либо началось, либо уже идет доверительное управление.
В качестве объясняющих переменных были использованы все переменные, описанные в предыдущем разделе.
После обзора и изучения основных теоретических и эмпирических исследований, а также самостоятельного анализа основных причин отзыва лицензии у коммерческого банка для решения задач данной выпускной квалификационной работы были сформулированы следующие гипотезы:
ѕ Н1: одинаково ли влияние одних и тех же факторов на отзыв лицензии у коммерческого банка по экономическим и неэкономическим причинам?;
ѕ Н2: являются ли значимыми при оценке вероятности отзыва лицензии у коммерческого банка по причине совершения сомнительных операций следующие объясняющие переменные: «rezerv_loan», «oborot_na», «razmer_banka», «location», «deposit_fiz_na», «deposit_bus_na», «cost_assets»?
Помимо поиска ответа на вышеуказанные вопросы в данной работе рассматривается проблема несбалансированности данных. Отличительной особенностью и научной значимостью данного исследования является построение модели оценки вероятности отзыва лицензии у коммерческого банка из-за неоднократного осуществления коммерческим банком операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также из-за нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма». Основным методом, который будет использоваться при построении данной модели, является непараметрический метод «Деревья решений» (построение регрессионного дерева решений с помощью ранее рассмотренного алгоритма CART).
Учитывая основную цель и уникальность данной выпускной квалификационной работы, в первую очередь будет проводиться оценка вероятности отзыва лицензии у коммерческого банка по неэкономическим причинам. Для сравнения полученных значений дополнительно будет проведена оценка вероятности отзыва лицензии у коммерческого банка по экономическим причинам.
2.3 Решение проблемы несбалансированности данных и построение модели оценки вероятности отзыва лицензии у коммерческого банка
Решение проблемы несбалансированности данных.
Несбалансированность выборки связана с тем, что в модели используется разное количество «хороших» и «плохих» банков. Данная проблема является одной из основных, с которыми сталкиваются исследователи по данной тематике. Следствием пренебрежения проведения балансировки обучающей выборки может стать низкая точность построенной модели.
Одним из основных методов балансировки обучающей выборки является метод, основанный на составлении разного числа сбалансированных подвыборок. Таким образом, были рассмотрены 6 вариантов формирования подвыборок в зависимости от соотношения «хороших» и «плохих» (см. Таблица № 2). Похожий метод был использован в исследованиях А. М. Карминского Карминский А. М., Пересецкий А. А., Костров А. В. «Модели вероятности дефолта российских банков. Предварительное разбиение банков на кластеры» // РЭШ, 2003. и Лоузада Louzada F. «On the impact of disproportional samples in credit scoring models: An application to a Brazilian bank data» // Expert Systems with Application, 2012, p. 8071. в 2012 году.
Таблица № 2. Варианты формирования подвыборок.
Номер варианта |
«Хорошие» банки |
«Плохие» банки |
|||
Количество |
Доля |
Количество |
Доля |
||
1 |
10 |
50,0% |
10 |
50,0% |
|
2 |
25 |
60,0% |
10 |
40,0% |
|
3 |
35 |
70,0% |
10 |
30,0% |
|
4 |
50 |
80,0% |
10 |
20,0% |
|
5 |
65 |
85,0% |
10 |
15,0% |
|
6 |
90 |
90,0% |
10 |
10,0% |
Наиболее оптимальная структура подвыборки будет выбрана с учетом значимости коэффициентов перед объясняющими факторами и значений «MсFadden R-squared», «LR statistic», «Schwarz criterion», «Akaike info criterion». Полученные результаты для зависимой переменной «laundering» представлены в Таблице № 3.
Таблица № 3. Оценки коэффициентов для моделей с разной структурой выборки.
1 |
2 |
3 |
4 |
5 |
6 |
||
С |
-50.15 0,00*** |
-1,10 0,01*** |
-5,86 0,00*** |
-2,40 0,00*** |
-1,85 0,01*** |
-4,59 0,00*** |
|
log (oborot_na) |
0,28 0,07** |
0,82 0,00*** |
0,38 0,02*** |
0,67 0,02*** |
0,67 0,00*** |
||
deposit_bus_na |
-2,87 0,00*** |
-0,54 0,01*** |
-0,58 0,06** |
-0,67 0,00*** |
-0,71 0,00*** |
-0,51 0,02*** |
|
deposit_fiz_na |
-2,67 0,00*** |
-0,55 0,00*** |
-0,69 0,00*** |
-0,80 0,00*** |
-0,83 0,00*** |
-0,60 0,00*** |
|
location |
- |
- |
2,27 0,00*** |
1,00 0,01*** |
1,05 0,01*** |
1,57 0,00*** |
|
razmer_banka |
- |
- |
- |
- |
-8 722,82 0,01*** |
-6 813,28 0,03*** |
|
rezerv_loan |
- |
- |
-4,93 0,02*** |
-2,43 0,04*** |
-2,63 0,03*** |
-3,09 0,03*** |
|
cost_assets |
- |
- |
2,04 0,01*** |
- |
- |
1,75 0,03*** |
|
gbond_na |
-20,15 0,00*** |
- |
-5,40 0,02*** |
-2,93 0,12*** |
-3,54 0,09** |
- |
|
chistii_spread |
- |
- |
- |
- |
-4,75 0,07** |
- |
|
net_assets |
4,11 0,00*** |
- |
- |
- |
- |
- |
|
deposit_obyazatel |
-3,84 0,02*** |
- |
- |
- |
- |
- |
|
MсFadden R-squared |
0,81 |
0,49 |
0,65 |
0,56 |
0,62 |
0,71 |
|
LR statistic |
89,61 |
65,83 |
108,06 |
111,42 |
138,98 |
185,14 |
|
Schwarz criterion |
0,59 |
0,87 |
0,71 |
0,66 |
0,52 |
0,31 |
|
Akaike info criterion |
0,42 |
0,77 |
0,54 |
0,52 |
0,39 |
0,23 |
Балансировка выборки осуществляется путем добавления финансово устойчивых банков в модель, что положительно сказывается на точности результатов при ее построении. Это подтверждается полученными значениями коэффициентов. По итогам анализа полученных в Таблице № 3 значений можно сделать следующие выводы:
ѕ коэффициенты в подвыборке с большим количеством «хороших» коммерческих банков, то есть с большим числом наблюдений, являются более устойчивыми;
ѕ подвыборка с большим количеством «хороших» коммерческих банков состоит из большего числа значимых и экономически обоснованных переменных;
ѕ значение коэффициентов «MсFadden R-squared», «LR statistic», «Schwarz criterion» принимает наибольшее значение, а значение коэффициента «Akaike info criterion» наименьшее значение для подвыборки с большим количеством «хороших» коммерческих банков.
Таким образом, наиболее благоприятной для использования в дальнейшем является логистическая регрессионная модель (см. Таблица № 4) со следующими значимыми объясняющими переменными: «oborot_na», «deposit_bus_na», «deposit_fiz_na», «location», «razmer_banka», «rezerv_loan», «cost_assets».
Таблица № 4.Результаты логистической регрессионной модели для зависимой переменной «laundering».
Dependent Variable: LAUNDERING |
|||||
Method: ML - Binary Logit (Quadratic hill climbing) |
|||||
Date: 01/03/16 Time: 09:00 |
|||||
Sample: 1 400 |
|||||
Variable |
Coefficient |
Std. Error |
z-Statistic |
Prob. |
|
C |
-4.592869 |
1.046566 |
-4.388515 |
0.0000 |
|
LOG(OBOROT_NA) |
0.674106 |
0.209557 |
3.216817 |
0.0013 |
|
DEPOSIT_BUS_NA |
-0.512005 |
0.221008 |
-2.316678 |
0.0205 |
|
DEPOSIT_FIZ_NA |
-0.601334 |
0.179106 |
-3.357422 |
0.0008 |
|
LOCATION |
1.565542 |
0.510248 |
3.068196 |
0.0022 |
|
RAZMER_BANKA |
-6813.267 |
3165.380 |
-2.152433 |
0.0314 |
|
REZERV_LOAN |
-3.091903 |
1.426103 |
-2.168079 |
0.0302 |
|
COST_ASSETS |
1.749896 |
0.778459 |
2.247898 |
0.0246 |
|
McFadden R-squared |
0.711891 |
Mean dependent var |
0.100000 |
||
Akaike info criterion |
0.227319 |
Sum squared resid |
12.01313 |
||
Schwarz criterion |
0.307148 |
Log likelihood |
-37.46380 |
||
LR statistic |
185.1388 |
Avg. log likelihood |
-0.093659 |
||
Obs with Dep=0 |
360 |
Total obs |
400 |
||
Obs with Dep=1 |
40 |
Уравнение полученной регрессии имеет следующий вид:
Laundering = -4,59C + 0,67log(oborot_na) - 0,51deposit_bus_na - 0,60deposit_fiz_na + 1,57location - 6813,27razmer_banka - 3,09rezerv_loan + 1,75cost_assets.
Данная модель имеет следующую интерпретацию:
ѕ знак коэффициента перед переменной «oborot_na» положительный, что говорит об увеличении вероятности отзыва лицензии у коммерческого банка при увеличении количества оборотов по корреспондентским счетам в Центральном Банке Российской Федерации;
ѕ знак коэффициента перед переменными «deposit_bus_na» и «deposit_fiz_na» отрицательный, что говорит об увеличении вероятности отзыва лицензии у коммерческого банка при снижении объема депозитов не только физических лиц, но и юридических лиц;
ѕ знак коэффициента перед переменной «razmer_banka» отрицательный, а перед переменой «location» - положительный, что говорит о повышенном уровне вероятности дефолта для мелких коммерческих банков, особенно зарегистрированных в регионах с большой концентрацией коммерческих банков;
ѕ знак коэффициента перед переменной «rezerv_loan» отрицательный, что говорит об увеличении вероятности дефолта коммерческого банка для тех банков, которые ведут высокорискованную кредитную политику, и при этом не создают адекватные по объему резервы на возможные потери.
Для проверки первой гипотезы была построена аналогичная логистическая регрессионная модель, только для зависимой переменной «finance». Для того чтобы полученные результаты можно было сравнить с результатами предыдущей модели для зависимой переменной «laundering», в данную модель также вошло 10,0% «плохих» и 90,0% «хороших» кредитных организаций. Полученные значения коэффициентов при объясняющих переменных отражены в Таблице № 5.
Таблица № 5. Результаты логистической регрессионной модели для зависимой переменной «finance».
Dependent Variable: FINANCE |
|||||
Method: ML - Binary Logit (Quadratic hill climbing) |
|||||
Date: 01/04/16 Time: 10:00 |
|||||
Sample: 1 400 |
|||||
Variable |
Coefficient |
Std. Error |
z-Statistic |
Prob. |
|
C |
34.84806 |
5.882829 |
5.923690 |
0.0000 |
|
MBK_PRIV_NA |
-1.069603 |
0.376039 |
-2.844389 |
0.0044 |
|
DEPOSIT_BUS_NA |
-0.782271 |
0.242075 |
-3.231527 |
0.0012 |
|
DEPOSIT_FIZ_NA |
-0.214884 |
0.080826 |
-2.658598 |
0.0078 |
|
NET_ASSETS |
-2.533877 |
0.419324 |
-6.042762 |
0.0000 |
|
CHISTII_SPREAD |
-11.25735 |
3.414994 |
-3.296449 |
0.0010 |
|
CASH_ASSETS |
-3.145244 |
1.826090 |
-1.722393 |
0.0850 |
|
McFadden R-squared |
0.548998 |
Mean dependent var |
0.100000 |
||
Akaike info criterion |
0.333226 |
Sum squared resid |
16.83356 |
||
Schwarz criterion |
0.413055 |
Log likelihood |
-58.64519 |
||
LR statistic |
142.7760 |
Avg. log likelihood |
-0.146613 |
||
Obs with Dep=0 |
360 |
Total obs |
400 |
||
Obs with Dep=1 |
40 |
Уравнение полученной регрессии имеет следующий вид:
Laundering = 34,85C - 1,07mbk_priv_na - 0,78deposit_bus_na - 0,21deposit_fiz_na - 2,53net_assets - 11,26chistii_spread - 3,15cash_assets
Данная модель имеет следующую интерпретацию:
ѕ знак коэффициента перед переменной «mbk_priv_na», «net_assets» и «cash_assets» отрицательный, что говорит об увеличении вероятности отзыва лицензии у коммерческого банка при снижении объемов межбанковского кредитования и денежных средств. Данный факт имеет и экономическое обоснование: снижение объема денежных средств влечет за собой потерю ликвидности банка, и как следствие, появление проблем при расчете со своими контрагентами;
ѕ знак коэффициента перед переменными «deposit_bus_na» и «deposit_fiz_na» отрицательный, что говорит об увеличении вероятности отзыва лицензии у коммерческого банка при снижении объема депозитов не только физических, но и юридических лиц;
ѕ знак коэффициента перед переменной «chistii_spread» отрицательный, что говорит о повышенном уровне вероятности отзыва лицензии у коммерческих банков с низкой доходностью активов.
Итоговые значения двух построенных бинарных моделей показывают, что только переменные «deposit_bus_na» и «deposit_fiz_na» являются значимыми для двух причин отзыва лицензии у коммерческого банка. Модель для зависимой переменной «laundering» в основном содержит переменные, характеризующие качественные показатели. Напротив, модель для зависимой переменной «finance» - в основном содержит переменные экономического характера.
Описательная статистика значимых переменных.
В Таблице № 6 представлена описательная статистика выбранных факторов, значимых в модели вероятности отзыва лицензии по неэкономическим причинам. Для каждого показателя приведены минимальные и максимальные значения, а также медиана и мода.
Таблица № 6. Описательная статистика значимых переменных.
Minimum |
Median |
Mean |
Maximum |
||
«oborot_na» |
0,0177 |
37,2917 |
58,4357 |
1 088,8959 |
|
«rezerv_loan» |
- 1,2050 |
- 0,1084 |
-0,1574 |
- 0,0019 |
|
«deposit_bus_na» |
0,0 |
2,8110 |
3,3680 |
22,5520 |
|
«deposit_fiz_na» |
0,0046 |
1,8835 |
2,3331 |
15,2453 |
|
«cost_assets» |
- 0,2735 |
0,0637 |
0,1066 |
4,8700 |
|
«razmer_banka» |
0,0 |
1,640e-04 |
9,809e-04 |
1,466e-02 |
|
«location» |
0,0 |
1,0 |
0,7360 |
1,0 |
В Таблице № 7 представлены парные коэффициенты корреляции между отобранными факторами. Что позволяет проверить наличие мультиколлинеарности в модели.
Таблица № 7. Парные коэффициенты корреляции.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|||
1 |
«oborot_na» |
1,00 |
0,01 |
- 0,06 |
0,33 |
- 0,02 |
0,02 |
0,06 |
|
2 |
«rezerv_loan» |
0,01 |
1,00 |
0,20 |
0,20 |
- 0,03 |
0,08 |
- 0,09 |
|
3 |
«deposit_bus_na» |
- 0,06 |
0,20 |
1,00 |
0,18 |
- 0,17 |
0,09 |
0,03 |
|
4 |
«deposit_fiz_na» |
0,33 |
0,20 |
0,18 |
1,00 |
- 0,08 |
0,40 |
0,10 |
|
5 |
«cost_assets» |
- 0,02 |
- 0,03 |
- 0,14 |
- 0,08 |
1,00 |
- 0,10 |
- 0,16 |
|
6 |
«razmer_banka» |
0,02 |
0,08 |
0,09 |
0,40 |
- 0,10 |
1,00 |
0,11 |
|
7 |
«location» |
0,06 |
- 0,09 |
0,03 |
0,10 |
- 0,16 |
0,11 |
1,00 |
Сильная линейная зависимость обнаружена только между:
ѕ переменной, характеризующей размер коммерческого банка, и отношением объема депозитов физических лиц и объема чистых активов (значение коэффициента корреляции 0,40);
ѕ отношение объема оборотов по корреспондентским счетам и объема чистых активов (натуральный логарифм) и отношением объема депозитов физических лиц и объема чистых активов (значение коэффициента корреляции 0,33).
Не смотря на наличии корреляции между переменными, исключить одну из них из построенной модели нет необходимости, так как значения коэффициентов не значительные, что не приводит к образованию мультиколлинеарности.
Построение модели для оценки вероятности отзыва лицензии у коммерческого банка.
Анализ оценки вероятности отзыва лицензии проводился с помощью непараметрического метода «Деревья решений». Построение данной модели осуществлялось в статистическом пакете «R» при помощи алгоритма CART. Код итогового алгоритма представлен в Приложении № 2. Перед созданием алгоритма, исходная выборка случайным образом была разбита на две подвыборки - 100 (например, все 90 «хороших» и 10 «плохих» коммерческих банков) и 25 (например, 25 «плохих» коммерческих банков) коммерческих банков, причем, большая выборка должна будет содержать не менее 10 коммерческих банков, лишенных лицензии по неэкономическим причинам. Данная подвыборка будет являться обучающей для нашей модели. Учитывая тот факт, что только регрессионное дерево, в отличие от дерева классификации, показывает вероятностные значения, построим данный тип дерева по данным обучающей подвыборки. Графическое изображение полученного дерева представлено на Рисунке № 5.
Интерпретация результатов построенного регрессионного дерева для зависимой переменной «laundering».
Результаты, полученные по итогам построения регрессионного дерева, говорят о следующем:
ѕ в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов больше 0,18 доля совокупных активов коммерческого банка в общем объеме активов банковского сектора РФ меньше 0,0129% (то есть отношение значений показателей < 0,0129%) объем депозитов физических лиц меньше общего объема чистых активов в 1,7 раза (то есть отношение значений показателей < 1,7), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 100,0%;
ѕ в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов больше 0,18 доля совокупных активов коммерческого банка в общем объеме активов банковского сектора РФ меньше 0,0129% (то есть отношение значений показателей < 0,0129%) объем депозитов физических лиц больше (или равно) общего объема чистых активов в 1,7 раза (то есть отношение значений показателей >= 1,7), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 57,0%;
ѕ в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов меньше 0,18 объем оборотов по корреспондентским счетам превышает размер чистых активов в 5,0 раз (то есть отношение значений показателей >= 5,0), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 54,0%;
ѕ в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов меньше 0,18 объем оборотов по корреспондентским счетам меньше размера чистых активов в 5,0 раз (то есть отношение значений показателей < 5,0) объем депозитов физических лиц меньше общего объема чистых активов в 0,2 раза (то есть отношение значений показателей < 0,2), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 41,0%;
ѕ в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов меньше 0,18 объем оборотов по корреспондентским счетам меньше размера чистых активов в 5,0 раз (то есть отношение значений показателей < 5,0) объем депозитов физических лиц больше (или равно) общего объема чистых активов в 0,2 раза (то есть отношение значений показателей >= 0,2) доля совокупных активов коммерческого банка в общем объеме активов банковского сектора РФ меньше 0,0044% (то есть отношение значений показателей < 0,0044%), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 60,0%.
В остальных случаях, построенное регрессионное дерево прогнозирует нулевую вероятность лишения банковской лицензии у коммерческого банка.
Проведение ROC - анализа построенных моделей. Вычисление значения Area Under the Curve (AUC) и Accuracy Ratio (AR).
Для проверки точности полученных значений построенного регрессионного дерева на практике проводят ROC - анализ T. Fawcett «An introduction to ROC analysis» // Institute for the Study of Learning and Expertise, 2005., в основе которого лежит построение ROC - кривой (кривая ошибок). ROC - кривая представляет из себя графическое изображение, характеризующее качество произвольного бинарного классификатора, с помощью которого каждый элемент выборки относится к одному из двух классов - «0» или «1». Данный анализ позволяет выявить зависимость количества верно классифицированных положительных примеров от количества неверно классифицированных отрицательных примеров. Для построения ROC - кривой также предполагается, что классификатор обладает некоторым параметром, которые в теории называют значением пороговой вероятности или точкой отсечения. При изменении значения данного порога, получаются различные варианты разбиения исходной выборки на четыре подмножества, отраженные в Таблице № 8. Таким образом, для каждой точки отсечения получаем различные значения ошибок первого и второго рода.
Таблица № 8. Варианты разбиения подмножества выборки.
Предсказанное значение |
Фактическое значение |
||
Да (положительное) |
Нет (отрицательное) |
||
Да (положительное) |
TP / TD |
FP / FD |
|
Нет (отрицательное) |
FN |
TN |
ѕ True Positives / True Default (TP / TD) - положительные примеры из выборки, которые были верно классифицированы;
ѕ True Negatives / True non Default (TN) - отрицательные примеры из выборки, которые были верно классифицированы;
ѕ False Negatives / False non Default (FN) - ошибка первого рода, то есть положительные примеры из выборки, которые были неверно классифицированы;
ѕ False Positives / False Default (FP / FD) - ошибка второго рода, то есть отрицательные примеры из выборки, которые были неверно классифицированы.
Далее при проведении ROC - анализа рассчитываются операционные характеристики бинарного классификатора, а именно:
ѕ чувствительность (, hit rate, (1 - P (Type I error))), которая обозначает долю истинно положительных случаев (TP):
ѕ специфичность (, false alarm rate, P (Type II error)), которая обозначает долю ложноотрицательных случаев (FP):
Полученные результаты вычисления данных величин необходимо представить в двумерном ROC - пространстве, где по оси ординат откладывается вероятность того, что коммерческий банк, лишенный лицензии, корректно определяется алгоритмом. По оси абсцисс откладывается вероятность того, что коммерческий банк, имеющий лицензию на совершение банковский операций, определяется алгоритмом как коммерческий банк, лишенный лицензии. Другими словами, по данной оси откладываются значения ошибки второго рода.
Количественную интерпретацию построенной ROC - кривой дает показатель Area Under the Curve (AUC) - площадь под ROC - кривой, с одной стороны ограниченная осями координат, с другой - кривой ошибок. Чем выше значение данного показателя, тем большей прогностической силой обладает построенная модель. Считается, что приемлемым значением для AUC является значение больше 0,7. James A., Barbara J. «The meaning and use of Area under a ROC curve» // RADIOLOGY, 1982, p. 29 Для дополнительной оценки качества построенной модели рассчитывают показатель Accuracy Ratio (AR) по следующей формуле Engelmann B., Hayden E., Tasche D. «Measuring the discriminative power» // Deutsche Bundesbank // Discussion paper: Banking and financial supervision, 2003:
Модель, идеально предсказывающее значение имеет значение AR = 1,0. Однако, на практике, возможно использовать для прогноза те модели, значение AR которых больше 0,6 Benchmark: у рейтинговой модели Moody's Rating Global значение AR составляет 0,85, Fitch Global Corporate Finance Ratings - 0,87, S&P Rating Global - 0,88.
Для проверки точности полученных значений построенного регрессионного дерева проведем ROC - анализ и рассчитаем значения коэффициентов Area Under the Curve (AUC) и Accuracy ratio (AR).
Базовой гипотезой (Но) является то, что у выбранного коммерческого банка была отозвана лицензия из-за невыполнения требований ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма». Ошибка первого рода показывает нам вероятность того, что коммерческий банк соответствующий нулевой гипотезе, будет классифицирован созданным алгоритмом как коммерческий банк, осуществляющий свою деятельности в настоящее время. Ошибка второго рода показывает нам вероятность того, что действующий коммерческий банк будет классифицирован построенной моделью как коммерческий банк, лишенный в настоящее время лицензии на осуществление банковских операций.
Для проведения ROC - анализа был построен прогноз вероятности отзыва лицензии у коммерческого банка на основе оставшийся от исходной выборки подвыборки, которые является тестирующей (оставшиеся 25 коммерческих банков). По каждому коммерческому банку было получено четыре прогноза, соответствующих четырем последним кварталам их финансовой деятельности. Для получения общей вероятности усредним полученные прогнозы, используя равные веса . После данных преобразований был осуществлен перевод полученной общей оценки вероятности отзыва лицензии у коммерческого банка в бинарный тип следующим образом: например, если расчетное значение общей вероятности больше 0,5 (пороговая вероятность), то данный коммерческий банк был отнесен к списку коммерческих банков, у которых отозвана лицензия на осуществление банковских операций. В противном случае, кредитная организация признается «хорошим» коммерческим банком. Данные преобразования были сделаны для каждого значения пороговой вероятности [0;1] с шагом 5,0%, а сам алгоритм был запущен 1 000 раз. После данных итераций построенная модель усреднила полученные значения оценок вероятности ошибок первого и второго родов. На основе полученных ошибок была построенная ROC - кривая, представленная на Рисунке № 6.
Рисунок № 6. ROC - кривая для регрессионного дерева для зависимой переменной «laundering»
Созданная прогнозная модель является идеальной только в том случае, если значения всех полученных точек имеют координаты (0, 1). Такой бинарный классификатор всегда верно определяет класс элемента из выборки. Отсюда следует, что чем ближе ROC - кривая проходит к верхнему левому углу, тем ценнее является модель. Таким образом, можно сделать вывод, что построенное регрессионное дерево обладает приемлемыми предсказательными способностями, так как ROC - кривая имеет смещение к верхнему левому углу и располагается выше диагональной прямой.
Значение коэффициента AUC = 0,800622 (~ 80,1%). Таким образом, значение показателя Accuracy ratio (AR) составляет 0,601245 (~ 60.1%), что значительно ниже по сравнению с моделями основных рейтинговых агентств, однако, равно приемлемому значению. Полученные значения данных коэффициентов позволяют подтвердить вывод о приемлемой точности построенного регрессионного дерева, оценивающего вероятность отзыва лицензии у коммерческого банка по причине невыполнения требований ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма».
Используя аналогичный алгоритм, построим регрессионного дерево только для зависимой переменной «finance» (первый этап) и проведем ROC - анализ построенной модели (второй этап). Графическое изображение полученного дерева представлено на Рисунке № 7.
Интерпретация результатов построенного регрессионного дерева для зависимой переменной «finance».
Результаты, полученные по итогам построения регрессионного дерева, говорят о следующем:
ѕ в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов меньше 13 объем депозитов физических лиц больше (или равно) общего объема чистых активов в 3 раза (то есть отношение значений показателей >= 3,0), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 100,0%;
ѕ в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов меньше 13 объем депозитов физических лиц меньше общего объема чистых активов в 3 раза (то есть отношение значений показателей < 3,0) объем депозитов юридических лиц меньше общего объема чистых активов в 2,6 раза (то есть отношение значений показателей < 2,6) объем привлеченных кредитов у коммерческих банков меньше общего объема чистых активов в 1,3 раза (то есть отношение значений показателей < 1,3), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 72,0%;
ѕ в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов меньше 13 объем депозитов физических лиц меньше общего объема чистых активов в 3 раза (то есть отношение значений показателей < 3,0) объем депозитов юридических лиц меньше общего объема чистых активов в 2,6 раза (то есть отношение значений показателей < 2,6) объем привлеченных кредитов у коммерческих банков больше (или равно) общего объема чистых активов в 1,3 раза (то есть отношение значений показателей >= 1,3), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 18,0%;
ѕ в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов больше (или равно) 13, но меньше 14 объем привлеченных кредитов у коммерческих банков больше (или равно) общего объема чистых активов в 0,28 раз, но меньше 1,3 раза (то есть отношение значений показателей >= 0,28, но < 1,3), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 62,0%;
ѕ в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов больше (или равно) 13, но меньше 14 объем привлеченных кредитов у коммерческих банков больше (или равно) общего объема чистых активов в 0,28 раз (то есть отношение значений показателей >= 0,28), то вероятность отзыва лицензии на осуществление банковских операций у коммерческого банка составляет 2,9%;
В остальных случаях, построенное регрессионное дерево прогнозирует нулевую вероятность лишения банковской лицензии у коммерческого банка.
Как и в случае проведения логистического анализа, регрессионное дерево для зависимой переменной «finance» в основном содержит переменные экономического характера. Напротив, модель для зависимой переменной «laundering» - в основном содержит переменные, характеризующие качественные показатели. Исключением является показатель «deposit_fiz_na», так как является значимым в двух построенных моделях.
На втором этапе проведем ROC - анализ для прогнозной модели. На основе полученных ошибок была построенная ROC - кривая, представленная на Рисунке № 8.
Рисунок № 8. ROC - кривая для регрессионного дерева для зависимой переменной «finance»
На Рисунке № 8 видно, что построенное регрессионное дерево для зависимой переменной «finance» также обладает приемлемыми предсказательными способностями. Следует отметить, что в данном случае ROC - кривая имеет большее смещение к верхнему левому углу, что говорит о лучшем качестве прогноза у данной модели. Значение коэффициента AUC = 0,856147 (~ 85,6%) и показателя Accuracy ratio (AR) = 0,712294 (~ 70,1%) подтверждают превосходство данной модели относительно регрессионного дерева для зависимой переменной «laundering». Значение AR у данной модели также ниже значения AR моделей основных рейтинговых агентств, однако, находится тоже на приемлемом уровне. В итоге, проведенный ROC - анализ позволяет сделать вывод о хорошей точности прогноза построенного регрессионного дерева, оценивающего вероятность отзыва лицензии у коммерческого банка по экономическим причинам.
Заключение
В ходе написания данной выпускной квалификационной работы был проанализирован предшествующий как зарубежный, так и отечественный опыт моделирования банкротства организаций и отзыва лицензии у кредитных организаций на осуществления банковской деятельности. Кроме этого, для проведения исследования были отобраны коммерческие банки и собраны эмпирические данные, которые характеризуют их деятельность как с количественной, так и с качественной стороны.
Результатом данной выпускной квалификационной работы является построенная модель оценки вероятности отзыва лицензии у коммерческого банка по двум причинам:
ѕ экономические причины: нарушения норматива по достаточности капитала кредитной организации и несоответствие требуемых размеров собственных средств и уставного капитала;
ѕ неэкономические причины: неоднократное осуществление коммерческим банком операций, не предусмотренных законами и нормативными актами, регулирующими банковскую деятельность, а также следствием нарушения ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансирования терроризма».
Вероятность отзыва банковской лицензии определялась с помощью модели, построенной на основе непараметрического метода «Деревья решений» (регрессионное дерево). В основном в обе модели вошли как показатели ликвидности, так и показатели, характеризующие вовлеченность коммерческого банка в операции с реальным сектором. Помимо этого, регрессионное дерево, оценивающее вероятность отзыва лицензии по неэкономическим причинам, включает в себя показатель, характеризующий месторасположения штаб-квартиры коммерческого банка и его размер в банковском секторе Российской Федерации. Данные переменные оказались статистически значимыми, и, что немало важно, экономически интерпретируемыми.
Выдвинутые перед проведением исследования гипотезы подтвердились в полном объеме. Таким образом, итоговые значения двух построенных бинарных моделей показывают, что только переменные «deposit_bus_na» и «deposit_fiz_na» являются значимыми для двух причин отзыва лицензии у коммерческого банка. Модель для зависимой переменной «laundering» в основном содержит переменные, характеризующие качественные показатели. Напротив, модель для зависимой переменной «finance» - в основном содержит переменные экономического характера. Так, например, в первом случае результаты исследования говорят о том, что у коммерческих банков, зарегистрированных в регионе с большой концентрацией кредитных организаций, с маленькой долей активов в совокупных активах банковского сектора и оборотами по корреспондентским счетам, значительно превышающими его чистые активы, вероятность лишится лицензии на осуществления своей деятельности намного выше. Во втором случае - вероятность отзыва лицензии на осуществления банковских операций напрямую зависит от объема привлеченных кредитов, чистых активов и доходностью активов.
Следует так же отметить, что в ходе написания данной выпускной квалификационной работы были выявлены те финансовые показатели, которые не оказывают влияния на вероятность отзыва лицензии у коммерческого банка. К ним можно отнести показатели, характеризующие рентабельность активов и капитала, объем ссуд, выданных физическим и юридическим лицам, а также прибыльности деятельности кредитной организации.
Анализ оценки вероятности отзыва лицензии проводился с помощью непараметрического метода «Деревья решений». Построение данной модели осуществлялось в статистическом пакете «R» при помощи алгоритма CART. В рамках данного исследования в подвыборку для построения моделей вошли 10,0% «плохих» и 90,0% «хороших» кредитных организаций. Данное соотношение было выявлено с помощью метода балансировки выборки, использованного в статьях на аналогичную тематику. Перед созданием алгоритма, исходная выборка из 125 коммерческих банков случайным образом была разбита на две подвыборки - 100 (обучающее множество) и 25 (тестирующее множество) коммерческих банков, причем, большая выборка должна будет содержать не менее 10 коммерческих банков, лишенных лицензии из-за анализируемой причины. Вероятность того, что у коммерческого банка будет отозвана лицензия на осуществления банковских операций составила 100,0% только в одном из всех случаев для каждого построенного дерева:
ѕ модель, оценивающая экономические причины: в случае, если у коммерческого банка расчетное значение натурального логарифма чистых активов меньше 13 объем депозитов физических лиц больше (или равно) общего объема чистых активов в 3 раза (то есть отношение значений показателей >= 3,0);
ѕ модель, оценивающая неэкономические причины: в случае, если у коммерческого банка расчетное значение отношения объема операционных расходов и среднего объема чистых процентных активов больше 0,18 доля совокупных активов коммерческого банка в общем объеме активов банковского сектора РФ меньше 0,0129% (то есть отношение значений показателей < 0,0129%) объем депозитов физических лиц меньше общего объема чистых активов в 1,7 раза (то есть отношение значений показателей < 1,7).
Для проверки точности полученных значений построенного регрессионного дерева проведем ROC - анализ и рассчитаем значения коэффициентов Area Under the Curve (AUC) и Accuracy ratio (AR).
Базовой гипотезой (Но) является то, что у выбранного коммерческого банка была отозвана лицензия из-за анализируемой причины. Ошибка первого рода показывает нам вероятность того, что коммерческий банк соответствующий нулевой гипотезе, будет классифицирован созданным алгоритмом как коммерческий банк, осуществляющий свою деятельности в настоящее время. Ошибка второго рода показывает нам вероятность того, что действующий коммерческий банк будет классифицирован построенной моделью как коммерческий банк, лишенный в настоящее время лицензии на осуществление банковских операций.
Построенные регрессионные деревья как для зависимой переменной «finance», так и для зависимой переменной «laundering» обладают приемлемыми предсказательными способностями. Следует отметить, что регрессионного дерева для зависимой переменной «finance» ROC - кривая имеет большее смещение к верхнему левому углу, что говорит о лучшем качестве прогноза у данной модели. Значение коэффициента AUC (0,856147 > 0,800622) и показателя Accuracy ratio (0,712294 > 0,601245) подтверждают превосходство данной модели относительно регрессионного дерева для зависимой переменной «laundering». Значения AR у двух моделей меньше значений AR у моделей основных мировых рейтинговых агентств, однако, полученные значения AR находятся выше минимально допустимого уровня. В итоге, проведенный ROC - анализ позволяет сделать вывод о приемлемой точности прогноза построенных регрессионных деревьев.
Полученные результаты могут быть полезны как исследователям, занимающимся вопросами отзыва лицензий у коммерческих банков, так и топ - менеджменту кредитных организаций. С использованием всего четырех показателей, содержащихся в финансовой отчетности, аналитик может оценить финансовое состояние анализируемого коммерческого банка. Простота модели и доступность входных параметров делают возможным проведением оценки вероятности отзыва лицензии также и со стороны вкладчиков кредитной организации.
Список использованной литературы
Нормативные правовые акты:
1. Федеральный закон Российской Федерации № 395-1 «О банках и банковской деятельности» от 02.12.1990
2. Федеральный закон Российской Федерации № 173-ФЗ «О дополнительных мерах по поддержке финансовой системы Российской Федерации» от 13.10.2008
3. Федеральный закон Российской Федерации № 40-ФЗ «О несостоятельности кредитных организаций» от 25.02.1999
4. Федеральный закон Российской Федерации № 115-ФЗ «О противодействии легализации (отмыванию) доходов, полученных преступным путем, и финансированию терроризма» от 07.08.2001
5. Положение № 1270-У «О публикуемой отчетности кредитных организаций и банковских/консолидированных групп» / Принято Центральным Банком Российской Федерации от 14.04.2003
6. Инструкция № 110-И «Об обязательных нормативах банков»/ Принята Центральным Банком Российской Федерации 16.01.2004
7. Письмо № 72-Т «О раскрытии информации кредитными организациями по формам 0409134 и 0409135»/ Принято Банком России от 25.05.2010
Специальная литература:
8. Воронин Ю. А., Алабин Б. К., Гольдин С. В. «Геология и математика. Основные методологические, теоретические и организационные вопросы примирения математических методов и ЭВМ в геологии -- Н.: Наука, 1967, с. 29
9. Головань С.А., Евдокимов А.М., Карминский А.М., Пересецкий А.А. Модели вероятности дефолта российских банков. Влияние макроэкономических факторов на устойчивость банков. - М.: РЭШ, 2004
10. Дробышевский С. М., Зубарев А. В. «Факторы устойчивости российских банков» -- М.: Институт Гайдара, 2011, с. 124.
11. Карминский А. М., Пересецкий А. А., Костров А. В. «Модели вероятности дефолта российских банков. Предварительное разбиение банков на кластеры» // РЭШ, 2003.
12. Карминский А.М., Костров А.В., Мурзенков Т.Н. Моделирование вероятности дефолта российских банков с использованием эконометрических методов. - М., 2012
13. Ким Дж. О., Мьюллер Ч. У., Королев С. Б. и др.; под ред. Хотинский А. М. / Факторный, дискриминантный и кластерный анализ: пер. с англ. -- М.: Финансы и статистика, 1989, с. 215
14. Пересецкий А. А. «Модели причин отзыва лицензий российских банков. Влияние неучтенных факторов» // Прикладная эконометрика, 2013.
15. Altman E. I. «Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy» // Journal of Finance, 1968, p. 589
16. Beaver W. H. «Financial ratios as predictors of failure» // Journal of Accounting Research, 1966, p. 71
17. Berkson J. «Application of the Logistic Function to Bio-assay» // Journal of the American Statistical Association, 1944, p. 357
18. Bock R., Demyanets A. «Bank Assets Quality in Emerging Markets: Determinates and Spillovers» // International Monetary Fund, 2012
19. Breiman L., Friedman J., Olshen R., Stone C. «Classification and Regression Trees» // Wadsworth, 1984, p. 81
20. Claeys S., Schoors K. «Bank Supervision Russian Style: Evidence of Conflicts between Micro- and Macro-Prudential Concerns» // Journal of Comparative Economics, 2007, p. 63.
21. Clarke G., Cull R., Shirley M. «Bank Privatization in Developing Countries: A Summary of Lessons and Findings» // Journal of Banking Finance, 2005, p. 1905.
22. Engelmann B., Hayden E., Tasche D. «Measuring the discriminative power» // Deutsche Bundesbank // Discussion paper: Banking and financial supervision, 2003
23. Fangacova Z., Solanko L. «Risk-Taking by Russian Banks: Do Location, Ownership and Size Matter? » // Institute for Economies in Transition, 2009, p. 158
24. Hosmer D., Lemeshow S. «Applied Logistic Regression» // N.Y.: John Wiley and Sons, 2000.
25. Hunt Earl B., Marin J., Stone P. J. «Experiments in induction» // Academic Press, 1966, p. 97
26. James A., Barbara J. «The meaning and use of Area under a ROC curve» // RADIOLOGY, 1982, p. 29
27. Kahn C., Papanikolaou N. «What problem banks reveal about future financial distress: Evidence from the late 2000s financial crisis» // Journal of Banking Finance, 2011, p. 148
28. Kolari J., Caputo M., Wagner D. «Trait recognition: An alternative approach to early warning system in commercial banking» // Journal of Business Finance and Accounting, 1996, p. 1415
29. Lanine G., Vennet R. «Failure Prediction in the Russian Bank Sector with Logit and Trait Recognition Models» // Expert Systems with applications, 2006, p. 463
30. Louzada F. «On the impact of disproportional samples in credit scoring models: An application to a Brazilian bank data» // Expert Systems with Application, 2012, p. 8071.
31. Mannasoo K., Mayes D. «Explaining Bank Distress in Eastern European Transition Economies» // Journal of Banking and Finance, 2009, p. 244
32. Martin D. «Early warning of bank failure: A logit regression approach» // Journal of Banking and Finance, 1977, p. 249
33. McCulloch W. S., Pitts W. «A Logical Calculus of the Ideas Immanent in Nervous Activity» // Bulletin of Mathematical Biophysics, 1943, p. 115.
34. Micco A., Panizza U., Yanez M. «Bank Ownership and Performance. Does politics matter?» // Journal of Banking Finance, 2007, p. 219.
35. Ohlson J. S. «Financial Ratios and the Probabilistic Prediction of Bankruptcy» // Journal of Accounting Research, 1980, p. 109
Электронные ресурсы:
36. Синельников С., Энтов Р., и др. Анализ макроэкономических и институциональных проблем финансового кризиса в России, разработка программы мер, направленных на его преодоление и осуществление финансовой стабилизации. Взаимодействие финансовых показателей и некоторых характеристик реального сектора. Институт экономики переходного периода, 2000. [Электронный ресурс]. Режим доступа: www.iet.ru.
37. Официальный сайт Центрального Банка РФ. [Электронный ресурс]. Режим доступа: www.cbr.ru
38. Информационный портал banki.ru [Электронный ресурс]. Режим доступа: www.banki.ru
Приложение
Приложение № 1
Количество и характеристика банков, лишившихся лицензии за последние два года (с 01.03.2014 по 01.03.2016)
Год |
Месяц |
Общее количество |
Регион |
Причина |
АСВ |
||||||
Москва и область |
Санкт - Петербург и область |
Кавказ |
Краснодарский край |
Другой |
Ухудшение финансовых показателей |
ПОД / ФТ |
|||||
2014 |
Март |
11 |
7 |
0 |
1 |
0 |
3 |
9 |
4 |
8 |
|
Апрель |
6 |
3 |
1 |
1 |
0 |
1 |
5 |
2 |
3 |
||
Май |
6 |
6 |
0 |
0 |
0 |
0 |
5 |
2 |
3 |
||
Июнь |
5 |
3 |
0 |
1 |
0 |
1 |
5 |
2 |
5 |
||
Июль |
8 |
5 |
2 |
1 |
0 |
0 |
6 |
3 |
6 |
||
Август |
10 |
6 |
0 |
2 |
0 |
2 |
9 |
2 |
4 |
||
Сентябрь |
10 |
6 |
0 |
1 |
0 |
3 |
10 |
3 |
7 |
||
Октябрь |
9 |
6 |
0 |
0 |
0 |
3 |
7 |
2 |
5 |
||
Ноябрь |
9 |
4 |
0 |
1 |
0 |
4 |
5 |
1 |
6 |
||
Декабрь |
8 |
1 |
0 |
0 |
0 |
7 |
3 |
4 |
5 |
||
2015 |
Январь |
6 |
3 |
0 |
1 |
0 |
2 |
4 |
0 |
3 |
|
Февраль |
2 |
1 |
0 |
0 |
0 |
1 |
2 |
0 |
2 |
||
Март |
3 |
1 |
0 |
2 |
0 |
0 |
3 |
0 |
0 |
||
Апрель |
9 |
7 |
1 |
0 |
0 |
1 |
8 |
5 |
6 |
||
Май |
6 |
3 |
1 |
0 |
0 |
2 |
2 |
4 |
5 |
||
Июнь |
14 |
12 |
1 |
0 |
0 |
1 |
6 |
6 |
8 |
||
Июль |
15 |
10 |
0 |
0 |
1 |
4 |
5 |
8 |
12 |
||
Август |
9 |
4 |
0 |
1 |
0 |
4 |
4 |
5 |
5 |
||
Сентябрь |
7 |
4 |
0 |
0 |
0 |
3 |
6 |
0 |
5 |
||
Октябрь |
10 |
7 |
1 |
0 |
0 |
2 |
6 |
4 |
9 |
||
Ноябрь |
17 |
13 |
0 |
0 |
0 |
4 |
8 |
7 |
14 |
||
Декабрь |
6 |
6 |
0 |
0 |
0 |
0 |
4 |
6 |
5 |
||
2016 |
Январь |
5 |
3 |
1 |
0 |
0 |
1 |
5 |
3 |
5 |
|
Февраль |
5 |
5 |
0 |
0 |
0 |
0 |
5 |
0 |
4 |
||
ИТОГО: |
196 |
126 |
8 |
12 |
1 |
49 |
132 |
73 |
135 |
Приложение № 2
Код алгоритма модели построения регрессионного дерева
library(rpart)
library(rpart.plot)
library(partykit)
data <- read.csv('data.csv', sep = ';')
iii=0; #счетчик числа итераций для проверки
N=100; #заданное число итераций
K=125; #число коммерческих банков
lg1=0; #счетчик ошибок первого рода для регрессионного дерева
lg2=0; #счетчик ошибок второго рода для регрессионного дерева
k=1; #счетчик итераций
T=4; #число строк по каждому коммерческому банку
O=100; #число коммерческих банков в обучающей выборке
Q=10; #минимальное число коммерческих банков, лишенных лицензии на осуществление банковской деятельности, в обучающей выборке
fitly <- rpart(data = data[1:(T*O),], LAUNDERING ~ log(oborot_na)+deposit_bus_na+deposit_fiz_na+location+razmer_banka+rezerv_loan+cost_assets, method = 'anova')
fancyRpartPlot(fitly)
o <- array(1:K, dim=c(K))
for (m in 1:K) #генерация номера первых строк по каждому коммерческому банку
{
o[m]=1+T*(m-1)
}
while (k <(N+1)){ #запуск итерации для поиска ошибок первого / второго родов
oo=sample(o) #«перемешка» первых номеров
M <- array(1:(K*T), dim=c(K*T))
for (p in 1:K){ #создание массива, соответствующего перемешанным номерам исходной выборки
for (l in 0:(T-1)){
M[1+T*(p-1)+l]=oo[p]+l
}
}
data<-data[M,] #«перемешка» исходного массива
if (sum(data[1:(T*O),25])>T*Q) {
k=k+1;
iii=iii+1;
fit <- rpart(data = data[1:(T*O),], LAUNDERING ~ log(oborot_na)+deposit_bus_na+deposit_fiz_na+location+razmer_banka+rezerv_loan+cost_assets, method='anova');
p<-predict(fit,data[((T*O)+1):(T*K),], type='vector');
pp=as.numeric(as.character(p));
pp2 <- array(1:(K-O)*T, dim=c((K-O)*T))
for (i in o[1:(O/T)])
{
for (l in 0:(T-1)){
pp2[i+l]=sum(pp[i:(i+3)])/4;
}
}
for (i in 1:((K-O)*T))
{if (pp2[i]>=0.5) {pp2[i]=1}
else{pp2[i]=0}
}
n=table(data[((T*O)+1):(T*K),25],predicted=pp2);
#sum(n)-sum(diag(n))
tryCatch({m1=n[1,2]}, warning = function(w) {}, error = function(e) {}, finally = {0})
m2=n[2,1];
lg1=lg1+m1;
lg2=lg2+m2;
}
}
lg1=lg1/(N*T*(K-O));
lg2=lg2/(N*T*(K-O));
print(paste('Ошибка первого рода для регрессионного дерева:', lg1))
print(paste('Ошибка второго рода для регрессионного дерева:', lg