Recovery rate в банке что это
ML и DS оттенки кредитного риск-менеджмента | Компоненты
В предыдущей статье цикла о моделировании в задачах управления кредитным риском (здесь) мы провели обзор трех задач кредитного риск-менеджмента, нашли возможные точки приложения ML и DS к этим задачам и попутно ввели набор терминов для дальнейшей работы.
Сейчас мы расскажем о трех компонентах (PD, LGD, EAD), которые участвуют при расчете ожидаемых потерь: рассмотрим основные драйверы и методологию построения моделей. В конце статьи приведем сводную таблицу с особенностями работы с компонентами на различных этапах разработки, сформированную на основе нашего проектного опыта.
За подробностями добро пожаловать под кат.
PD или как ковер задает стиль всей комнате
Определение дефолта
Начнем с главной компоненты, которую необходимо оценивать (например, в случае базового или продвинутого ПВР) PD (a. k. a. probability of default) – вероятность дефолта клиента. В качестве свидетельства о дефолте клиента могут выступать разные события в кредитной истории. Часто – это просрочка платежа по кредитному договору 90 и более дней.
Для подсчета количества дней просрочки существует два метода: LIFO (last in first out) и FIFO (first in first out) [1]:
Для определения дефолта необходимо задать следующие три атрибута:
Но этого недостаточно для формирования целевого события. У целевого события есть еще один важный атрибут: горизонт сбора информации о дефолте, или горизонт моделирования.
Определение длины горизонта
Информация о дефолте используется для оценки ожидаемых потерь, под которые банк осуществляет резервирование. В этом случае возникает вопрос, а на каком периоде смотреть выходы в дефолт? Важно ли это? С точки зрения бизнеса, важно понимать период планирования, с точки зрения моделей мы хотим выбрать такой период, в котором будет охвачено не менее 80%-90% всех возможных выходов в дефолт для всех открытых и не находящихся в дефолте договоров на текущий момент времени.
Для целей выбора длины горизонта может быть использован винтажный анализ [2]. Он заключается в построении графической аналитики и последующего вывода о данных по ней. График может быть построен так:
При построении графика выше для каждой когорты было рассчитано значение, составляющее 80% от максимального числа наблюдений, вышедших в дефолт, а диапазон полученных значений обозначен серой полосой. По графику можно сделать вывод о том, что оптимальная длина горизонта лежит в интервале 6-8 месяцев.
Сегментирование выборки
Некоторые атрибуты настолько сильно коррелируют с целевой переменной, что вклад остальных практически нивелируется. Это приводит к моделям с плохим ранжированием внутри группы с одинаковым значением «главного» атрибута. Во избежание такой ситуации используют подход сегментации, в рамках которого выборку делят на два или несколько сегментов — по одному на каждое значение «главного» атрибута (драйвера), и для каждого из них строят отдельную модель. В кредитном риске один из таких драйверов – наличие или длительность просрочки по платежу.
Если выборка была разделена на два сегмента по длительности просрочки: сегмент с малой просрочкой и сегмент с большой просрочкой, и второй сегмент достаточно мал, то для него можно сделать простую модель на двух атрибутах: на скоринговом балле модели с малой просрочкой и длительности текущей просрочки. Если результат удовлетворяет всем требованиям валидации, то на нем можно остановиться.
Альтернативно можно разделить выборки на сегменты с просрочками за историю (I) и без просрочек за историю (II).
Необходимое условие для сегментации – достаточное количество дефолтных наблюдений в каждом из сегментов. А для того, чтобы выяснить целесообразность и границы новых сегментов используется roll-rate анализ [3]. Он заключается в разделении выборки на подсегменты на основании значений величины текущей просрочки и сравнении между ними среднего уровня дефолта. Те группы, уровень дефолта которых значимо различается, имеет смысл моделировать по отдельности.
Рассмотрим, например, сегментацию наблюдений по величине просрочки. На картинке ниже в качестве примера выделены следующие 5 сегментов, соответствующих интервалам (бакетам) значений просрочки: 0-4 дня, 5-14 дней, 15-29 дней, 30-59 дней, 60-89 дней. Эти сегменты рассматриваются в нескольких моментах времени: HY1_2015, HY2_2015 — соответственно, первое и второе полугодия 2015 года, HY1_2016, HY2_2016 — соответственно, первое и второе полугодия 2016 года. В процессе анализа нас интересует динамика выхода наблюдений в просрочку более 89 дней, поэтому для каждого из этих сегментов подсчитан процент клиентов, просрочка которых на горизонте наблюдения составила более 89 дней.
По графику можно сделать следующие выводы:
EAD (Деньги в дефолте)
После того, как оценена вероятность дефолта заемщика, ставится вопрос – с какой суммой задолженности заемщик уйдет в дефолт? Эта сумма линейно влияет на размер ожидаемых потерь и, соответственно, объем резервов, и называется exposure at default – требования в дефолте. Итак, EAD – exposure at default – кредитные обязательства по договору на момент дефолта.
Напрямую, как правило, EAD не моделируют. Так как эта величина – денежная, её распределение не носит нормальный характер: в выборке могут присутствовать наблюдения очень большие и очень маленькие, не являющиеся при этом аномалиями. В зависимости от специфики портфеля можно выбрать разные целевые переменные – об этом подробнее будет сказано в последующих статьях цикла, но наиболее широко используемая – CCF – credit conversion factor – коэффициент кредитной конверсии – вычисляется следующим образом:
где:
Balance – сумма средств, которые клиент должен банку в момент наблюдения,
Limit – доступный клиенту лимит,
EAD – сумма средств, который клиент должен банку в момент дефолта.
Получается, что CCF – это та часть доступных на момент наблюдения средств, которая будет использована клиентом к моменту дефолта.
Как и вероятность дефолта, эту величину необходимо прогнозировать заранее. Обычно горизонт прогноза такой же, что и у PD.
Все описанное выше касалось денег до дефолта и во время него. А что происходит сразу после? Об этом компонента LGD.
LGD («Где деньги, Лебовски?»)
Даже в случае дефолта заемщика, часть средств возвращается в банк:
Поскольку временной интервал, на котором происходит т.н. «восстановление» (возвращение долга), может варьироваться поклиентно, возникает необходимость определить длину горизонта восстановления, на котором будет рассчитываться целевая переменная. На длину горизонта влияет в первую очередь доступность достаточного временного периода в данных для моделирования. Обычно длина горизонта лежит в диапазоне 3-5 лет после дефолта.
В общем случае LGD рассчитывается формуле:
где:
Ri – денежный поток от клиента (выплаты, реализация залога и др.), полученный на горизонте восстановления после дефолта,
T – временной период от момента учета возмещения после момента дефолта (в годах).
При расчете денежного потока, который идет на восстановление, обычно используется дисконтирование – механизм учета текущей стоимости денежных средств, полученных на горизонте восстановления. Особенно это актуально на больших горизонтах, когда стоимость денег может существенно изменяться.
Суммы возмещения, затрат и продажи долга при дисконтировании умножаются на «фактор дисконтирования» [4] P(T):
T – временной период от момента учета возмещения после момента дефолта (в годах),
r – ставка дисконтирования.
В качестве r может быть использована, например, процентная ставка по договору.
С компонентами, в первом приближении, понятно: все разные, а моделировать их нужно вместе! Есть ли какой-то подход, который позволит более-менее единообразно отобрать переменные для моделей и выбрать наиболее оптимальную комбинацию? Можно попробовать. О возможном варианте далее.
«Великолепный план, Уолтер … надёжный как … швейцарские часы» или pipeline разработки
Этапы моделирования компонент риска схематично изображены на следующей диаграмме (стрелки – дополнительные итерации, возникающие в процессе разработки):
Подготовка данных
Подготовка данных включает в себя формирование трёх сущностей: наблюдения (сегмент), витрина дефолтов, витрина атрибутов,- с единым внешним ключом — ID заемщика или договора и временная метка.
Такая декомпозиция обеспечивает гибкий подход к формированию выборки – легко изменять горизонт, гранулярность наблюдений, определение дефолта и не беспокоиться о корректности сбора атрибутов для итоговой витрины.
Каждое наблюдение – ID заемщика или договора и временная метка; другими словами, нас интересует состояние заемщика или договора на конкретную дату. Обычно используются наблюдения, соответствующие временным срезам, отстоящим друг от друга на равные промежутки времени (например, квартальным).
В случае задачи резервирования объем данных должен включать в себя полный экономический цикл, что составляет примерно 5-7 лет.
Для формирования выборки необходимо учитывать горизонт.
В выборки для разработки и тестирования включаются наблюдения, для которых есть данные о выходе в дефолт на всем горизонте, поскольку включение наблюдений, для которых не прошел полный этап сбора (на картинке изображен красным цветом) приведёт к смещению величины уровня дефолта.
Из-за необходимости учитывать период сбора, оптимальная глубина данных составляет 2-3 горизонта наблюдения.
Также, если в модели планируется учесть какого-то рода сезонность — необходимо соответствующим образом выбирать глубину данных и периодичность срезов.
В таблице под катом перечислены основные группы и примеры атрибутов широкого списка переменных.
Блок атрибутов | ЮЛ/ФЛ | Описание | Примеры |
Профиль | ЮЛ | Данные, характеризующие компанию | ОКОПФ, ОКВЭД (отрасль), возраст компании, число руководителей. Количество полных лет/месяцев обслуживания в банке. |
ФЛ | Анкета клиента, социодемографические данные | Семейное положение, пол, возраст, образование Количество полных лет/месяцев обслуживания в банке | |
Государственные контракты | ЮЛ | Сводные данные по количеству и сумме государственных контрактов компании | Количество/сумма гос. контрактов за период. Динамика данных показателей. |
ФЛ | — | — | |
Арбитражные дела | ЮЛ | Сводные данные по количеству и сумме арбитражных дел, в которых компания принимала участие. | Количество/сумма арбитражных дел компании в качестве ответчика/истца/третьего лица за период. Динамика данных показателей. |
ФЛ | Сводные данные по количеству и сумме арбитражных дел, в которых клиент принимал участие. | Количество/сумма арбитражных дел клиента в качестве ответчика/истца/третьего лица за период. Динамика данных показателей. | |
Транзакционные агрегаты | ЮЛ | Сводные данные по количеству транзакций и оборотам для клиента | Количество/сумма операций списания/начислений за период. Оборот компании за период. Динамика данных показателей. |
ФЛ | Сводные данные по количеству транзакций и оборотам для клиента | Количество/сумма операций списания/начислений за период. Оборот собственных средств клиента за период. Динамика данных показателей. | |
Финансовые показатели | ЮЛ | Данные по финансовым показателям компании | Выручка, активы, общие обязательства EBITDA, OIBDA, Equity, оборачиваемость внеоборотных активов, оборачиваемость кредиторской задолженности и др. фин. показатели за период. Динамика данных показателей. |
ФЛ | Данные по финансовым показателям клиента | Payment to income (PTI), debt to income (DTI) | |
Контрагенты | ЮЛ | Взаимодействие с контрагентами, фигурантами списка клиентов с сомнительной репутацией | Флаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных контрагентов за период |
ФЛ | Взаимодействие с другими ФЛ, входящими в список клиентов с сомнительной репутацией | Флаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных взаимодействий за период | |
Внешние данные | ЮЛ | БКИ | Агрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки. |
ФЛ | БКИ | Агрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки. | |
Негативная история | ЮЛ | Попадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследований | Количество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией |
ФЛ | Попадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследований | Количество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией | |
Группа | ЮЛ | Данные по компаниям, связанных с данной | Вхождение в группу компаний с задолженностью/наличием арбитражных дел/присутствие компаний с высокорискованными ОКВЭДами |
ФЛ | Данные по клиентам, связанных с данным | Вхождение в группу клиентов с негативной информацией – просрочка, фрод. | |
Другие продукты | ЮЛ | Данные по другим используемым продуктам банка | Флаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей. |
ФЛ | Данные по другим используемым продуктам банка | Флаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей. |
Один из способов увеличения интерпретируемости и стабильности модели – это использование в качестве атрибутов не абсолютных значений признаков, а относительных: нормированных, например, на доход (выручку) или отражающих тренд/динамику показателя на временном интервале.
Однофакторный анализ
Целью проведения однофакторного анализа является уточнение широкого списка факторов таким образом, чтобы исключить неподходящие переменные.
Для проведения однофакторного анализа необходимо разбить выборку на выборки для разработки (train) и тестирования (test). Выборка для тестирования может быть сформирована одним из следующих способов:
Стоит отметить, что в идеальном мире (где достаточное число клиентов и дефолтов) корректнее разбивать исходную выборку на три части (разработка, валидация и тестирование). В рамках такого разбиения проведение однофакторного анализа ведется на выборках для разработки и валидации, а итоговое качество отбора оценивается на выборке для тестирования. Для упрощения мы здесь и далее рассматриваем разбиение на train/test.
Многофакторный анализ и финальная модель
Цель многофакторного анализа – построение оптимальной комбинации факторов из списка, образованного на предыдущем шаге, для максимизации предсказательной силы модели при сохранении стабильности.
Процесс многофакторного анализа заключается в построении множества моделей и выборе наилучшей из них. Модели строятся на различных наборах атрибутов из списка, сформированного на этапе однофакторного анализа,
Две самые распространенные модели для прогноза вероятности дефолта – это:
где:
DistrGood – отношение числа недефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу недефолтных наблюдений;
DistrBad – отношение числа дефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу дефолтных наблюдений.
Общие правила для выполнения категоризации атрибутов складываются из экспертных правил (принципы заполнения пропусков, условие монотонности WOE, соответствие логике атрибута) и статистических критериев (достаточность наблюдений в категории).
Одним из недостатков подхода с использованием значений WOE вместо реальных значений атрибута являются потенциально возможные скачки значений вероятности дефолта (PD). Для решения указанной проблемы может использоваться сглаживание порогов функции WOE с целью создания непрерывных «плавных» переходов между соседними значениями WOE. Чаще всего сглаживание может производиться с помощью сигмоиды или гиперболического тангенса.
После описанных выше преобразований над атрибутами модель логистической регрессии строится над преобразованными атрибутами. Для выбора оптимальной комбинации факторов может быть использовано несколько подходов: [6]:
При построении модели в качестве оптимизируемой метрики могут быть использованы информационные критерии (например, SBC [8], AIC [9]). Разбиение атрибутов на группы и расчет значений WOE производится на выборке для разработки, а затем сформированный биннинг и соответствующие ему значения WOE транслируются в выборку для тестирования.
В случае, когда нет требования интерпретируемости, может быть использована модель градиентного бустинга, наиболее часто используется реализация библиотеки Xgboost. В данном случае отсутствует требование к слабой корреляции атрибутов модели. В случае необходимости ограничить набор признаков модели, используется значимость атрибута – его вклад в итоговое качество, оцениваемое коэффициентом Джини, дает не менее 1% или уменьшает функцию потерь на величину, превышающую пороговое значение.
Итоговое качество модели определяется на тестовой выборке. Выборка для тестирования может формироваться тем же способом, что и при проведении однофакторного анализа.
Сводная таблица по компонентам
PD | LGD | EAD | |
Целевое событие | Вероятность дефолта (например, просрочка 90+) на горизонте заданной длины | Часть долга, не возвращенная за период восстановления после дефолта | Размер долга, который клиент будет должен на момент дефолта |
Тип задачи | Бинарная классификация | Регрессия | Регрессия |
Горизонт | Срок, в течение которого клиент может попасть в дефолт (например, 1 год) | Период восстановления после дефолта (3-5 лет) | Срок, в течение которого клиент может попасть в дефолт (например, 1 год) |
Глубина данных (оптимальная/минимальная) | Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолт | Экономический цикл (5-7 лет) / 2-3 горизонта восстановления + 1 горизонт выхода в дефолт (для недефолтных договоров) | Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолт |
Алгоритмы | Интерпретируемые – логистическая регрессия, решающие деревья. Неинтерпретируемые – XGBoost, MLP | GLM, логистическая регрессия, деревья решений, цепочно-лестничные методы | GLM, логистическая регрессия |
Основные драйверы | Время жизни договора, флаг наличия просрочек на некотором периоде, длительность текущей просрочки, оборот собственных средств, утилизация, обеспечение залогами, payment to income (PTI), debt to income (DTI), размер компании (для ЮЛ), отрасль (для ЮЛ) | Количество дней в просрочке, возраст дефолта, наличие других кредитных договоров у данного клиента и его платежное поведение по ним, обеспечение, размер компании | Количество дней в просрочке, размер утилизации на некотором периоде, время жизни договора, размер компании |
Корректировка в рамках жизненного цикла модели | Калибровка | Калибровка/Downturn factor | Калибровка/Downturn factor |
Особенные требования к данным | История дефолтов, определение группы связанных лиц, список банкротств | Требуются факты реализации залогов (чаще для ЮЛ), факты продажи и списания кредитов | Определение сегмента для моделирования («лимитных» продуктов), работа с траншами и корректное определение графика платежа по «лимитным» продуктам |
Архитектура модели | Однокомпонентная – моделируется непосредственно PD в разрезе бизнес или аналитических сегментов | Однокомпонентная [Recovery Rate(RR)/LGD], или двухкомпонентная –(вероятность выздоровления, уровень восстановления (RR)) для двух сегментов (договора в дефолте и не в дефолте) | Однокомпонентная, но через вспомогательную переменную (например, CCF), двухкомпонентная – две вспомогательные компоненты |
Основная метрика для количественной первичной валидации | Джини, биномиальный тест, тест Херфиндаля (распределение по рейтинговой шкале) | Джини модифицированный, Loss-shortfall, зависимость поведения от возраста дефолта/длительности просрочки | Джини модифицированный |
Выводы
Итак, в статье мы провели детализацию особенностей моделирования компонент ожидаемых потерь: PD, LGD и EAD.
Главный вывод можно сформулировать следующим образом: прежде чем мы дойдем до import xgboost as xgb ML необходимо существенную часть времени потратить на аналитику и учитывать особенности бизнес-процессов при разработке и тестировании модели. Формулу для DS, применительно к нашим компонентам, можно записать в следующем виде:
Однако здесь стоит иметь ввиду два момента. Во-первых, для сегмента физических лиц характерна большая доля ML и автоматизации решений, по сравнению с сегментом юридических лиц. Во-вторых, доля ML вырастает за счет привлечения продвинутых алгоритмов для анализа, например текстовых и геоданных, а также для поиска сложных паттернов поведения клиентов по разнородным источникам.
Авторы статьи: Александр Бородин (abv_gbc), Алиса Пугачёва (alisaalisa),
Артём Савинов (artysav), Илья Могильников (eienkotowaru).
Список использованных терминов и сокращений
Кредитный риск-менеджмент как инструмент борьбы с возникновением проблемной задолженности
В условиях финансового кризиса особенно актуальными становятся задачи оперативной оценки состояния компаний, находящихся в кредитном портфеле банка, а также большое значение приобретает объективный подход к выработке оптимальных условий сделки, обоснованность принятия решения о выдаче кредита. Решение этой задачи невозможно без использования системы оценки и управления рисками.
Кредитный риск является одним из наиболее значимых банковских рисков, кроме того, именно он становится причиной возникновения проблемной задолженности и потерь, связанных с дефолтом заемщика.
Однако чтобы риск-менеджмент стал результативным инструментом, в банке должна существовать эффективная система управления рисками.
Даже если мы ограничимся только оценкой кредитного риска, задача создания системы управления кредитными рисками остается весьма нетривиальной. Встает множество вопросов:
— как создать эффективные методики рейтингования заемщиков и ссуд?
— как измерять и отслеживать текущий риск, принимаемый на себя банком?
— какие существуют основные показатели и индикаторы, отражающие кредитный риск?
— как правильно организовать бизнес-процессы и органично включить в них риск-менеджмент?
— какой информацией должен обладать риск-менеджмент?
Эффективная система должна решать следующие задачи:
— формирование характеристики состояния заемщика (рейтинг заемщика и вероятность дефолта);
— уменьшение доли проблемных кредитов;
— обоснованность условий сделок и принимаемых решений о кредитовании;
— увеличение конкурентных преимуществ за счет повышения качества кредитного портфеля;
— возможность постоянного контроля за состоянием портфеля;
— увеличение дисциплины и сокращение временных затрат за счет стандартизации и автоматизации;
— возможности для постоянного мониторинга и своевременной реакции на возникающие проблемы у клиента.
При создании системы управления кредитным риском банки опираются на собственный опыт и наработки. Но полезно учитывать и мировой опыт в этом направлении. Подходы к оценке кредитного риска развиваются в странах Европы и США уже не одно десятилетие, и неразумно было бы пренебрегать теми идеями и моделями, на которые был потрачен не один миллион долларов.
Рекомендации Базельского комитета не содержат законченной универсальной модели, которую нужно использовать в системе кредитного риск-менеджмента. Такой модели просто не существует. Базель II — это методология, которая предлагает подход, гарантирующий в итоге построение эффективной системы управления кредитными рисками.
В рамках базового IRB-подхода (Foundation Approach) банкам предоставляется возможность использовать собственные модели только для оценки вероятности дефолта (Probability of Default, PD) заемщиков. Также предусмотрено дальнейшее развитие и переход к продвинутому (advanced) IRB-подходу, в соответствии с которым финансовым организациям (банкам) позволено применять собственные модели для оценки основных рисковых параметров, необходимых для оценки требования на экономический капитал. При этом регулятору должна быть представлена верификация модели. Таким образом, стимулируется использование банками собственных методик, их развитие и постоянное совершенствование.
Среди базовых рисковых параметров, каждый из которых является случайной величиной, Базельский комитет выделяет следующие:
— среднегодовая вероятность дефолта (Probability of Default, PD) и рейтинг заемщика. PD является вероятностью того, что кредит не будет выплачен, то есть произойдет дефолт. Вероятность дефолта рассчитывается для каждого заемщика в отдельности (корпоративные клиенты) либо в целом по портфелю однородных ссуд. Существует довольно много различных моделей, позволяющих рассчитать PD исходя из имеющейся информации. Можно выделить три основных класса: структурные модели, модели сокращенной формы и кредит-скоринговые модели. Первые два подхода основаны на рыночных данных (стоимость акций, доходность облигаций), поэтому непосредственно не применимы к большей части стандартных заемщиков российских банков. Таким образом, наибольший практический интерес представляют именно кредит-скоринговые модели, в результате использования которых каждому заемщику присваивается некоторый рейтинг, характеризующий его финансовое состояние и способность погасить свои обязательства перед банком. Весь диапазон возможных значений рейтингового балла разбивается на интервалы, называемые рейтинговыми группами. Кроме этого, при помощи специальной калибровки рейтинговому баллу ставится в соответствие вероятность дефолта. PD, сопоставленная рейтинговой группе, фактически является оценкой процента компаний этой группы, которые испытают дефолт в течение года;
— экспозиция под риском (Exposure at Default, EAD). EAD представляет собой оценку суммы, подвергаемой риску, то есть части кредита, которая теряется в случае дефолта. При расчете необходимо учитывать следующие факторы: во-первых, задолженность по ссуде (особенно по сложным продуктам с системой лимитов) может колебаться с течением времени, поэтому необходимо уметь оценивать ее значение в момент возникновения дефолта. Во-вторых, наличие высоколиквидного обеспечения позволяет снизить EAD, так как его реализация дает возможность быстро вернуть часть потерянного кредита. Однако оставшуюся часть ссуды вряд ли удастся вернуть полностью;
— среднеожидаемая доля потерь средств в случае дефолта (Loss Given Default, LGD) обычно рассчитывается в процентах от EAD. LGD как раз и является оценкой той части EAD, которая будет безвозмездно потеряна, если произойдет дефолт. Необходимо учитывать наличие дополнительного обеспечения по ссуде, значимость залога для клиента, а также текущее финансовое состояние заемщика, то есть его рейтинг. При расчете LGD и EAD очень важным является вопрос правильного определения стоимости обеспечения, его ликвидности и вероятности возврата.
Дополнительно в эту группу параметров можно включить следующие важные факторы:
— горизонт риска (Maturity, M). Очевидно, что риски возрастают при увеличении срока кредита. Горизонт риска, в общем случае, не совпадает со сроком кредитного договора. Он может как превосходить его (например, в том случае, если предполагается продление действия продукта), так и быть меньше (например, при реализации инвестиционного проекта, когда уже на операционной стадии значительно возрастает стоимость обеспечения);
— GRP (Group) — групповая принадлежность компании-заемщика. При анализе необходимо учитывать не только такие однозначные критерии, как долевое участие или состав руководства, но и факторы экономической, региональной связанности. Рассмотрение таких факторов позволяет качественнее выявить реальную групповую структуру заемщиков. Низкая диверсификация портфеля и наличие больших связанных групп ведут к значительному увеличению стрессовых потерь и могут оказаться критичными для банка.
В соответствии с продвинутым (advanced) подходом внутренних рейтингов (AIRB Базель II) для оценки каждого из этих случайных параметров требуется разработать специальную математическую модель.
Основной проблемой при создании таких моделей в российских условиях является недостаточность или даже полное отсутствие у банка исторических данных по многим характеристикам сделок и клиентов, которые необходимы для верификации и калибровки моделей. При этом общих статистических данных либо тоже не существует, либо они неприменимы в связи со спецификой деятельности банка или особенностями кредитной политики. Вместе с тем эти проблемы не должны отталкивать банки от развития собственных внутренних моделей, так как зачастую на первоначальном этапе возможно основываться на данных, содержащихся в открытых источниках, а также на экспертных суждениях. Это позволит, с одной стороны, сделать первый шаг на пути развития собственных методик, а с другой стороны, понять, какие данные дополнительно необходимы для усовершенствования и уточнения созданных в первом приближении моделей.
Основной причиной кредитного риска является дефолт заемщика. В соответствии с Базелем II под дефолтом понимается невозврат или просрочка основной суммы долга или процентов. Дефолт конкретного должника является произошедшим, когда имело место хотя бы одно из следующих событий: банк считает, что должник не в состоянии полностью погасить свои кредитные обязательства перед банком без принятия банком таких мер, как реализация обеспечения (если такое имеется); должник более чем на 90 дней (для юридических лиц) просрочил погашение любых существенных кредитных обязательств перед банком.
Таким образом, рейтингование заемщиков и определение вероятности дефолта является одним из наиболее важных компонентов системы управления кредитными рисками. Для построения системы рейтингования необходимо произвести следующий порядок действий:
1) необходимо выделить основные целевые отраслевые секторы;
2) для каждого целевого отраслевого сектора выделить основные риск-доминирующие факторы;
3) осуществить накопление данных по оценке показателей;
4) сформировать границы принятия решений;
5) определить веса показателей;
6) произвести верификацию рейтингового балла;
7) осуществить калибровку рейтингового балла, установить соответствия между рейтинговым баллом и вероятностью дефолта.
Выделение основных целевых отраслевых секторов
Очевидно, что характеристики и финансовые показатели корпоративных клиентов значительно отличаются от показателей финансовых компаний или субъектов Российской Федерации. Поэтому в первую очередь требуется выделить основные типы клиентов, которые находятся в портфеле и с которыми работает банк в соответствии с реализуемой кредитной политикой. В общем случае можно предложить следующее разделение на секторы: корпоративные заемщики (стандартные формы кредитования), банки, федеральные и муниципальные органы власти, малый и средний бизнес, инвестиционные проекты, прочие (депозитарии, страховые компании и т.д.). Каждый из выделенных секторов требует отдельного рассмотрения и специальной настройки рейтинговой системы.
Выделение основных риск-доминирующих факторов
Факторы могут быть как количественными, например, финансовые показатели, так и качественными, отражающими в том числе и экспертное мнение. Можно выделить несколько групп факторов в зависимости от целевого отраслевого сектора. Например, для корпоративных заемщиков можно обозначить следующие группы показателей:
— финансовые показатели и отношения (выручка, операционная маржа, доходность активов, ликвидность и т.д.);
— качественные факторы (отраслевые факторы, диверсификация бизнеса, зависимость от регуляторов, квот и т.д.);
— характеристика отношений с кредитором (кредитная история в банке, кредитная история вне банка, оценка качества оборотов в банке);
— индивидуальные факторы риска и защиты от риска (юридические, политические риски, недостаточность информации, защита от риска в виде залогов, поручительств, гарантий).
При выборе факторов, кроме их значимости и экономического смысла, следует учитывать, что по некоторым из них потребуется собрать достаточную для анализа историю. Кроме этого, не стоит выбирать слишком большое число показателей, так как, скорее всего, многие из них окажутся взаимозависимыми, что приведет к сложностям с определением их весов (этап 5).
Накопление данных по оценке показателей
Формирование границ принятия решения
На основе собранных данных можно определить, какие значения каждого из показателей являются хорошими для рассматриваемой группы клиентов, а какие — плохими. В первую очередь необходимо выделить критические значения для показателей, то есть такие значения, появление которых у заемщика свидетельствует о его неблагоприятном финансовом положении. Определение таких значений практически представляет собой систему стоп-факторов, при наличии которых работа с клиентом не прекращается, однако ему сразу назначается вмененный рейтинг или ограничение на рейтинговую группу. Оставшийся диапазон значений показателя разделяется на несколько групп, каждой из которых ставится в соответствие определенный балл. Границы выделяются таким образом, чтобы в образованные интервалы попадало примерно одинаковое количество компаний из собранной базы. При выделении границ каждой группы (табуляции) необходимо учитывать не только накопленные данные, но экономическую непротиворечивость. На рисунке 1 и в таблице 1 представлены результаты табуляции для показателя «Отношение дефицита бюджета к доходам бюджета» для субъектов РФ.
Таблица 1. Отношение дефицита бюджета к его доходам
Интервал | Балл | Оценка |
Ниже –15% | Нет | Ограничение на рейтинговую группу (не выше СС) |
От –15 до –5% | 0 | Низкая |
От –5 до 0% | 25 | Ниже среднего |
От 0 до 5% | 50 | Средняя |
От 5 до 10% | 75 | Выше среднего |
Более 10% | 100 | Высокая |
Определение весов показателей
На этом шаге необходимо определить значимость показателей. Одним из возможных подходов является экспертное проставление весов. Для этого необходимо собрать группу опытных сотрудников-экспертов, которые независимо друг от друга определят значимость предложенных факторов, после чего полученные веса усредняют.
Верификация рейтингового балла
Распределение рейтинговых систем по качеству представлено в таблице 2.
Таблица 2. Качество рейтинговых систем
Интервал Accuracy Ratio | Качество модели |
80% и выше | Отличное |
60–80% | Очень хорошее |
40–60% | Хорошее |
20–40% | Среднее |
20% и ниже | Неудовлетворительное, от модели следует отказаться |
Отметим, что в российских условиях вряд ли удастся достичь качества модели выше 0,4. По мнению автора, это связано с недостаточной прозрачностью компаний и низкими качеством и достоверностью предоставляемой финансовой отчетности. Вместе с тем международным рейтинговым агентствам (Moody’s Rating Global, Fitch Global Corporate Finance Ratings, S&P Rating Global), которые проводят глубокий и подробный анализ и аудит рейтингуемых компаний, удается получить качество моделей более 88%. Поэтому в случае полного отсутствия собственных статистических данных можно определить качество внутренней рейтинговой методики на основе корреляции полученного внутреннего рейтинга с международным. Весь диапазон возможных рейтинговых баллов имеет смысл разделить на несколько интервалов. Рейтинговые группы объединяют схожих по финансовому состоянию заемщиков. Пример такого деления представлен в таблице 3. В общем случае можно вводить и большее число рейтинговых групп или промежуточные группы.
Таблица 3. Рейтинговые группы
А, АА, ААА | Исключительная и высокая способность к исполнению финансовых обязательств |
BBB | Достаточная способность к исполнению финансовых обязательств, но более высокая чувствительность к неблагоприятным деловым, финансовым и экономическим условиям на длительном промежутке времени |
BB | Вне опасности в краткосрочной перспективе, но имеется существенная неопределенность, связанная с чувствительностью по отношению к неблагоприятным деловым, финансовым и экономическим условиям |
B | Более высокая уязвимость при наличии неблагоприятных деловых, финансовых и экономических условий, однако в настоящее время имеется возможность исполнения финансовых обязательств |
CCC | В настоящее время существует значительный риск невыполнения обязательств. Исполнение обязательств целиком зависит от благоприятных деловых, финансовых и экономических условий |
CC, C | В настоящее время находится в очень большой опасности. Ухудшение положения ниже предыдущего рейтинга настолько, что погашение полностью на основе известной информации признается вряд ли возможным |
Калибровка рейтингового балла, соответствие между рейтинговым баллом и вероятностью дефолта
Вероятность дефолта компании, по сути, является абстрактной величиной, так как представляет собой отношение количества дефолтов за год, произошедших с совершенно аналогичными компаниями, к общему числу таких компаний (среднегодовая частота дефолтов), при устремлении последнего числа к бесконечности. Таким образом, любая модель позволяет получить лишь некоторую оценку вероятности дефолта. Между вероятностью дефолта и рейтингом заемщика может быть установлено взаимно однозначное соответствие. В этом случае PD является оценкой процента заемщиков, имевших дефолт за год, от общего числа заемщиков данной рейтинговой группы. Ведущие мировые банки и рейтинговые агентства производят сбор статистики дефолтов в рейтинговых группах. В таблице 4 представлены результаты исследования банковской группы BBVB, где каждой рейтинговой группе сопоставлена наблюдаемая среднегодовая частота дефолтов.
Таблица 4. Соответствие рейтинговой группы и PD по обобщенной международной шкале
Рейтинговая группа | Средняя частота дефолтов (% в год) | Рейтинговая группа | Средняя частота дефолтов (% в год) |
ААА | 0,01 | BB– | 1,50 |
AA+ | 0,02 | B+ | 2,50 |
AA | 0,03 | B | 4,50 |
AA– | 0,04 | B– | 7,50 |
A+ | 0,05 | CCC+ | 11,91 |
A | 0,07 | CCC | 15,00 |
A– | 0,10 | CCC– | 18,90 |
BBB+ | 0,14 | CC | 30,00 |
BBB | 0,20 | CC– | 40,00 |
BBB– | 0,30 | C | 50,00 |
BB+ | 0,50 | C– | 75,00 |
BB | 0,90 | D | 100,00 |
Общепризнанной является логитная форма зависимости между рейтингом и вероятностью дефолта:
Эта зависимость подтверждается высоким коэффициентом детерминации. Однако коэффициенты фона и наклона (A и B) подлежат определению в каждом конкретном случае (т.е. при настройке модели рейтингования каждого целевого отраслевого сектора). Определение параметров производится на основе трех типов данных:
1) частота дефолтов по целевой отраслевой группе (данные банка, по стране, в крайнем случае, при полном отсутствии данных — экспертно-ожидаемая частота дефолтов);
2) распределение баллов, полученное в результате рейтингования компаний на основе собранных исторических данных (этап 3);
3) качество модели (AR), реальное (полученное в результате построения ROC-кривой на шаге 6) или предполагаемое (не выше 0,4 для российских компаний).
А также на основе двух постулатов:
1) средняя частота дефолтов по компаниям, включенным в собранную базу, равняется статистически наблюдаемой с учетом экономической ситуации;
В результате создания и правильной настройки рейтинговой системы банк получает возможность практически в автоматическом режиме производить первоначальное и мониторинговое рейтингования стандартных компаний (средний диапазон на рис. 4). Однако для компаний, получивших высокий рейтинг, все-таки требуется дополнительное подтверждение рейтинга, а при получении заемщиком низкого рейтинга также необходимо дополнительно выявить причины и отрицательные факторы. Последнее может послужить причиной для начала работы с клиентом по диагностике развития проблемной ситуации.
Следующим параметром риска является экспозиция под риском (EAD), или объем средств под риском. Эта величина показывает, какая сумма подвержена риску потерь по данному активу портфеля либо какая сумма будет подвержена риску в случае выдачи кредита. При расчете EAD необходимо учитывать следующие характеристики, которые получают из банковской системы либо из условий заявки:
— вид кредитного продукта;
— срок кредитного договора;
— срок до окончания договора;
Экспозиция под риском состоит из трех компонент: позиции (текущей задолженности), учета неиспользованного остатка лимита и коррекции.
где CCF (Credit Conversion Factor) — фактор кредитной конверсии, отвечающий за использование неосвоенной части лимита, который определяется первыми четырьмя характеристиками сделки.
CCF сильно зависит от кредитной политики банка. Очевидно, что по обычному кредиту с погашением основной суммы долга в конце срока CCF = 1. Однако для более сложных продуктов, таких как кредитные линии или овердрафты, необходимо проводить сбор исторических данных по использованию лимита в зависимости от типа продукта, срока, суммы сделки. С точки зрения оценки рисков желательно проводить такое исследование на заемщиках, по которым произошел дефолт, так как такой подход позволяет определить способ использования лимита клиентами, у которых возникают финансовые проблемы. К сожалению, таких статистических данных не всегда бывает достаточно, поэтому на первом этапе можно использовать данные по всем клиентам.
Коррекция EAD возможна и на обеспечение более низкого качества (условно приемлемое обеспечение), но в этом случае повышается величина LGD, то есть та часть EAD, которую банк безвозвратно потеряет в случае дефолта заемщика.
В стандартизованном подходе (Foundation Approach), который используется до введения внутренних моделей, содержатся следующие рекомендации на основе старшинства требований (субординированности):
— по необеспеченной части старшей ссуды LGD = 45%;
— по части старшей ссуды, имеющей признанное обеспечение, LGD = 34–40%. (достаточно пессимистическая оценка);
— по субординированным требованиям LGD = 75%.
В российском законодательстве не содержится четкого разграничения ссуд на старшие и субординированные, поэтому можно применить условное деление по признаку очередности требований. Решение о таком делении принимается внутри банка, но можно привести следующие примеры:
— к старшим требованиям можно отнести следующие ссуды: ссуды, предоставленные банкам, корпорациям, субъектам РФ под поддержание текущей деятельности, гарантии, кредиты физическим лицам и малому бизнесу и т.д. По таким ссудам LGD = 45%;
— субординированные требования: долгосрочные ссуды, учитываемые как собственный капитал; ссуды, выделенные с целью приобретения долей капитала; не обеспеченные признанным залогом части ссуд на инвестиционные цели, ссуды, у которых в EAD учтено условно приемлемое обеспечение. По таким ссудам LGD = 75%.
Кроме этого, возможна дополнительная корректировка LGD в сторону увеличения или уменьшения в зависимости от характера ссуды (наличие важного социального или государственного значения, наличие поручителей или гарантов) и состояния заемщика (принадлежность низкой рейтинговой группе (ниже ССС+) или, наоборот, наличие высокого рейтинга (выше BB–)).
Таким образом, знание параметров риска EAD и LGD дает нам возможность оценить возможные безвозвратные потери по ссуде:
Никогда не возможно точно предсказать тот объем потерь, с которым столкнется банк. Однако можно оценить средний уровень потерь банка, или так называемые ожидаемые потери (Expected Loss, EL). EL с точки зрения банков представляют собой элемент стоимости бизнеса. Оценить объем ожидаемых потерь возможно, используя основные параметры риска: PD дает среднегодовую вероятность дефолта заемщика, а EAD x LGD — уровень потерь. Таким образом, ожидаемые потери можно оценить следующим образом:
Учитывать такие потери можно, например, за счет создания адекватных резервов. Однако следует помнить о том, что процесс возврата низколиквидного обеспечения или активов предприятия может значительно затянуться, поэтому оценкой необходимого уровня резервирования является величина:
где LGD не учитывается.
Наихудшей будет ситуация, когда банк теряет весь свой кредитный портфель в течение определенного периода (например, года, если мы рассматриваем горизонт риска, равный одному году). Это событие является крайне маловероятным, поэтому держать собственный капитал под такие потери представляется экономически нецелесообразным. Банки, наоборот, стремятся уменьшить собственный капитал, чтобы дополнительно высвободить экономические ресурсы для инвестирования и получения прибыли. С другой стороны, чем меньше у банка капитал, тем выше вероятность того, что он не сможет справиться со своими собственными обязательствами, то есть вероятность того, что потери банка превысят прибыль плюс доступный капитал. Это может привести к банкротству банка. Необходимо поддерживать тонкий баланс между риском банкротства и желанием получить дополнительную прибыль.
Выделяют три основные причины возникновения непредвиденных потерь (UL):
1) подверженность заемщиков общему состоянию экономики. Этот тезис непосредственно следует из общемировой ежегодной статистики дефолтов. Есть года, когда наблюдаются значительные непредсказуемые скачки частоты дефолтов, следовательно, значительно возрастают потери банков. Эти скачки происходят под влиянием стохастического общего фактора. Методика расчета экономического капитала (Capital Requirement, CaR) под непредвиденные потери, заложенная в рекомендациях Базельского комитета, основана на идеях Мертона 7 (Merton, 1974) и Васицека 8 (Vasicek, 2002). Активы компании являются случайной функцией. Дефолт происходит в том случае, когда активы опускаются ниже некоторого уровня, определяемого долгом. Модель называется однофакторной, так как при расчете учитывается корреляция активов компании с некоторым абстрактным (не имеющим определенного экономического смысла) общим фактором или индексом, характеризующим состояние экономики в целом:
где случайная величина X отвечает активам компании;
Y, Z — независимые, случайные величины, имеющие стандартное нормальное распределение;
R — корреляции компании с общим состоянием экономики.
Таким образом, первое слагаемое описывает подверженность состояния компании состоянию экономики, а второе слагаемое соответствует индивидуальным рискам компании. В итоге, требования на экономический капитал определяются на основе формулы:,
где N ( ) — стандартное нормальное распределение;
α — уровень надежности.
В Базельском документе указано значение уровня надежности α = 99,9%. Это связано с тем, что документ разрабатывался для крупных западных банков с рейтингом не ниже А по международной шкале. Для банков более низкого рейтинга такой запас прочности является излишним. А уровень надежности следует выбирать исходя из текущего рейтинга банка и соответствующей этому рейтингу вероятности дефолта (табл. 4):
К сожалению, пути получения штрафа за превышение годового горизонта и форма зависимости коэффициента корреляции от вероятности дефолта Базельским комитетом полностью не раскрываются. В связи с этим появляется необходимость подтверждения таких зависимостей на основе открытых данных. Вопрос верификации методик представляет собой отдельную задачу, которую невозможно полностью осветить в рамках одной статьи. Следует отметить лишь, что подобные исследования не всегда приводят к полному совпадению с рекомендациями Базельского комитета;
3) увеличение потерь при низкой диверсификации портфеля. Формула требований к экономическому капиталу, разработанная Базельским комитетом, рассчитана на банки с высокодиверсифицированными портфелями. Однако для большинства российских банков такое условие не соблюдается. Конечная диверсификация портфеля приводит к увеличению стрессовых потерь (UL), следовательно, к росту требований на экономический капитал. В результате исследований, проведенных Commerzbank (Германия), была выявлена экспоненциальная форма функции штрафа за концентрацию для экономического капитала (Penalty Factor):
где δ — фиксированный коэффициент, уникальный для каждого банка, зависящий от внутренней структуры портфеля.
При достижении показателя Н6 на группу заемщиков (25% портфеля) и значении δ = 14 (низкая диверсификация портфеля) требование к капиталу для этой группы дополнительно возрастает на 50%. Таким образом, кредитование больших групп заемщиков приводит не только к повышенным рискам, но и к неэффективному использованию капитала банка.
Ожидаемые потери и требования к капиталу не являются единственными показателями риска. Удобным для практического использования является показатель маржи риска, характеризующий стоимость риска:
Маржа риска не должна превышать доходность по активу. Нарушение этого требования свидетельствует о том, что принимаемый риск не будет покрыт ожидаемыми доходами.
Кроме того, важным дополнительным параметром является показатель RAROC (Risk Adjusted Return on Capital), характеризующий соотношение доходность–риск:
Этот параметр удобен при определении эффективности инвестиции, а также при оценке деятельности подразделений. Нужно стараться поддерживать значение RAROC на уровне не менее 30%, чтобы добавление нового актива в портфель не ухудшало его структуру.
Выводы
Таким образом, в современном банке значительно возрастает роль риск-менеджмента. Оценка рисков позволяет отказаться от простого подхода, когда решение о выдаче кредита имеет вид: принять/отказать. Система управления кредитными рисками становится основой для обоснованного диалога с клиентом на базе объективных, в том числе и портфельных показателей. Важную роль играют правильно построенные бизнес-процессы. Деятельность подразделения управления рисками нельзя отделить от других подразделений банка, так как для проведения правильной и объективной оценки необходима вся доступная информация, в том числе и от других подразделений и внешних источников. Роль риск-менеджмента не ограничивается стадией рассмотрения заявки — это и выстраивание оптимальной структуры портфеля, и постоянный мониторинг, и значение и понимание уже имеющегося риска.
Невозможно полностью исключить риск. Нельзя получить доход не рискуя: чем больше риски, тем выше возможные доходы. Но нужно знать принимаемый на себя риск, чтобы быть готовым к возможным последствиям.