Recovery rate что это

recovery rate

1 recovery rate

Тематики

2 recovery rate

3 recovery rate

4 recovery rate

5 recovery rate

volume flow rate — объёмная скорость потока; объёмный расход

6 recovery rate

7 recovery rate

8 recovery rate

9 recovery rate

10 recovery rate

11 recovery rate

12 recovery rate

13 recovery rate

14 recovery rate

15 recovery rate

16 recovery rate

17 recovery rate

18 recovery rate

19 recovery rate

20 recovery rate

См. также в других словарях:

recovery rate — UK US noun [C] ACCOUNTING ► ABSORPTION RATE(Cf. ↑absorption rate) … Financial and business terms

Recovery Rate — Die Recovery Rate, teilweise im Deutschen auch als Verwertungsrate, Erlösrate oder Erlösquote[1] bekannt, ist ein Begriff aus der Finanzwirtschaft. Die Quote gibt den prozentualen Anteil an einer Forderung an, den ein Gläubiger nach der… … Deutsch Wikipedia

recovery rate — See: absorption rate … Accounting dictionary

Recovery rate — Степень регенерации (напр. летучего растворителя краски) … Краткий толковый словарь по полиграфии

Desalination Recovery Rate — The Desalination recovery rate is the product water recovery relative to the input water flow. In simpler terms, if a desalination plant was said to have a recovery rate of 15% that would mean that for every 100 US gallons (380 L) of ocean… … Wikipedia

Global Recovery Rate — A global measurement in the proportion of businesses that managed to recover more than 60% of their financial losses arising from corporate fraud. Acquiring economic crime insurance and earlier detection of fraudulent activities from controls is… … Investment dictionary

voltage recovery rate — įtampos atsikūrimo sparta statusas T sritis radioelektronika atitikmenys: angl. voltage recovery rate vok. Wiederkehrgeschwindigkeit der Spannnng, f rus. скорость восстановления напряжения, f pranc. vitesse de rétablissement de la tension, f … Radioelektronikos terminų žodynas

product recovery rate — the ratio expressed as a percentage of the weight of processed product divided by the round weight of fish used to produce that amount of product … Dictionary of ichthyology

Cash Recovery Rate — ⇡ Unternehmungsbewertung, ⇡ wertorientierte Unternehmensführung … Lexikon der Economics

Recovery Swap — Recovery Swaps, Recovery Locks or Recovery Default Swaps (RDS) are derivative contracts related to credit default swaps, and reference a bond issuance as its underlying. They are designed to provide a hedge against the uncertainty of recovery in… … Wikipedia

Recovery boiler — is the part of Kraft process of pulping where chemicals for white liquor are recovered and reformed from black liquor. In the process lignin of the wood, bound in black liquor at this phase, is burned and heat generated. The heat is usually used… … Wikipedia

Источник

recovery rate

Полезное

Смотреть что такое «recovery rate» в других словарях:

recovery rate — UK US noun [C] ACCOUNTING ► ABSORPTION RATE(Cf. ↑absorption rate) … Financial and business terms

Recovery Rate — Die Recovery Rate, teilweise im Deutschen auch als Verwertungsrate, Erlösrate oder Erlösquote[1] bekannt, ist ein Begriff aus der Finanzwirtschaft. Die Quote gibt den prozentualen Anteil an einer Forderung an, den ein Gläubiger nach der… … Deutsch Wikipedia

recovery rate — See: absorption rate … Accounting dictionary

Recovery rate — Степень регенерации (напр. летучего растворителя краски) … Краткий толковый словарь по полиграфии

Desalination Recovery Rate — The Desalination recovery rate is the product water recovery relative to the input water flow. In simpler terms, if a desalination plant was said to have a recovery rate of 15% that would mean that for every 100 US gallons (380 L) of ocean… … Wikipedia

Global Recovery Rate — A global measurement in the proportion of businesses that managed to recover more than 60% of their financial losses arising from corporate fraud. Acquiring economic crime insurance and earlier detection of fraudulent activities from controls is… … Investment dictionary

voltage recovery rate — įtampos atsikūrimo sparta statusas T sritis radioelektronika atitikmenys: angl. voltage recovery rate vok. Wiederkehrgeschwindigkeit der Spannnng, f rus. скорость восстановления напряжения, f pranc. vitesse de rétablissement de la tension, f … Radioelektronikos terminų žodynas

product recovery rate — the ratio expressed as a percentage of the weight of processed product divided by the round weight of fish used to produce that amount of product … Dictionary of ichthyology

Cash Recovery Rate — ⇡ Unternehmungsbewertung, ⇡ wertorientierte Unternehmensführung … Lexikon der Economics

Recovery Swap — Recovery Swaps, Recovery Locks or Recovery Default Swaps (RDS) are derivative contracts related to credit default swaps, and reference a bond issuance as its underlying. They are designed to provide a hedge against the uncertainty of recovery in… … Wikipedia

Recovery boiler — is the part of Kraft process of pulping where chemicals for white liquor are recovered and reformed from black liquor. In the process lignin of the wood, bound in black liquor at this phase, is burned and heat generated. The heat is usually used… … Wikipedia

Источник

Как оценить кредитный риск частной компании?

Как определить вероятность дефолта контрагента, если он представляет собой частную компанию? Что такое модель Альтмана и как ее применить к оценке кредитного риска? Какие существуют еще способы оценки кредитного риска?

Recovery rate что это. ocenka kreditnogo riska. Recovery rate что это фото. Recovery rate что это-ocenka kreditnogo riska. картинка Recovery rate что это. картинка ocenka kreditnogo riskaПервое, на чем следует сосредоточиться риск-менеджеру – определить величину ожидаемых потерь по каждому виду активов, несущих кредитный риск. Для этого необходимо знать величину актива под риском (например, дебиторская задолженность или ДЗ), вероятность дефолта контрагента%) и ожидаемый коэффициент потерь в случае его дефолта (или обратный показатель – доля возврата средств). Перемножив эти три показателя, можно найти размер ожидаемых потерь.

Таким образом, можно выделить три ключевых количественных параметра оценки кредитного риска:

Как определить вероятность дефолта контрагента?

Если компания публичная и у нее есть обращающиеся на рынке облигации, то можно применить рыночную модель сравнив стоимость долговых обязательств относительно безрисковой процентной ставки (тем самым рассчитав спрэд доходности облигаций). К тому же, все публичные компании как правило имеют международные или национальные кредитные рейтинги (постоянно обновляемые рейтинговыми агентствами, что облегчает работу риск-менеджера или специалиста по хеджирвоанию).

Однако чаще всего компаниям приходится работать с мелкими клиентами, которые могут предоставить лишь ограниченные данные финансовой отчетности, и не имеют официальных кредитных рейтингов или тем более, их долг не котируется на бирже.

В таком случае подойдет единственный универсальный метод оценки кредитного риска контрагента по его финансовым показателям (какие есть) и рисковым факторам – модель Альтмана для частных компаний, не размещающих свои акции на фондовом рынке (безусловно с некоторыми существенными ограничениями в виду небольшого объема данных).

Чтобы оценить вероятность банкротства по этой одели, необходимо рассчитать коэффициент Z и сравнить его с предложенной ученым шкалой:

Формула для расчета показателя Z следующая:

Z = 0.717*X1 + 0.847*X2 + 3.107*X3 + 0.420*X4 + 0.998*X5,

Х1 = Оборотный капитал/Активы (англ. Working Capital / Total Assets ),

Х2= Нераспределенная прибыль/Активы (англ. Retained Earnings / Total Assets ),

Х3 = Операционная прибыль/Активы (англ. EBIT / Total Assets ),

Х4 = Собственный капитал/ Обязательства (англ. Value of Equity/ Book value of Total Liabilities),

Х5 = Выручка/Активы (англ. Sales/Total Assets).

Однако применять эту модель к оценке кредитного риска российских компаний нужно осторожно, так как строилась она на основе данных американский компаний. Для большей уверенности можно добавить к формуле константу 3.25, которую Альтман рекомендовал прибавлять для развивающихся рынков.

Если не использовать именно эту модель, можно прибегнуть к оценке некоторых стандартных показателей оценки финансового положения компаний и затем ранжировать результаты по методу экспертной оценке с выставлением баллов:

Эти ключевые финансовые показатели применяются как для составления внешних рейтингов, устанавливаемых независимыми рейтинговыми агентствами (такими как, Standard&Poors, Moody’s или Fitch), так и для формирования внутренних кредитных рейтингов компаний (ВКР) и внутреннего кредитного скоринга контрагентов.

Риск-менеджеры или специалисты по хеджированию, работающие в компаниях, должны сосредоточиться, прежде всего, на установлении внутренних кредитных рейтингов и выработке внутренних методик оценки кредитного риска как по контрагентам компании, так и по кредитным инструментам.

Источник

Зачем нужны продакт-менеджеры в финтехе

Все знают, что продакт менеджеры делают в е-коммерс: оптимизируют воронку и придумывают «как сделать сайт таким же удобным для покупок, как домашние тапочки для похода на кухню ночью». Но сегодня почти любая уважающая себя компания, которая так или иначе присутствует в диджитале, начинает внедрять продуктовый подход с свою работу: телеком, банки, страховые… даже фастфуд.

Под катом Александр Окулов из компании ID Finance рассказывает о том, какие вопросы стоят перед продактами в финтехе, цифровом с рождения, но много взявшем от своих родителей, традиционных банков и финансов. В финтехе, как правило, бизнес строится вокруг продукта и везде сплошной agile, а про «водопад» слышали лишь те кому за 30 и кто успел поработать в компаниях-динозаврах.

Recovery rate что это. fujlrtfxw28g6 yrhwvtdeyntyk. Recovery rate что это фото. Recovery rate что это-fujlrtfxw28g6 yrhwvtdeyntyk. картинка Recovery rate что это. картинка fujlrtfxw28g6 yrhwvtdeyntyk

Пара слов о трех черепахах

Продукт в финтехе это лишь одна из этих черепах, которая как и в е-коммерс несет на себе воронку. Еще две черепахи — это маркетинг и риски. Маркетинг приводит трафик в воронку, а риски ставят фильтры в его горлышке. Если будет хромать одна из трех черепах, бизнес может накрениться и дефолтнуть.

Это ключевое отличие от диджитал компаний, где часто есть только продукт и маркетинг продукта. Почти половина вопросов, которые приходится решать той или иной черепахе — находятся на стыке ответственности двух других и поэтому их приходится решать совместно в команде, много обсуждать и много тестировать.

Отсюда очень важная особенность продуктовых вопросов в финтехе: нужно понимать сленг коллег, в первую очередь из рисков, зависимости между смежными KPI и как изменения одного приводят к изменениям в другом.

Recovery rate что это. . Recovery rate что это фото. Recovery rate что это-. картинка Recovery rate что это. картинка

Давайте начнем со слэнга, а потом посмотрим несколько кейсов, когда продактам нужно взаимодействовать с прагматичными риск-математиками и мечтательными маркетологами.

Сленг кредитных рисковиков

AR — approval rate. Соотношение одобренных кредитов к поданным заявкам.
IR — issue rate. Соотношение выданных кредитов к поданным заявкам (бывает так, что компания одобрила заем, но он не был выдан: банк отклонил транзакцию или сам заемщик передумал).
RR — recovery rate. Соотношение входящего денежного потока к исходящему.
NPL — non performing loan. Соотношение количества “не платящих” клиентов к тем, кто оплачивает вовремя. Иными словами просрочка.
NPL2, NPL15, NPL30, NPL90 — non performing loan after 2,15,30,90 days. Соотношение NPL взятое через 2,15,30,90 дней после даты планового поступления.
FPD, SPD, TDP — first (second, third) payment default. Термин актуальный для кредитов с аннуитетными платежами, это соотношение количества “не платящих” первый (второй, третий) платеж к тем, кто оплачивает этот платеж вовремя.

Как вы уже, наверное, догадались, все эти показатели выражаются в процентах и многие из них актуальны для всей банковской индустрии, правда называться они могут по-разному. Например даже у нас в компании у финансистов есть своя странная терминология, которую они используют. Ну и смотреть эти показатели нужно в разрезе винтажей. Что? Да, я тоже раньше называл их “купажами” и не мог понять зачем финансисты извратили всем известную терминологию когортного анализа. Если коротко, то в финансах винтаж

когорта, только когорта клиентов, а не кредитов. Чтобы расставить все точки над рисками, надо сказать что самым важными показателями являются RR, NPL и AR.

Немного про recovery

Продуктовый мир живет в парадигме юнит экономики и LTV (life time value, жизненный цикл клиента) и мало кто слышал про recovery, но на самом деле они очень похожи. И тот и другой про то, сколько ты зарабатываешь с определенной группы. Но вот в чем отличия:

Представьте себе кредитный продукт длительностью в 12 месяцев. В течении года вы каждый день выдаете эти 12-месячные кредиты. Как понять сколько вы заработали по результатам года, ведь многие могут не вернуть кредит, многие могут закрыть кредит раньше срока и т.д.? Для этого нужно ждать пока пользователь заплатит по этим кредитам до 3-4 платежа (“дать вызреть”) и затем на основе статистики каждого винтажа вы сможете спрогнозировать recovery вашего портфеля. Посчитать выручку дальше уже несложно.

Зачем продакту нужен этот показатель? Очень часто, когда вы тестируете бизнесовые изменения, а не UI/UX (юзабилити) который проще померить в конверсии, то основным “мерилом” эффекта будет именно recovery, показатель отражающий удельное повышение вашего заработка.

NPL — это второй по важности показатель. Он применим к винтажам и к портфелю целиком. Это показатель характеризует пользовательский трафик, который проник в вашу воронку и приносит вам деньги. И чем он ближе к 0% — тем лучше, 0% означает что все клиенты платят по кредитам. Так, конечно же, не бывает в реальной жизни. Всегда есть те пользователи, которые не платят за свою подписку в Netflix. Но Netflix может просто отключить им доступ к своему контенту. Мы же не можем забрать выданные деньги назад, поэтому для нас это потери, которые сильно влияют на экономику как продукта, так и всего бизнеса. И примерно каждый второй тест, который запускают продакты и маркетинг требует оценки изменения NPL.

AR/IR. Все мы знаем, как работают банки, они нас “скорят”, прогоняют собранные про нас данные через свои модели оценки рисков, ставят нам баллы и определяют “хороший” или “недостаточно хороший” клиент перед ними. Уровень одобрения это результат работы скоринга. Чем более продвинутые скоринг-модели у компании, тем больше клиентов она сможет получить на рынке, и тем больше будет отдача от инвестиций в привлечение клиентов.

Recovery rate что это. . Recovery rate что это фото. Recovery rate что это-. картинка Recovery rate что это. картинка

Надеюсь вы понимаете, что обозначенные риск-показатели это лишь верхушка айсберга.

Маркетинговые показатели

Они очень похожи на продуктовые, важно то, как отделы договаривается по зонам ответственности внутри компании. Как правило CR (конверсия) и retention — это совместные продуктово-маркетинговые показатели, а вот стоимость привлечения клиента уже чисто маркетинговый показатель.

Главная цель продактов

Как я уже говорил, одна из важнейших зон ответственности продактов в ID Finance — это воронка: процесс, когда пользователь становится нашим клиентом заходя на наш сайт. Воронки в разных сервисах могут быть технически устроены по разному, но цель продактов всегда одинакова: минимизировать издержки (funnel costs: APIs, comminications, processing, identification, OCR and other) и максимизировать количество пользователей, добравшихся до горлышка — CR (конверсию). Тут и решение вопросов дизайна и UI, UX (юзабилити), API интеграций (в наших воронках много интеграций со сторонними сервисами), возврат брошенных регистраций (они же abandoned basket в онлайн шоппинге), вопросы безопасности, моделирование кейсов и просчет экономики улучшений — все это в борьбе за драгоценные процентные пункты конверсии.

Однако, конвертнуть пользователя с сайта — это лишь начало. Пользователей, ставших обладателями ценного звания нового клиента, предстоит еще обернуть в повторных клиентов. Тут работает стандартный тандем маркетинга и продакт менеджеров — вместе мы придумываем как это сделать и следим за retention (у нас

90%). В ход идет весь арсенал директ-маркетинга и коммуникаций, разработка привлекательных продуктовых предложений (но с хорошей экономикой), бонусные программы, скидочные программы и т.п. И, конечно же, через пару лет после старта проекта повторные пользователи становятся основным источником прибыли и мы о них активно заботимся и думаем.

Экономика проекта

Экономика — это самая интересная и самая сложная часть в разработке продуктового функционала в финтехе. Тут мы следим за average check (средним чеком), и за LT/LTV. При тестировании и проработке продуктовых особенностей необходимо отследить весь ворох показателей. Именно это сложнее всего, потому что мы частично на поляне “рисков”, владельцев показателей (просрочки и recovery), которые на самом деле не любят рисковать.

Recovery rate что это. s6qdlifvf9ncnebqfkachc4lpj8. Recovery rate что это фото. Recovery rate что это-s6qdlifvf9ncnebqfkachc4lpj8. картинка Recovery rate что это. картинка s6qdlifvf9ncnebqfkachc4lpj8

Они будут стараться минимизировать доли трафика на тестовые ветки, придумывать множество причин почему нужно осторожничать. Нужно отдать им должное — они очень часто оказываются правы, математики все-таки. И компромисс — это то, что помогает найти золотую середину между рискованностью нашего MVP и минимизацией возможных потерь при фейле. Тесты в области экономики продукта довольно долгие, но если тест оказывается успешным, то может принести хорошие дивиденды продукту и бизнесу.

Бизнес у нас непростой и без продактов в финтехе никак. Нужно быть техническим спецом, чтобы общаться на одном языке с dev командой и поставить задачу на разработку, нужно отлично понимать бизнес, чтобы заниматься разработкой и тюнингом продуктов, и нужно быть менеджером, чтобы заставлять все вокруг двигаться в нужном темпе.

В следующей статье расскажу зубодробительные кейсы про то, как ваша классная продуктовая фича может взвинтить и RR и NPL одновременно, и про то как можно улучшать CR одновременно снижая, например, AR.

Источник

ML и DS оттенки кредитного риск-менеджмента | Компоненты

Recovery rate что это. erkvia7f8vjtro8pkyirt5djnmi. Recovery rate что это фото. Recovery rate что это-erkvia7f8vjtro8pkyirt5djnmi. картинка Recovery rate что это. картинка erkvia7f8vjtro8pkyirt5djnmi

В предыдущей статье цикла о моделировании в задачах управления кредитным риском (здесь) мы провели обзор трех задач кредитного риск-менеджмента, нашли возможные точки приложения ML и DS к этим задачам и попутно ввели набор терминов для дальнейшей работы.

Сейчас мы расскажем о трех компонентах (PD, LGD, EAD), которые участвуют при расчете ожидаемых потерь: рассмотрим основные драйверы и методологию построения моделей. В конце статьи приведем сводную таблицу с особенностями работы с компонентами на различных этапах разработки, сформированную на основе нашего проектного опыта.

За подробностями добро пожаловать под кат.

PD или как ковер задает стиль всей комнате

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

Определение дефолта

Начнем с главной компоненты, которую необходимо оценивать (например, в случае базового или продвинутого ПВР) PD (a. k. a. probability of default) – вероятность дефолта клиента. В качестве свидетельства о дефолте клиента могут выступать разные события в кредитной истории. Часто – это просрочка платежа по кредитному договору 90 и более дней.

Для подсчета количества дней просрочки существует два метода: LIFO (last in first out) и FIFO (first in first out) [1]:

Для определения дефолта необходимо задать следующие три атрибута:

Но этого недостаточно для формирования целевого события. У целевого события есть еще один важный атрибут: горизонт сбора информации о дефолте, или горизонт моделирования.

Определение длины горизонта

Информация о дефолте используется для оценки ожидаемых потерь, под которые банк осуществляет резервирование. В этом случае возникает вопрос, а на каком периоде смотреть выходы в дефолт? Важно ли это? С точки зрения бизнеса, важно понимать период планирования, с точки зрения моделей мы хотим выбрать такой период, в котором будет охвачено не менее 80%-90% всех возможных выходов в дефолт для всех открытых и не находящихся в дефолте договоров на текущий момент времени.

Для целей выбора длины горизонта может быть использован винтажный анализ [2]. Он заключается в построении графической аналитики и последующего вывода о данных по ней. График может быть построен так:

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

При построении графика выше для каждой когорты было рассчитано значение, составляющее 80% от максимального числа наблюдений, вышедших в дефолт, а диапазон полученных значений обозначен серой полосой. По графику можно сделать вывод о том, что оптимальная длина горизонта лежит в интервале 6-8 месяцев.

Сегментирование выборки

Некоторые атрибуты настолько сильно коррелируют с целевой переменной, что вклад остальных практически нивелируется. Это приводит к моделям с плохим ранжированием внутри группы с одинаковым значением «главного» атрибута. Во избежание такой ситуации используют подход сегментации, в рамках которого выборку делят на два или несколько сегментов — по одному на каждое значение «главного» атрибута (драйвера), и для каждого из них строят отдельную модель. В кредитном риске один из таких драйверов – наличие или длительность просрочки по платежу.

Если выборка была разделена на два сегмента по длительности просрочки: сегмент с малой просрочкой и сегмент с большой просрочкой, и второй сегмент достаточно мал, то для него можно сделать простую модель на двух атрибутах: на скоринговом балле модели с малой просрочкой и длительности текущей просрочки. Если результат удовлетворяет всем требованиям валидации, то на нем можно остановиться.

Альтернативно можно разделить выборки на сегменты с просрочками за историю (I) и без просрочек за историю (II).

Необходимое условие для сегментации – достаточное количество дефолтных наблюдений в каждом из сегментов. А для того, чтобы выяснить целесообразность и границы новых сегментов используется roll-rate анализ [3]. Он заключается в разделении выборки на подсегменты на основании значений величины текущей просрочки и сравнении между ними среднего уровня дефолта. Те группы, уровень дефолта которых значимо различается, имеет смысл моделировать по отдельности.

Рассмотрим, например, сегментацию наблюдений по величине просрочки. На картинке ниже в качестве примера выделены следующие 5 сегментов, соответствующих интервалам (бакетам) значений просрочки: 0-4 дня, 5-14 дней, 15-29 дней, 30-59 дней, 60-89 дней. Эти сегменты рассматриваются в нескольких моментах времени: HY1_2015, HY2_2015 — соответственно, первое и второе полугодия 2015 года, HY1_2016, HY2_2016 — соответственно, первое и второе полугодия 2016 года. В процессе анализа нас интересует динамика выхода наблюдений в просрочку более 89 дней, поэтому для каждого из этих сегментов подсчитан процент клиентов, просрочка которых на горизонте наблюдения составила более 89 дней.

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

По графику можно сделать следующие выводы:

EAD (Деньги в дефолте)

После того, как оценена вероятность дефолта заемщика, ставится вопрос – с какой суммой задолженности заемщик уйдет в дефолт? Эта сумма линейно влияет на размер ожидаемых потерь и, соответственно, объем резервов, и называется exposure at default – требования в дефолте. Итак, EAD – exposure at default – кредитные обязательства по договору на момент дефолта.

Напрямую, как правило, EAD не моделируют. Так как эта величина – денежная, её распределение не носит нормальный характер: в выборке могут присутствовать наблюдения очень большие и очень маленькие, не являющиеся при этом аномалиями. В зависимости от специфики портфеля можно выбрать разные целевые переменные – об этом подробнее будет сказано в последующих статьях цикла, но наиболее широко используемая – CCF – credit conversion factor – коэффициент кредитной конверсии – вычисляется следующим образом:

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

где:
Balance – сумма средств, которые клиент должен банку в момент наблюдения,
Limit – доступный клиенту лимит,
EAD – сумма средств, который клиент должен банку в момент дефолта.

Получается, что CCF – это та часть доступных на момент наблюдения средств, которая будет использована клиентом к моменту дефолта.

Как и вероятность дефолта, эту величину необходимо прогнозировать заранее. Обычно горизонт прогноза такой же, что и у PD.

Все описанное выше касалось денег до дефолта и во время него. А что происходит сразу после? Об этом компонента LGD.

LGD («Где деньги, Лебовски?»)

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

Даже в случае дефолта заемщика, часть средств возвращается в банк:

Поскольку временной интервал, на котором происходит т.н. «восстановление» (возвращение долга), может варьироваться поклиентно, возникает необходимость определить длину горизонта восстановления, на котором будет рассчитываться целевая переменная. На длину горизонта влияет в первую очередь доступность достаточного временного периода в данных для моделирования. Обычно длина горизонта лежит в диапазоне 3-5 лет после дефолта.

В общем случае LGD рассчитывается формуле:

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

где:
Ri – денежный поток от клиента (выплаты, реализация залога и др.), полученный на горизонте восстановления после дефолта,
T – временной период от момента учета возмещения после момента дефолта (в годах).

При расчете денежного потока, который идет на восстановление, обычно используется дисконтирование – механизм учета текущей стоимости денежных средств, полученных на горизонте восстановления. Особенно это актуально на больших горизонтах, когда стоимость денег может существенно изменяться.

Суммы возмещения, затрат и продажи долга при дисконтировании умножаются на «фактор дисконтирования» [4] P(T):

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

T – временной период от момента учета возмещения после момента дефолта (в годах),
r – ставка дисконтирования.

В качестве r может быть использована, например, процентная ставка по договору.

С компонентами, в первом приближении, понятно: все разные, а моделировать их нужно вместе! Есть ли какой-то подход, который позволит более-менее единообразно отобрать переменные для моделей и выбрать наиболее оптимальную комбинацию? Можно попробовать. О возможном варианте далее.

«Великолепный план, Уолтер … надёжный как … швейцарские часы» или pipeline разработки

Recovery rate что это. . Recovery rate что это фото. Recovery rate что это-. картинка Recovery rate что это. картинка

Этапы моделирования компонент риска схематично изображены на следующей диаграмме (стрелки – дополнительные итерации, возникающие в процессе разработки):

Recovery rate что это. . Recovery rate что это фото. Recovery rate что это-. картинка Recovery rate что это. картинка

Подготовка данных

Подготовка данных включает в себя формирование трёх сущностей: наблюдения (сегмент), витрина дефолтов, витрина атрибутов,- с единым внешним ключом — ID заемщика или договора и временная метка.

Такая декомпозиция обеспечивает гибкий подход к формированию выборки – легко изменять горизонт, гранулярность наблюдений, определение дефолта и не беспокоиться о корректности сбора атрибутов для итоговой витрины.

Каждое наблюдение – ID заемщика или договора и временная метка; другими словами, нас интересует состояние заемщика или договора на конкретную дату. Обычно используются наблюдения, соответствующие временным срезам, отстоящим друг от друга на равные промежутки времени (например, квартальным).

В случае задачи резервирования объем данных должен включать в себя полный экономический цикл, что составляет примерно 5-7 лет.

Для формирования выборки необходимо учитывать горизонт.

Recovery rate что это. . Recovery rate что это фото. Recovery rate что это-. картинка Recovery rate что это. картинка

В выборки для разработки и тестирования включаются наблюдения, для которых есть данные о выходе в дефолт на всем горизонте, поскольку включение наблюдений, для которых не прошел полный этап сбора (на картинке изображен красным цветом) приведёт к смещению величины уровня дефолта.

Из-за необходимости учитывать период сбора, оптимальная глубина данных составляет 2-3 горизонта наблюдения.

Также, если в модели планируется учесть какого-то рода сезонность — необходимо соответствующим образом выбирать глубину данных и периодичность срезов.

В таблице под катом перечислены основные группы и примеры атрибутов широкого списка переменных.

Блок атрибутовЮЛ/ФЛОписаниеПримеры
ПрофильЮЛДанные, характеризующие компаниюОКОПФ, ОКВЭД (отрасль), возраст компании, число руководителей.
Количество полных лет/месяцев обслуживания в банке.
ФЛАнкета клиента, социодемографические данныеСемейное положение, пол, возраст, образование
Количество полных лет/месяцев обслуживания в банке
Государственные контрактыЮЛСводные данные по количеству и сумме государственных контрактов компанииКоличество/сумма гос. контрактов за период. Динамика данных показателей.
ФЛ
Арбитражные делаЮЛСводные данные по количеству и сумме арбитражных дел, в которых компания принимала участие.Количество/сумма арбитражных дел компании в качестве ответчика/истца/третьего лица за период. Динамика данных показателей.
ФЛСводные данные по количеству и сумме арбитражных дел, в которых клиент принимал участие.Количество/сумма арбитражных дел клиента в качестве ответчика/истца/третьего лица за период. Динамика данных показателей.
Транзакционные агрегатыЮЛСводные данные по количеству транзакций и оборотам для клиентаКоличество/сумма операций списания/начислений за период. Оборот компании за период. Динамика данных показателей.
ФЛСводные данные по количеству транзакций и оборотам для клиентаКоличество/сумма операций списания/начислений за период. Оборот собственных средств клиента за период. Динамика данных показателей.
Финансовые показателиЮЛДанные по финансовым показателям компанииВыручка, активы, общие обязательства EBITDA, OIBDA, Equity, оборачиваемость внеоборотных активов, оборачиваемость кредиторской задолженности и др. фин. показатели за период. Динамика данных показателей.
ФЛДанные по финансовым показателям клиентаPayment to income (PTI), debt to income (DTI)
КонтрагентыЮЛВзаимодействие с контрагентами, фигурантами списка клиентов с сомнительной репутациейФлаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных контрагентов за период
ФЛВзаимодействие с другими ФЛ, входящими в список клиентов с сомнительной репутациейФлаг наличия транзакций с фигурантами списка клиентов с сомнительной репутацией за период, число уникальных взаимодействий за период
Внешние данныеЮЛБКИАгрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки.
ФЛБКИАгрегированные показатели времени жизни договоров. Количество открытых договоров за период. Динамика открытия договоров. Агрегаты количества просрочек по контрактам за период в разрезе категорий просрочки.
Негативная историяЮЛПопадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследованийКоличество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией
ФЛПопадание в список клиентов с сомнительной репутацией, срабатывание алгоритмов отслеживания мошеннических операций, результаты расследованийКоличество срабатываний алгоритмов отслеживания мошеннических операций за период, флаг попадания в список клиентов с сомнительной репутацией
ГруппаЮЛДанные по компаниям, связанных с даннойВхождение в группу компаний с задолженностью/наличием арбитражных дел/присутствие компаний с высокорискованными ОКВЭДами
ФЛДанные по клиентам, связанных с даннымВхождение в группу клиентов с негативной информацией – просрочка, фрод.
Другие продуктыЮЛДанные по другим используемым продуктам банкаФлаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей.
ФЛДанные по другим используемым продуктам банкаФлаг использования других продуктов, количество продуктов, оборот по продуктам. Динамика показателей.

Один из способов увеличения интерпретируемости и стабильности модели – это использование в качестве атрибутов не абсолютных значений признаков, а относительных: нормированных, например, на доход (выручку) или отражающих тренд/динамику показателя на временном интервале.

Однофакторный анализ

Целью проведения однофакторного анализа является уточнение широкого списка факторов таким образом, чтобы исключить неподходящие переменные.

Для проведения однофакторного анализа необходимо разбить выборку на выборки для разработки (train) и тестирования (test). Выборка для тестирования может быть сформирована одним из следующих способов:

Стоит отметить, что в идеальном мире (где достаточное число клиентов и дефолтов) корректнее разбивать исходную выборку на три части (разработка, валидация и тестирование). В рамках такого разбиения проведение однофакторного анализа ведется на выборках для разработки и валидации, а итоговое качество отбора оценивается на выборке для тестирования. Для упрощения мы здесь и далее рассматриваем разбиение на train/test.

Многофакторный анализ и финальная модель

Цель многофакторного анализа – построение оптимальной комбинации факторов из списка, образованного на предыдущем шаге, для максимизации предсказательной силы модели при сохранении стабильности.

Процесс многофакторного анализа заключается в построении множества моделей и выборе наилучшей из них. Модели строятся на различных наборах атрибутов из списка, сформированного на этапе однофакторного анализа,

Две самые распространенные модели для прогноза вероятности дефолта – это:

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

где:
DistrGood – отношение числа недефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу недефолтных наблюдений;
DistrBad – отношение числа дефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу дефолтных наблюдений.

Общие правила для выполнения категоризации атрибутов складываются из экспертных правил (принципы заполнения пропусков, условие монотонности WOE, соответствие логике атрибута) и статистических критериев (достаточность наблюдений в категории).

Одним из недостатков подхода с использованием значений WOE вместо реальных значений атрибута являются потенциально возможные скачки значений вероятности дефолта (PD). Для решения указанной проблемы может использоваться сглаживание порогов функции WOE с целью создания непрерывных «плавных» переходов между соседними значениями WOE. Чаще всего сглаживание может производиться с помощью сигмоиды или гиперболического тангенса.

После описанных выше преобразований над атрибутами модель логистической регрессии строится над преобразованными атрибутами. Для выбора оптимальной комбинации факторов может быть использовано несколько подходов: [6]:

При построении модели в качестве оптимизируемой метрики могут быть использованы информационные критерии (например, SBC [8], AIC [9]). Разбиение атрибутов на группы и расчет значений WOE производится на выборке для разработки, а затем сформированный биннинг и соответствующие ему значения WOE транслируются в выборку для тестирования.

В случае, когда нет требования интерпретируемости, может быть использована модель градиентного бустинга, наиболее часто используется реализация библиотеки Xgboost. В данном случае отсутствует требование к слабой корреляции атрибутов модели. В случае необходимости ограничить набор признаков модели, используется значимость атрибута – его вклад в итоговое качество, оцениваемое коэффициентом Джини, дает не менее 1% или уменьшает функцию потерь на величину, превышающую пороговое значение.

Итоговое качество модели определяется на тестовой выборке. Выборка для тестирования может формироваться тем же способом, что и при проведении однофакторного анализа.

Сводная таблица по компонентам

PDLGDEAD
Целевое событиеВероятность дефолта (например, просрочка 90+) на горизонте заданной длиныЧасть долга, не возвращенная за период восстановления после дефолтаРазмер долга, который клиент будет должен на момент дефолта
Тип задачиБинарная классификацияРегрессияРегрессия
ГоризонтСрок, в течение которого клиент может попасть в дефолт (например, 1 год)Период восстановления после дефолта (3-5 лет)Срок, в течение которого клиент может попасть в дефолт (например, 1 год)
Глубина
данных (оптимальная/минимальная)
Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолтЭкономический цикл (5-7 лет) / 2-3 горизонта восстановления + 1 горизонт выхода в дефолт (для недефолтных договоров)Экономический цикл (5-7 лет)/2-3 горизонта выхода в дефолт
АлгоритмыИнтерпретируемые – логистическая регрессия, решающие деревья. Неинтерпретируемые – XGBoost, MLPGLM, логистическая регрессия, деревья решений, цепочно-лестничные методыGLM, логистическая регрессия
Основные драйверыВремя жизни договора, флаг наличия просрочек на некотором периоде, длительность текущей просрочки, оборот собственных средств, утилизация, обеспечение залогами, payment to income (PTI), debt to income (DTI), размер компании (для ЮЛ), отрасль (для ЮЛ)Количество дней в просрочке, возраст дефолта, наличие других кредитных договоров у данного клиента и его платежное поведение по
ним, обеспечение, размер компании
Количество дней в просрочке, размер утилизации на некотором периоде, время жизни договора, размер компании
Корректировка в рамках жизненного цикла моделиКалибровкаКалибровка/Downturn factorКалибровка/Downturn factor
Особенные требования к даннымИстория дефолтов, определение группы связанных лиц, список банкротствТребуются факты реализации залогов (чаще для ЮЛ), факты продажи и списания кредитовОпределение сегмента для моделирования («лимитных» продуктов), работа с траншами и корректное определение графика платежа по «лимитным» продуктам
Архитектура моделиОднокомпонентная – моделируется непосредственно PD в разрезе бизнес или аналитических сегментовОднокомпонентная [Recovery Rate(RR)/LGD], или двухкомпонентная –(вероятность выздоровления, уровень восстановления (RR)) для двух сегментов (договора в дефолте и не в дефолте)Однокомпонентная, но через вспомогательную переменную (например, CCF), двухкомпонентная – две вспомогательные компоненты
Основная метрика для количественной первичной валидацииДжини, биномиальный тест, тест Херфиндаля (распределение по рейтинговой шкале)Джини модифицированный, Loss-shortfall, зависимость поведения от возраста дефолта/длительности просрочкиДжини модифицированный

Выводы

Итак, в статье мы провели детализацию особенностей моделирования компонент ожидаемых потерь: PD, LGD и EAD.

Главный вывод можно сформулировать следующим образом: прежде чем мы дойдем до import xgboost as xgb ML необходимо существенную часть времени потратить на аналитику и учитывать особенности бизнес-процессов при разработке и тестировании модели. Формулу для DS, применительно к нашим компонентам, можно записать в следующем виде:

Recovery rate что это. image loader. Recovery rate что это фото. Recovery rate что это-image loader. картинка Recovery rate что это. картинка image loader

Однако здесь стоит иметь ввиду два момента. Во-первых, для сегмента физических лиц характерна большая доля ML и автоматизации решений, по сравнению с сегментом юридических лиц. Во-вторых, доля ML вырастает за счет привлечения продвинутых алгоритмов для анализа, например текстовых и геоданных, а также для поиска сложных паттернов поведения клиентов по разнородным источникам.

Авторы статьи: Александр Бородин (abv_gbc), Алиса Пугачёва (alisaalisa),
Артём Савинов (artysav), Илья Могильников (eienkotowaru).

Список использованных терминов и сокращений

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *