Финансовое моделирование как инструмент управления банковскими рисками

Автор работы: Пользователь скрыл имя, 28 Мая 2013 в 17:20, дипломная работа

Краткое описание

Целью разработки настоящей работы является выявление преимуществ и недостатков финансового моделирования и разработка предложений по созданию единых подходов к финансовому моделированию управления рисками банка.
Основные задачи, решаемые в рамках поставленной цели:
1) Рассмотрение подходов и принципов построения финансовых моделей.
2) Обзор современных методов моделирования банковских рисков.

Содержание

Введение
Глава 1. Теоретические основы финансового моделирования в целях управления банковскими рисками.
1.1. Понятие финансового моделирования. Цели, задачи принципы построения моделей.
1.2. Общие подходы при построении моделей. Виды финансовых моделей.
1.3. Системный подход в управлении рисками как основа финансового моделирования.
Глава 2. Практика разработки финансовых моделей для управления рисками коммерческого банка
2.1. Моделирование рыночного риска.
2.2. Моделирование операционного риска.
2.3. Моделирование риска ликвидности.
2.4. Моделирование кредитного риска.
2.5. Интегрированная модель управления рисками на примере коммерческого банка «АКБ»
Глава 3. Проблемы и перспективы финансового моделирования в коммерческом банке.
3.1. Преимущества и недостатки финансового моделирования. Проблемы использования моделей при управлении рисками банка.
3.2. Перспективы развития финансового моделирования в банковской деятельности.
Заключение
Список литературы
Приложения

Прикрепленные файлы: 1 файл

Дипломная_работа по рискам ВШЭ.doc

— 3.28 Мб (Скачать документ)

Классификация выборки производится только на клиентах, которым дали кредит. Неизвестно, как бы повели себя клиенты, которым в кредите было отказано. Возможно, что какая-то часть оказалась бы приемлемыми заемщиками. Банкам следует фиксировать причины отказа и сохранять информацию. Это позволяет им восстанавливать первоначальную популяцию клиентов, обращавшихся за кредитом. С течением времени меняются и социально-экономические условия, влияющие на поведение людей. Поэтому скоринговые модели необходимо разрабатывать на выборке из последних клиентов, периодически проверять качество работы системы и, когда качество ухудшается, разрабатывать новую модель.

Метод деревьев решений отличается высокой скоростью  обработки данных и обучения при  сохранении свойств систем нечеткого  логического вывода. В отличие от метода логистической регрессии в методе деревьев классификации сегментация прецедентов задается не с помощью n-мерной сетки, а путем последовательного дробления факторного пространства на вложенные прямоугольные области (рис. 20).


 

 

 

 

Рис. 20

При этом соблюдается  следующая последовательность шагов (рис. 21).


 

 

 

 

Рис. 21. Шаги дерева решений

Удобным для  анализа свойством деревьев решений  является представление данных в  виде иерархической структуры. Компактное дерево проявляет картину влияния  различных факторов, независимых  переменных.

Каждое множество X на любом этапе разбиения характеризуется следующими показателями:

  1. множество X содержит несколько объектов, относящихся к одному классу Ck. В этом случае множество X является листом, определяющим класс Ck;
  2. множество X не содержит ни одного объекта (X =0). В данной ситуации необходимо возвратиться к предыдущему этапу разбиения;
  3. множество X содержит объекты, относящиеся к разным классам. Такое множество является пригодным для разбиения на некоторые подмножества. Для этого выбирается одна из переменных и в соответствии с правилами x < w, x > w множество X разбивается на два подмножества. Этот процесс рекурсивно продолжается до тех пор, пока конечное множество не будет состоять из примеров, относящихся к одному и тому же классу. Построение дерева решений происходит сверху вниз. Сначала создается корень дерева, затем потомки корня и т.д.

На первом шаге разделение выборки прецедентов  на сегменты производится по самому значимому  фактору. На втором и последующих  шагах в отношении каждого  из полученных ранее сегментов процедура повторяется до тех пор, пока никакой вариант последующего дробления не приводит к существенному различию между соотношением положительных и отрицательных прецедентов в новых сегментах. Количество ветвлений (сегментов) на каждом шаге процедуры построения дерева решений выбирается автоматически.

Описание  компьютерного моделирования.

Постановка  задачи. В коммерческом банке имеется  продукт «Нецелевой потребительский  кредит»: кредиты предоставляются  на любые цели с принятием (решения  в течение нескольких часов. За это время проверяются минимальные введения о клиенте, в основном такие, как отсутствие криминального прошлого •и кредитная история в других банках.

 В банке  накоплена статистическая информация  о заемщиках и качестве обслуживания ими долга за несколько месяцев. Руководство банка поставило перед отделом розничных рисков задачу разработать скоринговые модели с различными стратегиями кредитования, которые позволили бы управлять рисками, настраивая уровень одобрений, и минимизировать число «безнадежных» заемщиков.

Исходные данные: текстовый файл с информацией о заемщиках - физических лицах (графики и даты погашений кредита, сведения о просрочках, об их суммах, о процентах, параметры заемщиков и информацию о наличии просрочек)

Скоринговая модель часто строится на категориальных переменных, и для  этого непрерывные признаки квантуются при помощи ручного выбора точек разрыва. Скажем, переменная Стаж работы разбивается на три категории: «до 1 года», «от 1 до 3 лет», «свыше 3 лет». Такую модель легче интерпретировать, но она менее гибкая при моделировании связей: горизонтальные «ступени» дают плохую аппроксимацию при наличии частых крутых «склонов».

К заемщику выдвигаются требования к минимальному уровню дохода и рассчитывается возможный лимит кредита. При его расчете участвует один из двух коэффициентов - П/Д либо О/Д.

Коэффициент «Платеж/Доход» (П/Д) - отношение ежемесячных платежей по кредиту заемщика к его доходу за тот же период. Считается, что значительная величина этого коэффициента (свыше 40 %) свидетельствует о повышенном риске как для кредитора, так и для заемщика.

Коэффициент «Обязательства/Доход» (О/Д) - отношение ежемесячных обязательств заемщика к его доходу за тот же период с учетом удержаний налогов. В обязательства включаются расходы, связанные с выплатой планируемого кредита, а также имеющиеся другие долгосрочные обязательства (выплаты по иным кредитам, на содержание иждивенцев, семьи, алиментов, обязательные налоговые платежи и пр.). Считается, что размер ежемесячных обязательств заемщика не должен превышать 50-60 % его совокупного чистого дохода.

Заявки клиентов, не прошедшие андеррайтинг, получат  отказ и даже не попадут на скоринг. Поэтому на вход скоринговой процедуры  выгоднее подавать не доход клиента, а отношение П/Д или О/Д.

В нашей задаче представлено 2709 кредитов (файл loans.txt) с известными исходами платежей на протяжении нескольких месяцев после выдачи кредита. Набор данных уже разбит на два множества - обучающее (80 %) и тестовое (20 %) - так, чтобы в каждом множестве доля плохих кредитов была примерно одинаковой. В приложении 2 отображены структура и описание полей текстового файла с кредитными историями.

Начнем решение задачи по алгоритму дерева классификации в аналитической платформе Deductor. Импортируем файл с кредитными историями в данную платформу. Скоринг представляет собой задачу бинарной классификации, которая относит заемщика к одному из двух класссов - «плохой» или «хороший». Если заемщик «хороший» - кредит выдается, «плохой» - выносится отрицательное решение. Разделение заемщиков на плохих» и «хороших» осуществляется на основе качества обслуживания ими долга. Примем следующее правило: если у клиента была хотя бы одна просрочка свыше 60 дней, то он относится к классу неблагонадежных. Запустим Мастер обработки, в категории Прочие выберите Калькулятор, запишите это условие, в результате чего появится новое вычисляемое поле - Класс заемщика (рис. 22).

Рис. 22. Создание нового поля Клаcc заемщика.

Далее с помощью визуализатора Статистика можно узнать, что имеется 500 записей с «плохими» кредитами, что составляет 18,5 % всех выданных кредитов. Это не так уж и мало: в практике кредитного скоринга число записей миноритарною сса может быть и меньше, вплоть до 1-3 %.

Таким образом, выходная бинарная переменная - Класс заемщика - у нас уже имеется. В качестве входных имеет смысл оставить все, кроме Код и Дата: очевидно, что они никак не влияют па кредитоспособность. Поля Возраст и О/Д, % оставим непрерывными.

Установим входные и выходные пременные. Нажмем кнопку Настройка нормализации. Для выходного поля Класс заемщика порядок сортировки уникальных значений (которых в логистической регрессии всегда два) определяется типом события: первое - отрицательное, второе - положительное (рис. 23). В скоринге принято, что чем выше рейтинг заемщика, тем выше кредитоспособность, поэтому значение «хороший» будет положительным исходом события (второе по счету), а «плохой» - отрицательным (первое по счету).

 

Рис. 23. Задание типов событий выходного поля

В следующем  окне мастера настроим обучающие и тестовые множества. Поскольку у нас есть специальное поле, в котором хранится информация о разбиении на множества, укажем его, установив соответствующие настройки (рис. 24).

 

Рис. 24. Настройка разбиения набора данных

Далее будет предложено настроить обучающие и тестовые множества. Поскольку у нас есть специальное поле, в котором хранится информация о разбиении на множества, укажем его, установив соответствующие настройки (рис. 24). Откроем Мастер обработки и выберем сценарий Дерево решений.

 

Рис 25 Окно выбора нового узла обработки

Откроется окно выбора параметров алгоритма. Здесь не менем настроек, принятых по умолчанию, за исключением минимального количества примеров в узле, при котором будет создаваться новый. Зададим этот параметр равным примерно 1 % от объема обучающего множества; меньшее значение может привести к появлению недостоверных правил, большее - к почти полному отсутствию таковых.

В качестве желаемого способа построения дерева оставим режим автоматического построения. Запустив его нажатием кнопки Пуск, пройдем по шагам мастера дальше и выберем нужные визуализаторы.

В результате работы алгоритма было выявлено 18 правил; точность классификации на обучающем множестве  составила 85 %, на тестовом - 87 %. Визуализатор Дерево решений позволяет увидеть полученный набор правил в схематическом виде, а также выводит показатели достоверности и поддержки для каждого узла(рис. 26). Это и есть скоринговая модель.

В принципе, достоверность  каждого правила можно воспринимать как итоговый скоринговый балл с той оговоркой, что для плохих заемщиков он равен величине, полученной вычитанием из 100%-ного значения достоверности. Теперь откроем таблицы сопряженности этого дерева решений

Рис.26. Выбор визуализаторов узла.

 

Рис. 27. Скоринговая модель – дерево решений.

В результате доля дефолтных кредитов на тестовом множестве  равна

BR = 51 /475 • 100 % = 10,7 %,                        (3)

что в 3 раза выше этого же показателя в лофегресионной модели (правда, уровень одобрений  вырастает до 87,6 %). Что делать, если такая ситуация не устраивает?

Нам помогут  специальные стратегии сэмплинга для уравновешивания обучающего множества: выборка с дублированием миноритарного класса (oversampling) и выборка с удалением примеров мажоритарного класса (undersampling). Поскольку примеров не так много (400 - с плохими клиентами и 1767 - с хорошими) и информация о каждом заемщике представляет ценность, имеет смысл использовать первый вариант - с дублированием. Пусть отношение издержек ошибочной классификации останется прежним: 1:4. Тогда, согласно правилу, к обучающей выборке нужно добавить 3 • 400 = 1200 примеров, и общее число записей составит 3367, а доля плохих увеличится до 47 %.

Процедуру дублирования записей, принадлежащих к миноритарному  классу, нужно осуществлять только на обучающем множестве.

Для этой операции снова привлечем несколько узлов  из группы Трансформация данных: Фильтр и Слияние данных (рис. 28, выделенный блок).

Рис. 28. Сценарий построения скоринговой модели.

Построив дерево решений на сбалансированной выборке, убедимся, что ситуация улучшилась: теперь на тестовом множестве модель чаще отказывает в выдаче хорошим заемщикам, нежели одобряет плохих.

Интерактивное дерево решений. До этого мы получали дерево, которое строилось автоматическим способом, то есть алгоритм на каждом шаге выбирал атрибут для разбиения по заданному критерию. Кредитный скоринг представляет собой тот самый случай, когда банковские аналитики имеют определенные знания и хотят, чтобы в модели ветвление по атрибутам осуществлялось в определенном порядке. Например, если имеются атрибуты Наличие квартиры и Стоимость квартиры, то разумно сразу после первого рассмотреть второй. Еще пример: после суммы кредита сразу желательно проанализировать Первоначальный взнос.

В аналитической платформе Deductor имеется возможность построения интерактивных деревьев решений. Зададимся целью построить скоринговую модель на прежней выборке, приняв во внимание следующие пожелания экспертов. Первым атрибутом, по которому анализируют заемщика, должен быть атрибут Кредитная история. Далее необходимо рассмотреть коэффициент О/Д. Всех клиентов нужно разбить на три категории: заемщики с низким О/Д (до 20 %), с умеренным (от 20 до 40 %) и высоким (от 40 %).

Добавим в сценарий новый узел дерева решений и на пятом шаге мастера поставим переключатель в позицию Интерактивный режим

В результате открывшийся  визуализатор Дерево решении не будет содержать ни одного узла. На панели инструментов нажмем кнопку Разбить текущий узел на подузлы, откроется соответствующее окно (рис. 29).

 

Рис. 29. Окно выбора атрибута.

Слева в списке выводятся все атрибуты вместе с  рассчитанными значениями прироста информации Gain Ratio, а справа - диаграммы распределения классов по подузлам. По умолчанию предлагается атрибут с максимальным значением Gain Ratio, но его можно переопределить. В данном случае ничего делать не нужно, поскольку разбиение и так начнется по атрибуту Кредитная история. Нажатие кнопки Ок приведет к тому, что в дерево добавится три узла этого атрибута со значениями нет данных, отрицательная, положительная. Продолжим разбиение дальше, выбрав узел Кредитная история = нет данных (рис. 30).

Информация о работе Финансовое моделирование как инструмент управления банковскими рисками