green_fr (green_fr) wrote,
green_fr
green_fr

Categories:

Диплом

Доделал, наконец-то, завтра с утра сдача. Спросил у шефа, насколько распространяется конфиденциальность на пересказ своими словами друзьям — он разрешил.

Две части. В первой я рассматриваю случайную переменную — рейтинг облигации. Не знаю, как называются такие переменные по-русски, по-английски они, вроде бы, называются categorical variables, при этом все ставят сноску и пишут долгое «осторожно, не путать с...» — и длинный список. На французский я перевёл variable catégorielle, человеческим языком — переменная, принимающая значения из определённого, потенциально неупорядоченного списка, и уж точно без определённой дистанции между значениями (это к слову «не путать с дискретной переменной»). Вот, к слову, пример — рейтинг облигации.

Рейтинговые агентства публикуют вероятности перехода из одного рейтинга в другой. Из этой информации можно вывести вероятность того, что облигация разорится к моменту выплаты того или иного купона, а оттуда совсем недалеко до оценки её сегодняшней стоимости. Более того, запустив генератор разных сценариев, мы можем легко получить распределение стоимости облигации через год, откуда высчитать некую меру риска — стоимость, ниже которой цена облигации не упадёт с вероятностью не менее 99% например.

Это всё классика (к слову, я был удивлён, что такие модели появились только в середине 1990-х, до тех пор люди реально с потолка брали «экспертные оценки»), проблемы начинаются, когда мы захотим посмотреть распределение не у одной облигации, а у портфеля. Если облигации независимы — всё очень просто. Но ведь они не независимы. Это даже на пальцах понятно — когда дорожает сталь, разоряются автомобилестроители, они друг с другом могут быть и не завязаны, но корреляция идёт через общий риск. Или разорился крупный поставщик — есть вероятность, что его клиент не успеет перестроиться и разорится вслед за ним. К слову, есть и обратный эффект — разорился конкурент, фирма перебирает его клиентов. Но статистически этот эффект практически не видно, в отличие от первых двух.

В дипломе я предлагаю ввести простую систему корреляции между переменными рейтинга разных облигаций. Чтобы, с одной стороны, не считать корреляцию у каждой пары облигаций, а с другой стороны — не ограничиться единым, общим на всех коэффициентом, я ввожу следующее правило: для каждого класса рейтинга есть «внутриклассовая корреляция» со своим коэффициентом (общим для всех пар облигаций из этого класса). Все остальные пары коррелируют с другим, «межклассовым» коэффициентом. Теоретически это не так уж и глупо - изначальная модель базируется на постулате, что знания рейтинга нам достаточно для того, чтобы делать выводы. Но, конечно же, сильное упрощение реальности.

А после этого самое интересное — как оценивать заявленные коэффициенты корреляции? Межклассовый — никак, я просто спёр оценку из другого исследования (со ссылкой). А для внутриклассового предложил оценивать через (публикуемые рейтинговыми агентствами) среднеквадратичные отклонения вероятностей переходов из одного рейтинга в другой. Действительно, можно показать, что чем выше корреляция, тем больше разброс ежегодно наблюдаемых вероятностей. Дальше долгая свистопляска с подгоном коэффициентов — для каждого рейтинга у нас всего один коэффициент внутриклассовой корреляции, а подогнать надо много среднеквадратических отклонений, т.к. из этого рейтинга можно теоретически попасть в любой другой, значит у нас несколько вероятностей и несколько среднеквадратических отклонений. Есть люди, которые решают эту проблему, вводя несколько внутриклассовых корреляций, но они быстро уходят в дебри из-за того, что там переменные получаются зависимыми (сумма всех вероятностей равна 1). Мне понравилась идея подгонять не точно, а примерно, зато с более простой моделью.

Ну и вторая часть — я к ней имею достаточно побочное отношение: шеф придумал. я только реализовывал. Зато там много умных слов и формул — шеф умный :-)


Пока писал, порадовался междисциплинарной связью.

Понятное дело, прежде чем что-то делать, надо аккуратно проверить, не сделал ли кто-то в точности такое же до тебя. Как сейчас помню, как за пару дней до моего институтского диплома случайно зашедший послушать нас руководитель соседнего отдела спросил меня «а чем ваша разработка отличается от N?» И все оставшиеся мне пару дней я судорожно заполнял сравнительную таблицу меня и N, из которой ясно следовало, что я выше, дальше и сильнее. Проблема была в том, что N была разработка компании Microsoft...

Ну так вот, я долго везде искал свой ключевой момент (как внедрять корреляцию моим «категорическим» переменным). И единственная похожая публикация была не из финансов, а из биологии мозга — я с удовольствием процитировал их в дипломе :-)


И ещё красивый момент. Корреляцию между несколькими переменными можно вводить через разложение Холецкого (если переменные нормальные — я от них ради этого и отталкивался, прежде чем прийти к «категоричным»), но при этом возникает проблема наложения разных корреляций. Если у меня уже есть X и Y, которые каким-то образом коррелируют друг с другом, а потом я хочу сделать корреляцию между X и Z, плюс между Y и Z, не потревожив изначальную корреляцию между X и Y, то... Либо я заранее рассчитываю эффект и закладываю необходимую коррекцию в первоначальную корреляцию X и Y (а я попутно показываю, что это не всегда возможно, более того — ровно вот с нашими цифрами так сделать невозможно). Либо я делаю финт ушами — пишу значения X, Y и независимого от них Z в табличку, 3 колонки. А потом Z не трогаю, а строчки первых двух колонок переставляю в новом порядке так, чтобы появилась нужная мне корреляция. Поскольку значения X и Y я двигаю всё время вместе, их корреляция остаётся той же. И что самое смешное — это работает! Я сам с трудом понимаю, как, но я написал код, проверил — прекрасно работает.
Интересная, всё-таки, у меня работа :-)
Tags: rabota
Subscribe

  • Налоги

    Посмотрел передачу про налоги, там показывали примерно такой график: Я совершенно не осознавал, что низкий подоходный налог — это недавнее…

  • Кино

    Набралось ещё какое-то количество понравившихся за год фильмов и мультиков. Долин в каком-то из своих подкастов посоветовал Могилу светлячков —…

  • Colline d'Élancourt

    В местном журнале (бесплатная «муниципальная» пресса, нам приходит один журнал с новостями нашего города Guyancourt, и ещё один с новостями нашей…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 28 comments

  • Налоги

    Посмотрел передачу про налоги, там показывали примерно такой график: Я совершенно не осознавал, что низкий подоходный налог — это недавнее…

  • Кино

    Набралось ещё какое-то количество понравившихся за год фильмов и мультиков. Долин в каком-то из своих подкастов посоветовал Могилу светлячков —…

  • Colline d'Élancourt

    В местном журнале (бесплатная «муниципальная» пресса, нам приходит один журнал с новостями нашего города Guyancourt, и ещё один с новостями нашей…