fin-accounting

четверг, 8 августа 2019

CFA - Дискретные случайные величины и дискретное равномерное распределение вероятностей

Случайные величины постоянно используются в процессе принятия финансовых решений. Принятие таких решений требует понимания распределений вероятности. Рассмотрим основные распределения вероятности и концепции, связанные с ними, - в рамках изучения количественных методов по программе CFA.

Принимая инвестиционных решения, мы практически всегда мы работаем со случайными величины. Доходность акции и прибыль на акцию являются типичными примерами случайных величин.

Чтобы сделать вероятностные утверждения о случайной величине, нам нужно понять ее распределение вероятностей (англ. 'probability distribution'). Распределение вероятностей определяет вероятности возможных исходов случайной величины.

В этом чтении мы представляем важные факты о четырех распределениях вероятности и их использовании в финансовом анализе. Эти четыре распределения - равномерное, биномиальное, нормальное и логнормальное (т.е. логарифмически нормальное) - широко используются в инвестиционной практике.

Они используются в таких базовых моделях оценки, как модель ценообразования опционов Блэка-Шоулза-Мертона, модель ценообразования биномиальных опционов и модель ценообразования долгосрочных активов (CAPM). Обладая практическими знаниями о распределении вероятностей, представленными в этом чтении, вы также будете лучше подготовлены к изучению и использованию других количественных методов, таких как проверка статистических гипотез, регрессионный анализ и анализ временных рядов.

После обсуждения распределения вероятностей мы заканчиваем чтение описанием метода моделирования Монте-Карло, компьютерным инструментом моделирования для получения ответов на сложные вопросы.

Например, инвестиционный аналитик может захотеть поэкспериментировать с инвестиционной идеей, фактически не реализовав ее. Или ему или ей может понадобиться оценка сложного опциона, для которого не существует простой формулы ценообразования.

В этих и многих других случаях метод Монте-Карло является важным инструментом в арсенале аналитика. Для проведения моделирования по методу Монте-Карло аналитик должен определить факторы риска, связанные с проблемой, и указать распределения вероятностей для них.

Следовательно, моделирование методом Монте-Карло является инструментом, который требует понимания распределения вероятностей.

Прежде чем мы обсудим конкретные распределения вероятностей, мы определим основные понятия и термины. Затем мы проиллюстрируем действие этих понятий через простейшее распределение, - равномерное распределение. После этого мы рассмотрим другие распределения вероятностей, которые имеют больше применений в инвестиционной практике, но также более сложны.

Дискретные случайные величины.

Случайная величина (англ. 'random variable') - это величина, будущие результаты которой неопределенны. Два основных типа случайных величин - это дискретные случайные величины (англ. 'discrete random variables') и непрерывные случайные величины (англ. 'continuous random variables'). Дискретная случайная величина может принимать исчислимое количество возможных значений.

Например, дискретная случайная величина $X$ может принимать ограниченное количество значений $ x_1, x_2, \ldots, x_n $ (n возможных результатов), или дискретная случайная величина $Y$ может принимать неограниченное количество значений $ x_1, x_2, \ldots) $ (до бесконечности).

Мы придерживаемся соглашения, что заглавная буква представляет случайную величину, а строчная буква представляет результат (исход) или конкретное значение случайной величины. Таким образом, $X$ обозначает случайную переменную, а x обозначает результат переменной $X$. Мы подписываем результаты, как $ x_1, \ x_2 $, когда нам нужно различать отдельные результаты в списке значений случайной переменной.

Поскольку мы можем подсчитать все возможные результаты $X$ и $Y$ (даже если мы будем продолжать вечно в случае с $Y$), и $X$, и $Y$ удовлетворяют определению дискретной случайной величины. И напротив, мы не можем подсчитать результаты непрерывной случайной величины.

Мы не можем описать возможные результаты непрерывной случайной величины $Z$ с исходами $ z_1, \ z_2, \ldots $, когда возможный результат $ (z_1 + z_2)/2 $ отсутствует в списке результатов. Ставка доходности является примером непрерывной случайной величины.

Работая со случайной величиной, мы должны понимать ее возможные результаты.

Например, большинство акций, торгуемых на новозеландской фондовой бирже, котируются в тиках NZ$0.01. Таким образом, котируемая цена акций является дискретной случайной величиной с возможными значениями NZ$0, NZ$0.01, NZ$0.02, ...

Но мы также можем смоделировать цену акций в виде непрерывной случайной величины (в качестве логнормальной случайной величины, которую мы рассмотрим позднее). Во многих практических ситуациях у нас есть выбор между использованием дискретного или непрерывного распределения. Обычно мы руководствуемся тем, какое распределение наиболее эффективно для стоящей перед нами задачи.

Эта возможность выбора не удивительна, так как многие дискретные распределения могут быть приблизительно равны непрерывным распределениям, и наоборот. В большинстве практических случаев распределение вероятностей - это всего лишь математическая идеализация или приблизительная модель относительных частот возможных результатов случайной величины.

Пример (1) распределения цены облигации.

Вы исследуете вероятностную модель цены облигации и анализируете характеристики облигаций, которые влияют на ее цену.

Каковы самые низкие и максимально возможные значения цены облигации? Почему?

Какие еще характеристики облигаций могут влиять на распределение цены облигаций?

Минимально возможное значение цены облигации равно 0, когда облигация бесполезна. Определение максимально возможного значения цены облигации является более сложной задачей. Обещанные платежи по купонной облигации - это купоны (процентные платежи) плюс номинальная сумма (основная сумма).

Цена облигации - это дисконтированная стоимость этих обещанных платежей. Поскольку инвесторы требуют возврата своих инвестиций, 0 процентов - это нижний предел ставки дисконта, который инвесторы будут использовать для дисконтирования обещанных платежей по облигациям.

При ставке дисконтирования 0% цена облигации представляет собой сумму номинальной стоимости и оставшихся купонов без какого-либо дисконта. Таким образом, ставка дисконта устанавливает верхний предел цены облигации.

Предположим, например, что номинальная стоимость составляет $1,000, и остались 2 купона на $40; интервал от $0 до $1,080 охватывает все возможные значения цены облигации. Этот верхний предел уменьшается со временем по мере уменьшения количества оставшихся платежей.

Прочие характеристики облигации также влияют на ее распределение цен. Привязка к номинальной стоимости является одной из таких характеристик: по мере приближения даты погашения стандартное отклонение цены облигации имеет тенденцию к уменьшению, когда цена облигации приближается к номинальной стоимости.

Встроенные опционы также влияют на цену облигации. Например, если облигации в текущий момент могут быть отозваны, эмитент может выкупить эти облигации с заранее установленной премией выше номинальной; этот опцион эмитента частично снижает рост цены облигации. Моделирование распределения цен облигаций является сложной задачей.

Каждая случайная величина связана с распределением вероятностей, которое полностью описывает переменную. Мы можем рассмотреть распределение вероятности двумя способами.

Основным представлением является функция вероятности, которая определяет вероятность того, что случайная величина принимает определенное значение:

$ P(X = x) $ - это вероятность того, что случайная величина $X$ принимает значение $x$.

(Обратите внимание, что заглавная буква $X$ обозначает случайную величину, а строчная буква x обозначает конкретное значение, которое может принимать случайная величина.)

Для дискретной случайной величины сокращенная запись для функции вероятности имеет вид:

$ \large p(x) = P(X = x) $

Для непрерывных случайных величин функция вероятности обозначается $ f(x) $ и называется функцией плотности вероятности (pdf, от англ. 'probability density function'), или просто плотностью.

Другой технический термин для функции вероятности дискретной случайной величины - функция массы вероятности (pmf, от англ. 'probability mass function'). Этот термин используется реже.

Функция вероятности имеет два ключевых свойства:

$ 0 \leq p(x) \leq 1 $, потому что вероятность - это число от 0 до 1.
Сумма вероятностей $ p(x) $ всех значений $X$ равна 1. Если мы сложим вероятности всех различных возможных результатов случайной величины, эта сумма должна равняться 1.

Мы часто заинтересованы в поиске вероятности ряда результатов, а не конкретного результата. В этих случаях мы используем второе представление о распределении вероятностей, - кумулятивную (или накопленную) функцию распределения (cdf, англ. 'cumulative distribution function').

Кумулятивная функция распределения, или просто функция распределения, дает вероятность того, что случайная величина $X$ меньше или равна определенному значению $ x $, $ P (X \leq x) $.

Как для дискретных, так и для непрерывных случайных величин сокращенная запись следующий вид:

$ \large F(x) = P(X \leq x) $

Как кумулятивная функция распределения связана с функцией вероятности?

Слово «кумулятивный» подразумевает накопленные исторические результаты. Чтобы найти $ F(x) $, мы суммируем или накапливаем значения функции вероятности для всех результатов, меньших или равных x.

Функция cdf параллельна функции кумулятивной (накопленной) относительной частоты, которую мы обсуждали в чтении о статистических концепциях и доходности рынка.

Далее мы проиллюстрируем эти концепции на примерах и покажем, как мы используем дискретные и непрерывные распределения. Начнем с простейшего распределения - дискретного равномерного распределения.

Дискретное равномерное распределение.

Простейшим из всех распределений вероятности является дискретное равномерное распределение. Предположим, что возможными результатами являются целые числа от 1 до 8 включительно, и вероятность того, что случайная переменная принимает любое из этих возможных значений, одинакова для всех результатов (то есть она является равномерной).

При восьми исходах $ p(x) = 1/8 $ или 0.125, для всех значений $X(X = 1, 2, 3, 4, 5, 6, 7, 8)$; только что сделанное утверждение является полным описанием этой дискретной равномерной случайной величины. Распределение имеет конечное число указанных результатов, и каждый результат одинаково вероятен.

В Таблице 1 приведены два представления этой случайной величины: функция вероятности и кумулятивная функция распределения.

Таблица 1. Функция вероятности и кумулятивная функция распределения для дискретной равномерной случайной величины.
	Функция вероятности	Кумулятивная функция распределения
$ X=x $	$ p(x) = P(X = x) $	$ F(x) = P(X \leq x) $
1	0.125	0.125
2	0.125	0.250
3	0.125	0.375
4	0.125	0.500
5	0.125	0.625
6	0.125	0.750
7	0.125	0.875
8	0.125	1.000

Мы можем использовать Таблицу 1, чтобы найти три вероятности:

$ P (X \leq 7) $,
$ P (4 \leq X \leq 6) $ и
$ P (4 < X \leq 6) $.

Следующие примеры иллюстрируют, как использовать cdf, чтобы найти вероятность того, что случайная переменная попадет в любой интервал (для любой случайной переменной, а не только для равномерной).

Вероятность того, что $X$ меньше или равно 7, $ P (X \leq 7) $, является ближайшей к последней записи в третьем столбце, 0.875 или 87.5%.

Чтобы найти $ P (4 \leq X \leq 6) $, нам нужно найти сумму трех вероятностей: $p(4)$, $p(5)$ и $p(6)$. Мы можем найти эту сумму двумя способами. Мы можем сложить $p(4)$, $p(5)$ и $p(6)$ из второго столбца. Или мы можем вычислить вероятность как разницу между двумя значениями кумулятивной функции распределения:

$ F(6) = P(X \leq 6) = p(6) + p(5) + p(4) + p(3) + p(2) + p(1) $
$ F(3) = P(X \leq 3) = p(3) + p(2) + p(1) $

поэтому

$ \begin{aligned} P(4 \leq X \leq 6) &= F(6) - F(3) \\ &= p(6) + p(5) + p(4) = 3/8 \end{aligned} $

Поэтому мы вычисляем вторую вероятность как:

$ F(6) - F(3) = 3/8 $

Третья вероятность, $ P (4 < X \leq 6) $, вероятность того, что $X$ меньше или равно 6, но больше 4, равна $p(5) + p(6)$. Мы вычисляем ее следующим образом, используя cdf:

$ \begin{aligned} P(4 < X \leq 6) &= P(X \leq 6) - P(X \leq 4) \\ &= F(6) - F(4) = p(6) + p(5) = 2/8 \end{aligned} $

Таким образом, мы вычисляем третью вероятность как:

$ F(6) - F(4) = 2/8 $.

Предположим, мы хотим проверить, что дискретная равномерная функция вероятности удовлетворяет общим свойствам функции вероятности, приведенным ранее.

Первое свойство - это $ 0 \leq p(x) \leq 1 $. Мы видим, что $p(x) = 1/8$ для всех $x$ в первом столбце таблицы. (Обратите внимание, что $p(x)$ равно 0 для чисел $x$, таких как -14 или 12.215, которых нет в этом столбце.)

Первое свойство удовлетворяется.

Второе свойство состоит в том, что вероятности составляют в сумме 1. Записи во втором столбце таблицы 1 тоже составляют в сумме 1.

У cdf есть два других характерных свойства:

cdf лежит между 0 и 1 для любого x: $ 0 \leq F(x) \leq 1 $.
По мере увеличения $x$, cdf либо увеличивается, либо остается постоянным.

Проверьте эти утверждения, посмотрев на третий столбец в Таблице 1.

Теперь у нас есть некоторый опыт работы с вероятностными функциями и cdf для дискретных случайных величин. Позже в этом чтении мы обсудим моделирование методом Монте-Карло, методологию, основанную на случайных числах.

Как мы увидим, равномерное распределение имеет важное техническое применение: оно является основой для генерации случайных чисел, которые, в свою очередь, производят случайные наблюдения для всех других распределений вероятности.

Случайные числа, изначально генерируемые компьютерами, обычно представляют собой случайные положительные целые числа, которые преобразуются в приблизительные непрерывные равномерные случайные числа от 0 до 1. Затем непрерывные равномерные случайные числа используются для получения случайных наблюдений в других распределениях, таких как нормальное, с использованием различных методов.

Мы обсудим генерацию случайных наблюдений далее в разделе о методе моделирования Монте-Карло.

распределения вероятностей

количественные методы

программа CFA

CFA - Уровень 1

CFA - Дискретные случайные величины и дискретное равномерное распределение вероятностей

Дискретные случайные величины.

Пример (1) распределения цены облигации.

Как кумулятивная функция распределения связана с функцией вероятности?

Дискретное равномерное распределение.

Анализ CFA - Биномиальное распределение вероятностей

Анализ CFA - Логнормальное распределение вероятностей

Анализ CFA - Метод Монте-Карло

Анализ CFA - Непрерывные случайные величины и непрерывное равномерное распределение вероятностей

	Функция вероятности	Кумулятивная функция распределения
\( X=x \)	\( p(x) = P(X = x) \)	\( F(x) = P(X \leq x) \)
1	0.125	0.125
2	0.125	0.250
3	0.125	0.375
4	0.125	0.500
5	0.125	0.625
6	0.125	0.750
7	0.125	0.875
8	0.125	1.000