Рассмотрим условно гетероскедастичные авторегрессионные модели (ARCH), а также как модели ARCH применяются для прогнозирования дисперсии временных рядов, - в рамках изучения количественных методов по программе CFA (Уровень II).
До сих пор мы представляли авторегрессионные модели и модели скользящего среднего в качестве альтернативы для моделирования временных рядов. Временные ряды, которые мы рассмотрели в примерах, обычно довольно хорошо объясняются с помощью простой авторегрессионной модели (с сезонными лагами или без них).
Для анализа доходности S&P BSE 100 (см. Пример 14) мы выбрали модель скользящего среднего вместо авторегрессионной модели.
Некоторые эксперты, однако, выступают за использование более общей модели - авторегрессионной модели со скользящим средним (ARMA, autoregressive moving-average model). Сторонники моделей ARMA утверждают, что эти модели могут лучше соответствовать данным и могут обеспечивать лучшие прогнозы, чем простые модели авторегрессии (AR).
Однако, как мы обсудим позже в этом разделе, существуют серьезные ограничения для оценки и использования этих моделей. Поскольку вы можете встретить на практике модели ARMA, мы приводим краткий обзор этих моделей.
Модель ARMA объединяет как авторегрессионные лаги зависимой переменной, так и ошибки скользящего среднего. Уравнение для такой модели с \(p\) членами авторегрессии и \(q\) членами скользящего среднего, обозначается как ARMA(\(p, q\)) и имеет следующий вид:
\( \begin{aligned}
x_t &= b_0 + b_1 x_{t-1} + \ldots + b_p x_{t-p} + \\
&+ \epsilon_t + \theta_1 \epsilon_{t-1} + \ldots + \theta_q \epsilon_{t-q}
\end{aligned} \).
\( E \left(\epsilon_t \right) = 0 \), \( E \left(\epsilon^2_t \right) = \sigma^2 \),
\( {\rm cov}\left(\epsilon_t , \epsilon_s \right) = E \left(\epsilon_t \epsilon_s \right) = 0 \) при \(t \neq s\) (16)
где \(b_1\), \(b_2\), ... \(b_p\) - авторегрессионные параметры и \(\theta_1\), \(\theta_2\), ... \(\theta_p\) - параметры скользящего среднего.
Оценка и использование моделей ARMA имеют несколько ограничений.
Во-первых, параметры моделей ARMA могут быть очень нестабильными. В частности, небольшие изменения в выборке данных или первоначальных предположениях о значениях параметров ARMA могут привести к совершенно разным окончательным оценкам параметров ARMA.
Во-вторых, выбор правильной модели ARMA - это скорее искусство, чем наука.
Критерии выбора \(p\) и \(q\) для определенных временных рядов далеки от идеальных. Более того, даже после выбора определенной модели эта модель может плохо прогнозировать.
Повторим, что модели ARMA могут быть очень нестабильными, в зависимости от используемой выборки данных и конкретной модели ARMA.
Поэтому вы должны скептически относиться к утверждениям о том, что конкретная модель ARMA предоставляет гораздо лучшие прогнозы временного ряда, чем какая-либо другая модель ARMA.
Фактически, в большинстве случаев вы можете использовать модель AR для получения прогнозов, которые будут столь же точны, как и модели ARMA, но без столь высокой сложности.
Даже некоторые из самых убежденных сторонников моделей ARMA признают, что эти модели нельзя использовать, когда имеется менее 80 наблюдений, и они не рекомендуют использовать модели ARMA для прогнозирования ежеквартальных продаж или валовой прибыли, даже если используются квартальные данные за 15 лет.
До сих пор мы игнорировали любые проблемы гетероскедастичности в моделях временных рядов и допускали наличие гомоскедастичности.
Гетероскедастичность - это зависимость дисперсии члена ошибки от независимой переменной.
Гомоскедастичность - это независимость дисперсии члена ошибки от независимой переменной.
Мы предположили, что дисперсия члена ошибки является постоянной и не зависит от значения самого временного ряда или от размера предыдущих ошибок. Однако, это предположение иногда нарушается, и дисперсия члена ошибки не является постоянной.
В такой ситуации стандартные ошибки коэффициентов регрессии в моделях AR, MA или ARMA будут неверными, а наши проверки гипотез будут недействительными. Следовательно, мы можем принимать плохие инвестиционные решения на основе этих проверок.
Например, предположим, что вы строите авторегрессионную модель продаж компании. Если присутствует гетероскедастичность, то стандартные ошибки коэффициентов регрессии вашей модели будут неверными.
Вполне вероятно, что из-за гетероскедастичности один или несколько запаздывающих членов уравнения могут показаться статистически значимыми, когда на самом деле это не так. Поэтому, если вы используете эту модель для принятия решений, вы можете принять некоторые неоптимальные решения.
В 1982 году Роберт Ф. Энгл впервые предложил способ проверки того, зависит ли дисперсия ошибки в определенной модели временного ряда за один период от дисперсий ошибки за предыдущие периоды.
Он назвал этот тип гетероскедастичности «авторегрессионной условной гетероскедастичностью» (ARCH autoregressive conditional heteroskedasticity).
В качестве примера рассмотрим модель ARCH(1)
\( \dst \epsilon_t ~ N \left(0, a_0 + a_1 \epsilon^2_{t-1} \right) \), (17)
где распределение \(\epsilon_t\), зависящее от своего значения за предыдущий период, \(\epsilon_{t-1}\), является нормальным, со средним значением 0 и дисперсией \( a_0 + a_1 \epsilon^2_{t-1} \).
Если \( a_1 =0 \), дисперсия ошибки в каждом периоде составляет просто \( a_0 \). Дисперсия постоянна с течением времени и не зависит от ошибок прошлых периодов.
Теперь предположим, что \( a_1 >0 \). Тогда дисперсия ошибки за один период зависит от того, насколько велика была квадратная ошибка в предыдущем периоде.
Если в одном периоде возникает большая ошибка, дисперсия ошибки в следующем периоде будет еще больше.
Энгл показал, что мы можем проверить, соответствует ли временной ряд модели ARCH(1), регрессируя квадратные остатки из выбранной ранее другой модели временного ряда (AR, MA или ARMA).
Мы можем использовать следующее уравнение линейной регрессии
\( \dst \hat \epsilon^2_t = a_0 + a_1 \hat \epsilon^2_{t-1} + u_t \), (18)
где \( u_t \) является членом ошибки.
Если \(a_1\) статистически значимо отличается от нуля, мы заключаем, что временной ряд соответствует модели ARCH(1). Если модель временного ряда имеет ошибки ARCH(1), то дисперсия ошибок в периоде \(t+1\) может быть предсказана в периоде \(t+1\) с помощью формулы:
\( \dst \hat \sigma^2_{t+1} = \hat a_0 + \hat a_1 \hat \epsilon^2_t \).
Аналитик Лизетт Миллер хочет проверить, содержат ли ежемесячные данные об инфляции CPI (индекса потребительских цен) авторегрессионную условную гетероскедастичность (ARCH). Она могла бы оценить Уравнение 18, используя остатки из модели временного ряда.
Основываясь на анализе из Примеров с 6 по 9, она пришла к выводу, что если она смоделирует ежемесячную инфляцию CPI с 1995 по 2018 год, то не будет большой разницы в эффективности моделей AR(1) и AR(2) при прогнозировании инфляции.
Модель AR(1) явно лучше подходит данным за период 2008-2018. Она решает дополнительно изучить модель AR(1) за весь период с 1995 по 2018 год.
Иллюстрация 30 показывает результаты проверки того, соответствуют ли ошибки в этой модели ARCH (1). Поскольку тест включает в себя первый лаг остатков модели, количество наблюдений в тесте на одно меньше, чем в модели.
t-статистика для коэффициента по квадратным остаткам предыдущего периода превышает 4.8.
Следовательно, Миллер легко отвергает нулевую гипотезу о том, что дисперсия ошибки не зависит от дисперсии ошибок предыдущих периодов. Следовательно, статистики теста, которые она рассчитала в Иллюстрации 30, необоснованны, и она не должна использовать их при принятии решения о своей инвестиционной стратегии.
Статистики регрессии
\( R^2 \) |
0.0759 |
Стандартная ошибка |
23.7841 |
Наблюдения |
286 |
Статистика Дурбин-Уотсона |
2.0569 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
6.3626 |
1.4928 |
4.2622 |
\( \hat \epsilon^2_{t-1} \) |
0.2754 |
0.0570 |
4.8316 |
Источник: Бюро статистики труда США.
Возможно, что вывод Миллера (о том, что модель AR(1) для ежемесячной инфляции имеет ARCH в ошибках) может быть связано с использованным периодом выборки (1995-2018).
В Примере 9 она использовала более короткий период выборки 2008-2018 и пришла к выводу, что ежемесячная инфляция CPI соответствует модели AR(1). Эти результаты были показаны в Иллюстрации 16.
Иллюстрация 30 показывает, что ошибки модели инфляции для всей выборки (1995-2018) имеют ARCH.
Имеют ли ошибки с более коротким периодом выборки (2008-2018) ARCH?
Для более короткого периода выборки Миллер применила модель AR(1) с использованием ежемесячной инфляции. Теперь она проверяет, содержат ли ошибки ARCH. Иллюстрация 31 показывает результаты этого теста.
В этой выборке коэффициент по квадратным остаткам предыдущего периода имеет t-статистику 4.0229.
Следовательно, Миллер отвергает нулевую гипотезу о том, что ошибки в этой регрессии не имеют авторегрессионной условной гетероскедастичности (ARCH).
Дисперсия ошибки, по-видимому, является гетероскедастической, и Миллер не может полагаться на t-статистики.
Статистики регрессии
\( R^2 \) |
0.1113 |
Стандартная ошибка |
24.64 |
Наблюдения |
131 |
Статистика Дурбин-Уотсона |
2.0385 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
6.2082 |
2.2873 |
2.7142 |
\( \hat \epsilon^2_{t-1} \) |
0.3336 |
0.0830 |
4.0229 |
Источник: Бюро статистики труда США.
Предположим, что модель содержит ошибки ARCH(1).
Каковы последствия этого факта?
Во-первых, если ARCH(1) существует, стандартные ошибки для параметров регрессии не будут правильными. Нам нужно будет использовать общий метод наименьших квадратов или другие методы, которые допустимо применять для правильной оценки стандартной ошибки параметров при наличии в модели гетероскедастичности.
Во-вторых, если ARCH существует, и мы смоделировали ее, например, как ARCH(1), мы можем предсказать дисперсию ошибок.
Предположим, например, что мы хотим предсказать дисперсию ошибки в данных об инфляции, используя расчетные параметры из Иллюстрации 30:
\( \dst \hat \sigma^2_t = 6.3626 + 0.2754 \ \ \hat \sigma^2_{t-1} \).
Если ошибка за один период составляет 0%, то прогнозируемая дисперсия ошибки в следующем периоде будет:
6.3626 + 0.2754(0) = 6.3626.
Если ошибка за один период составляет 1%, то прогнозируемая дисперсия ошибки в следующем периоде будет:
6.3626 + 0.2754(\(1^2\)) = 6.6380.
Энгл и другие исследователи предложили много обобщений модели ARCH(1), включая ARCH(\(p\)) и обобщенные условно гетероскедастичные авторегрессионные модели (GARCH, generalized autoregressive conditional heteroskedasticity).
В модели ARCH(\(p\)) дисперсия члена ошибки в текущем периоде линейно зависит от квадратных ошибок из предыдущих периодов \(p\):
\( \sigma^2_t = a_0 + a_1 \sigma^2_{t-1} + \ldots + a_p \sigma^2_{t-p} \).
Модели GARCH аналогичны ARMA-моделям дисперсии ошибок во временных рядах. Как и модели ARMA, модели GARCH могут быть требовательными и нестабильными: их результаты могут сильно зависеть от периода выборки и начального подбора параметров для модели GARCH.
Финансовые аналитики, которые используют модели GARCH, должны быть хорошо осведомлены о том, насколько деликатными могут быть эти модели, и они должны изучить, являются ли результаты расчета GARCH устойчивыми к изменениям в выборке и первоначальным предположениям о параметрах.