Рассмотрим структуру авторегрессионных моделей и расчет прогнозов на ее основе, а также использование автокорреляции остаточных ошибок для проверки соответствия авторегрессионной модели временному ряду, - в рамках изучения количественных методов по программе CFA (Уровень II).
Мы можем рассчитать авторегрессионную модель, используя метод наименьших квадратов, если временные ряды являются ковариантно стационарными, а остаточные ошибки не коррелируют.
К сожалению, наш предыдущий тест на сериальную корреляцию, статистика Дурбин-Уотсона, является необоснованным, когда независимые переменные включают прошлые значения зависимой переменной. Поэтому для большинства моделей временных рядов мы не можем использовать статистику Дурбин-Уотсона.
К счастью, мы можем использовать другие тесты (критерии), чтобы определить, являются ли ошибки в модели временных рядов сериально коррелированными. Один из таких тестов показывает, насколько значительно автокорреляция члена ошибки отличается от 0.
Этот тест представляет собой t-критерий, включающий автокорреляцию остатка регрессии и стандартную ошибку автокорреляции остатка.
Автокорреляция (англ. 'autocorrelation') временного ряда является корреляцией этого ряда с собственными прошлыми значениями. Порядок корреляции обозначается как \(k\), где \(k\) представляет количество запаздывающих периодов.
При \(k=1\) автокорреляция показывает корреляцию переменной за 1 период с ее появлением в предыдущем периоде.
Например, автокорреляция \(k\)-го порядка \(p_k\) равна:
\( \begin{aligned} \dst
p_k &= { {\rm cov}(x_t, x_{t-k}) \over \sigma^2_x } \\
&= { E \left[ (x_t - \mu)(x_{t-k} - \mu) \right] \over \sigma^2_x }
\end{aligned} \),
где \(E\) означает ожидаемое значение.
Обратите внимание, что у нас есть связь \({\rm cov}(x_t, x_{t-k})\), удерживающая равенство \(k=0\). Это означает, что абсолютное значение \(p_k\) меньше или равно 1.
Конечно, мы никогда не сможем напрямую наблюдать автокорреляцию \(p_k\). Вместо этого мы должны оценить ее. Таким образом, мы заменяем ожидаемое значение \(x_t\), \(\mu\), его оценочным значением \(\overline x\), чтобы вычислить оценочную автокорреляцию.
Оценочная автокорреляция \(k\)-того порядка временного ряда \(x_t\), которую мы обозначаем \( \hat p_k \), это:
\( \dst p_k = { \dst \sum^T_{t=k+1}
\left[ (x_t - \overline x)(x_{t-k} - \overline x) \right] \over
\dst \sum^T_{t=1} (x_t - \overline x)^2 } \),
Аналогично определению автокорреляции для временных рядов, мы можем определить автокорреляцию члена ошибки для модели временных рядов как:
\( \begin{aligned} \dst
p_k &= { {\rm cov}(\epsilon_t, \epsilon_{t-k}) \over \sigma^2_\epsilon } \\
&= { E \left[ (\epsilon_t - 0)(\epsilon_{t-k} - 0) \right] \over \sigma^2_\epsilon } \\
&= { E (\epsilon_t \epsilon_{t-k}) \over \sigma^2_\epsilon }
\end{aligned} \),
Мы предполагаем, что ожидаемое значение члена ошибки в модели временных рядов составляет 0. Это допущение аналогично тому, что мы сделали раннее, когда рассматривали регрессионный анализ ожидаемого значения члена ошибки.
Мы можем определить, используем ли мы правильную модель временных рядов, проверив, значительно ли автокорреляция члена ошибки (автокорреляция ошибки) отличается от 0.
Если это так, модель определена некорректно.
Мы оцениваем автокорреляцию ошибки с использованием автокорреляции остатков (остаточной автокорреляции) для выборки и их дисперсии для выборки.
Проверка нулевой гипотезы о том, что автокорреляция ошибки при данном временном лаге (задержке) равна 0, основана на остаточной автокорреляции для этого лага и стандартной ошибке остаточной корреляции, которая равна \( 1 \Big / \sqrt {T}\), где \(T\) - это количество наблюдений во временном ряду (Diebold 2008).
Таким образом, если у нас есть 100 наблюдений во временном ряду, стандартная ошибка для каждой из оценочных автокорреляций составляет 0.1.
Мы можем вычислить t-критерий (тест) нулевой гипотезы о том, что корреляция ошибки при определенной задержке равна 0 путем деления остаточной автокорреляции при этой задержке на ее стандартную ошибку \( \left( 1 \Big / \sqrt {T} \right) \).
Как мы можем использовать информацию об автокорреляции ошибок, чтобы определить, правильно ли определена авторегрессионная модель временного ряда?
Мы можем использовать простой трехэтапный метод.
Во-первых, рассчитайте конкретную авторегрессионную модель - скажем, модель AR(1).
Во-вторых, вычислите автокорреляцию остатков этой модели.
В-третьих, проверьте, значительно ли остаточная автокорреляция отличается от 0. Если тесты значимости показывают, что остаточная автокорреляция значительно отличаются от 0, то модель определена не правильно и нам может потребоваться изменить модель.
Теперь мы изучим пример, чтобы продемонстрировать, как работает этот трехэтапный метод.
Аналитик Мелисса Джонс решила использовать модель временного ряда для прогнозирования валовой рентабельности Intel Corporation
(Выручка - Стоимость проданных товаров) / Выручка,
используя квартальные данные с 1 квартала 1999 года по 2 квартал 2019 года.
Она не знает наилучшую модель для валовой рентабельности, но считает, что значение текущего периода будет связано со значением предыдущего периода.
Она решила начать с авторегрессионной модели первого порядка, AR(1):
\( \dst \text{Валовая рент.}_t = b_0 + b_1 ( \text{Валовая рент.}_{t-1}) + \epsilon_t \).
Ее наблюдения зависимой переменной включают промежуток с 1 квартала 2003 г. по 2 квартал 2019 г. В Иллюстрации 12 показаны результаты оценки этой модели AR(1), а также автокорреляция остатков из этой модели.
Статистики регрессии.
\( R^2 \) |
0.5746 |
Стандартная ошибка |
0.03002 |
Наблюдения |
65 |
Статистика Дурбина-Уотсона |
1.743 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
0.1513 |
0.0480 |
3.15 |
\( \text{Валовая рент.}_{t-1} \) |
0.7462 |
0.0809 |
9.2236 |
Автокорреляция остатков.
Задержка |
Автокорреляция |
Стандартная |
t-статистика |
---|---|---|---|
1 |
0.1308 |
0.1240 |
1.0545 |
2 |
-0.2086 |
0.1240 |
-1.6818 |
3 |
0.0382 |
0.1240 |
0.3080 |
4 |
0.0608 |
0.1240 |
0.4903 |
Источник: Bloomberg.
Первое, что нужно отметить в Иллюстрации 12, - это то, что как точка пересечения (\(\hat b_0 = 0.1513\)), так и коэффициент (\(\hat b_1 = 0.7462\)) по первому лагу валовой рентабельности очень значительны.
Первая задержка (лаг) временного ряда - это значение временного ряда в предыдущем периоде. t-статистика для точки пересечения составляет около 3.2, тогда как t-статистика для первой задержки валовой рентабельности составляет более 9.
При 65 наблюдениях и двух параметрах эта модель имеет 63 степени свободы. На уровне значимости 0.05 критическое значение для t-статистики составляет около 2.0.
Следовательно, Джонс должен отклонить нулевые гипотезы о том, что точка пересечения равна 0 (\(b_0 = 0\)), а коэффициент по первому лагу равен 0 (\(b_1 = 0\)) в пользу альтернативной гипотезы о том, что эти коэффициенты не равны 0.
Но обоснованы ли эти статистические данные?
Хотя статистика Дурбин-Уотсона представлена в Иллюстрации 12, ее нельзя использовать для проверки сериальной корреляции, когда независимые переменные включают прошлые значения зависимой переменной.
Правильный подход состоит в том, чтобы проверить, есть ли сериальная корреляция остатков в этой модели.
В нижней части Иллюстрации 12 первые четыре автокорреляции остатков отображаются вместе со стандартной ошибкой и t-статистикой для каждой из этих автокорреляций.
Для сезонных нескорректированных данных аналитики часто вычисляют количество автокорреляций, соответствующее количеству наблюдений за год (например, четыре для квартальных данных).
Количество вычисленных автокорреляций также часто зависит от размера выборки, как обсуждалось в Diebold (2008).
Выборка имеет 65 наблюдений, поэтому стандартная ошибка для каждой из автокорреляций составляет \( 1 \Big/ \sqrt{65} = 0.1240 \).
Иллюстрация 12 показывает, что ни одна из первых четырех автокорреляций не имеет t-статистику, превышающую 1.6818 в абсолютном значении. Следовательно, Джонс может сделать вывод, что ни одна из этих автокорреляций не отличается значительно от 0.
Следовательно, она может предположить, что остатки не имеют сериальной корреляции и что модель правильно определена, и можно обоснованно использовать метод наименьших квадратов для оценки параметров и стандартных ошибок параметров в авторегрессионной модели (для других тестов на сериальную корреляцию остатков см. Diebold 2008).
Теперь, когда Джонс пришла к выводу, что эта модель правильно определена, может ли она использовать ее для прогнозирования валовой рентабельности Intel в следующем периоде?
Для оценки этого нужно использовать уравнение:
\( \dst \text{Валовая рент.}_t = 0.1513 + 0.7462 ( \text{Валовая рент.}_{t-1}) + \epsilon_t \).
Ожидаемое значение члена ошибки составляет 0 в любом периоде. Следовательно, эта модель предсказывает, что валовая рентабельность в периоде \(t + 1 \) составит:
\( \dst \text{Валовая рент.}_{t+1} = 0.1513 + 0.7462 ( \text{Валовая рент.}_t) + \epsilon_t \).
Например, если в этом квартале валовая рентабельность составляет 55% (0.55), то модель прогнозирует, что в следующем квартале валовая маржа увеличится до:
0.1513 + 0.7462(0.55) = 0.5617, или 56.17%.
Однако, если валовая рентабельность в настоящее время составляет 65% (0.65), то модель предсказывает, что в следующем квартале валовая рентабельность упадет до:
0.1513 + 0.7462(0.65) = 0.6363, или 63.63%.
Как мы покажем в следующем разделе, модель предсказывает, что валовая рентабельность будет увеличиваться, если она ниже определенного уровня (59.61%) и уменьшаться, если она выше этого уровня.