Рассмотрим проверку и исправление сезонности в моделях временных рядов, а также расчет и интерпретацию прогнозируемого значения для авторегрессионной модели с сезонным лагом, - в рамках изучения количественных методов по программе CFA (Уровень II).
Когда мы анализируем результаты расчета моделей временных рядов, приведенные в этом чтении, мы сталкиваемся с осложнениями. Одним из распространенных осложнений является значительная сезонность - ситуация, когда ряд демонстрирует регулярные изменения в течение каждого года.
На первый взгляд, сезонность можно устранить, используя авторегрессионные модели временных рядов. В конце концов, автокорреляции будут отличаться в течение сезона. Однако эту проблему часто можно решить, используя сезонные лаги (запаздывающие значения) в авторегрессионной модели.
Сезонный лаг (англ. 'seasonal lag'), как правило, является значением временного ряда взятым ранее текущего периода в течение одного года (т.е. запаздывающим значением). Это значение включается в качестве дополнительного члена в уравнение авторегрессионной модели.
Например, предположим, что мы моделируем ежеквартальный временной ряд, используя модель AR(1):
\( x_t = b_0 + b_1 x_{t-1} + \epsilon_t \)
Если бы временной ряд имел значительную сезонность, эта модель была бы неправильно определена.
Сезонность было бы легко обнаружить, потому что сезонная автокорреляция (в случае квартальных данных это четвертая автокорреляция) члена ошибки значительно отличается от 0.
Предположим, что эта квартальная модель имеет значительную сезонность. В этом случае мы могли бы включить сезонный лаг в модель следующим образом:
\( x_t = b_0 + b_1 x_{t-1} + b_2 x_{t-4} + \epsilon_t \) (15)
Таким образом можно проверить, устранит ли включение в модель сезонного лага статистически значимую автокорреляцию в члене ошибки.
В примерах 15 и 16 мы проиллюстрируем, как проверить и скорректировать сезонность в модели временных рядов. Мы также покажем, как вычислить прогноз, используя авторегрессионную модель с сезонным лагом.
Ранее мы пришли к выводу, что можем моделировать логарифм квартальных продаж Starbucks, используя только временной тренд (как показано в Примере 3), потому что статистика Дурбина-Уотсона свидетельствует о положительной сериальной корреляции в члене ошибки.
Основываясь на методах, представленных в этом чтении, мы могли бы затем исследовать первую разность логарифма продаж для устранения экспоненциального тренда из данных, чтобы получить ковариантно стационарный временной ряд.
Используя ежеквартальные данные с последнего квартала 2001 года по второй квартал 2019 года, мы оцениваем следующую модель AR(1), используя метод наименьших квадратов:
\( (\ln \text{Продажи}_t - \ln \text{Продажи}_{t-1}) = \)
\( b_0 + b_1 (\ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) + \epsilon_t \)
Иллюстрация 26 показывает результаты этой регрессии.
Статистики регрессии.
\( R^2 \) |
0.2044 |
Стандартная ошибка |
0.0611 |
Наблюдения |
72 |
Статистика Дурбин-Уотсона |
1.9904 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
0.0469 |
0.0080 |
5.8625 |
\( \ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) \) |
-0.4533 |
0.1069 |
-4.2404 |
Автокорреляция остатков.
Задержка |
Автокорреляция |
Стандартная |
t-статистика |
---|---|---|---|
1 |
0.0051 |
0.1179 |
-0.0433 |
2 |
-0.1676 |
0.1179 |
-1.4218 |
3 |
-0.0130 |
0.1179 |
-0.1099 |
4 |
0.7630 |
0.1179 |
6.4720 |
Источник: Bloomberg.
Первое, что следует отметить в Иллюстрации 26, - это сильная сезонная автокорреляция остатков. В нижней части таблицы показано, что четвертая автокорреляция имеет значение 0.7630 и t-статистику 6.
При 72 наблюдениях и двух параметрах эта модель имеет 70 степеней свободы. Критическое значение для t-статистики составляет около 1.99 на уровне значимости 0.05.
В этом примере мы ограничиваем начало периода выборки до начала 2001 года, и мы не используем предыдущие наблюдения для временных лагов. Соответственно, количество наблюдений уменьшается с увеличением количества лагов.
В Иллюстрации 26 первое наблюдение приходится на третий квартал 2001 года, потому что мы используем до двух лагов. В Иллюстрации 27 первое наблюдение приходится на второй квартал 2002 года, потому что мы используем до пяти лагов.
Учитывая это значение t-статистики, мы должны отклонить нулевую гипотезу о том, что четвертая автокорреляция равна 0, поскольку t-статистика больше критического значения 1,99.
В этой модели четвертая автокорреляция является сезонной автокорреляцией, поскольку эта модель AR(1) оценивается с помощью квартальных данных. Иллюстрация 26 показывает сильную и статистически значимую сезонную автокорреляцию, которая возникает, когда временной ряд с сильной сезонностью моделируются без учета сезонности. Следовательно, модель AR(1) неправильно определена, и мы не должны использовать ее для прогнозирования.
Предположим, мы решили использовать авторегрессионную модель с сезонным лагом из-за сезонной автокорреляции. Мы моделируем ежеквартальные данные, поэтому применяем Уравнение 15:
\( (\ln \text{Продажи}_t - \ln \text{Продажи}_{t-1}) = \)
\( b_0 + b_1 (\ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) + \)
\( b_2 (\ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) + \epsilon_t \)
Добавление сезонной разности \( \ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) \) является попыткой удалить постоянную квартальную схему в данных, а также может устранить сезонную нестационарность, если она существует.
Результаты расчета этого уравнения приведены в Иллюстрации 27.
Статистики регрессии
\( R^2 \) |
0.7032 |
Стандартная ошибка |
0.0373 |
Наблюдения |
69 |
Статистика Дурбин-Уотсона |
2.0392 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
0.0107 |
0.0059 |
1.8136 |
\( \ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) \) |
-0.1540 |
0.0729 |
-2.1125 |
\( \ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) \) |
0.7549 |
0.0720 |
10.4847 |
Автокорреляция остатков
Задержка |
Автокорреляция |
Стандартная |
t-статистика |
---|---|---|---|
1 |
0.0135 |
0.1204 |
0.1121 |
2 |
-0.0171 |
0.1204 |
-0.1420 |
3 |
0.1589 |
0.1204 |
1.3198 |
4 |
-0.1498 |
0.1204 |
-1.2442 |
Источник: Compustat.
Обратите внимание на автокорреляции остатка, показанные в нижней части Иллюстрации 27. Ни одна из t-статистик для первых четырех автокорреляций не является значимой.
Поскольку регрессия сильно значима в целом (F-тест, не показанный в иллюстрации, является значимым на уровне 0.01), мы можем взять модель AR(1) с сезонным лагом в качестве обоснованно работающей модели для анализа продаж Starbucks.
Как мы можем интерпретировать коэффициенты в этой модели?
Чтобы предсказать рост продаж Starbucks в текущем квартале, нам нужно знать две вещи: рост продаж в предыдущем квартале и рост продаж за четыре квартала до этого.
Если продажи будут оставаться неизменными в каждом из этих двух кварталов, модель в Иллюстрации 27 предскажет, что продажи вырастут на 0.0107 (1.07%) в текущем квартале.
Если продажи вырастут на 1% в прошлом квартале и на 2% четыре квартала назад, то модель предскажет, что рост продаж в текущем квартале составит:
0.0107 - 0.0154(0.01) + 0.7549(0.02) = 0.0256 или 2.56%.
Обратите внимание, что все эти темпы роста являются экспоненциальными темпами роста. Обратите также внимание на то, что коэффициент детерминации \(R^2\) в модели с сезонным лагом (0.7032 в Иллюстрации 27) был более чем в три раза выше, чем \(R^2\) в модели без сезонного лага (0.2044 в Иллюстрации 26).
Опять же, модель с сезонным лагом гораздо лучше справляется с объяснением данных.
Мы хотим предсказать рост ежемесячных розничных продаж канадских мебельных магазинов, чтобы решить, следует ли рекомендовать покупку акций этих магазинов. Мы решаем использовать данные о розничных продажах без корректировки на сезонность.
Начнем с применения модели AR(1) для оценки аннуализированных наблюдений ежемесячного роста розничных продаж с января 1995 года по декабрь 2012 года.
Мы используем следующее уравнение:
\( \text{Рост продаж}_t = b_0 + b_1 (\text{Рост продаж}_{t-1}) + \epsilon_t \)
Иллюстрация 28 показывает результаты оценки этой модели.
Автокорреляции остатков из этой модели, показанные в нижней части Иллюстрации 28, показывают, что сезонность чрезвычайно значима в этой модели. При 216 наблюдениях и 2 параметрах эта модель имеет 214 степеней свободы. На уровне значимости 0.05 критическое значение для t-статистики составляет около 1.97.
Автокорреляция 12-го лага (сезонная автокорреляция, поскольку мы используем ежемесячные данные) имеет значение 0.7620 и t-статистику 11.21.
t-статистика по этой автокорреляции больше критического значения (1.97). Это подразумевает, что мы можем отклонить нулевую гипотезу о том, что 12-я автокорреляция равна 0.
Также обратите внимание, что многие другие t-статистики для автокорреляций, показанных в таблице, значительно отличаются от 0. Следовательно, модель, показанная в Иллюстрации 28, неправильно определена, поэтому мы не можем полагаться на ее прогноз роста продаж.
Предположим, что мы добавляем сезонный лаг роста продаж (12-й лаг) в модель AR(1), чтобы оценить уравнение:
\( \text{Рост продаж}_t = b_0 + b_1 (\text{Рост продаж}_{t-1}) + b_2 (\text{Рост продаж}_{t-12}) + \epsilon_t \)
В этом примере, хоть мы и говорим, что период выборки начинается в 1995 году, мы используем предыдущие наблюдения для лагов. Это приводит к тому же количеству наблюдений независимо от количества лагов. Иллюстрация 29 содержит результаты расчета этого уравнения.
Расчетное значение сезонной автокорреляции (12-й автокорреляции) снизилось до -0.1168. Ни одна из первых 12 автокорреляций не имеет t-статистики с абсолютным значением, превышающим критическое значение 1.97 на уровне значимости 0.05.
Мы можем сделать вывод, что в остатках этой модели нет значимой сериальной корреляции. Поскольку мы можем обоснованно считать, что модель правильно определена, мы можем использовать ее для прогнозирования роста розничных продаж.
Обратите внимание, что \(R^2\) в Иллюстрации 29 составляет 0.6724, что намного больше, чем \(R^2\) в Иллюстрации 28 (расчет модели без сезонного лага).
Статистики регрессии
\( R^2 \) |
0.0509 |
Стандартная ошибка |
1.8198 |
Наблюдения |
216 |
Статистика Дурбин-Уотсона |
2.0956 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
1.0518 |
0.1365 |
7.7055 |
\( \text{Рост продаж}_{t-1} \) |
-0.2252 |
0.0665 |
-3.3865 |
Автокорреляция остатков
Задержка |
Автокорреляция |
Стандартная |
t-статистика |
---|---|---|---|
1 |
-0.0109 |
0.0680 |
-0.1603 |
2 |
-0.1949 |
0.0680 |
-2.8662 |
3 |
0.1173 |
0.0680 |
1.7250 |
4 |
-0.0756 |
0.0680 |
-1.1118 |
5 |
-0.1270 |
0.0680 |
-1.8676 |
6 |
-0.1384 |
0.0680 |
-2.0353 |
7 |
-0.1374 |
0.0680 |
-2.0206 |
8 |
-0.0325 |
0.0680 |
-0.4779 |
9 |
0.1207 |
0.0680 |
1.7750 |
10 |
-0.2197 |
0.0680 |
-3.2309 |
11 |
-0.0342 |
0.0680 |
-0.5029 |
12 |
0.7620 |
0.0680 |
11.2059 |
Источник: Статистика Канады.
Как мы можем интерпретировать коэффициенты в этой модели?
Чтобы предсказать рост розничных продаж в данном месяце, мы должны знать рост розничных продаж в прошлом месяце и рост продаж 12 месяцев назад.
Если розничные продажи оставались постоянными как в прошлом месяце, так и 12 месяцев назад, то модель из Иллюстрации 29 предскажет, что розничные продажи будут расти с годовым темпом около 23.7% в данном месяце.
Если розничные продажи растут с годовым темпом 10% в прошлом месяце и с годовым темпом 5% 12 месяцев назад, модель в Иллюстрации 29 предскажет, что розничные продажи будут расти в текущем месяце с годовым темпом
0.2371 - 0.0792(0.10) + 0.7798(0.05) = 0.2682 или 26.8%.
Статистики регрессии
\( R^2 \) |
0.6724 |
Стандартная ошибка |
1.0717 |
Наблюдения |
216 |
Статистика Дурбин-Уотсона |
2.1784 |
Коэффициент |
Стандартная |
t-статистика |
|
---|---|---|---|
Точка пересечения |
0.2371 |
0.0900 |
2.6344 |
\( \text{Рост продаж}_{t-1} \) |
-0.0792 |
0.0398 |
-1.9899 |
\( \text{Рост продаж}_{t-12} \) |
0.7798 |
0.0388 |
20.0979 |
Автокорреляция остатков
Задержка |
Автокорреляция |
Стандартная |
t-статистика |
---|---|---|---|
1 |
-0.0770 |
0.0680 |
-1.1324 |
2 |
-0.0374 |
0.0680 |
-0.5500 |
3 |
0.0292 |
0.0680 |
0.4294 |
4 |
-0.0358 |
0.0680 |
-0.5265 |
5 |
-0.0399 |
0.0680 |
-0.5868 |
6 |
0.0227 |
0.0680 |
0.3338 |
7 |
-0.0967 |
0.0680 |
-1.4221 |
8 |
0.1241 |
0.0680 |
1.8250 |
9 |
0.0499 |
0.0680 |
0.7338 |
10 |
-0.0631 |
0.0680 |
-0.9279 |
11 |
0.0231 |
0.0680 |
0.3397 |
12 |
-0.1168 |
0.0680 |
-1.7176 |
Источник: Статистика Канады.