Когда мы анализируем результаты расчета моделей временных рядов, приведенные в этом чтении, мы сталкиваемся с осложнениями. Одним из распространенных осложнений является значительная сезонность - ситуация, когда ряд демонстрирует регулярные изменения в течение каждого года.

На первый взгляд, сезонность можно устранить, используя авторегрессионные модели временных рядов. В конце концов, автокорреляции будут отличаться в течение сезона. Однако эту проблему часто можно решить, используя сезонные лаги (запаздывающие значения) в авторегрессионной модели.

Сезонный лаг (англ. 'seasonal lag'), как правило, является значением временного ряда взятым ранее текущего периода в течение одного года (т.е. запаздывающим значением). Это значение включается в качестве дополнительного члена в уравнение авторегрессионной модели.

Например, предположим, что мы моделируем ежеквартальный временной ряд, используя модель AR(1):

\( x_t = b_0 + b_1 x_{t-1} + \epsilon_t \)

Если бы временной ряд имел значительную сезонность, эта модель была бы неправильно определена.

Сезонность было бы легко обнаружить, потому что сезонная автокорреляция (в случае квартальных данных это четвертая автокорреляция) члена ошибки значительно отличается от 0.

Предположим, что эта квартальная модель имеет значительную сезонность. В этом случае мы могли бы включить сезонный лаг в модель следующим образом:

\( x_t = b_0 + b_1 x_{t-1} + b_2 x_{t-4} + \epsilon_t \) (15)

Таким образом можно проверить, устранит ли включение в модель сезонного лага статистически значимую автокорреляцию в члене ошибки.

В примерах 15 и 16 мы проиллюстрируем, как проверить и скорректировать сезонность в модели временных рядов. Мы также покажем, как вычислить прогноз, используя авторегрессионную модель с сезонным лагом.

Пример 15. Сезонность продаж Starbucks.

Ранее мы пришли к выводу, что можем моделировать логарифм квартальных продаж Starbucks, используя только временной тренд (как показано в Примере 3), потому что статистика Дурбина-Уотсона свидетельствует о положительной сериальной корреляции в члене ошибки.

Основываясь на методах, представленных в этом чтении, мы могли бы затем исследовать первую разность логарифма продаж для устранения экспоненциального тренда из данных, чтобы получить ковариантно стационарный временной ряд.

Используя ежеквартальные данные с последнего квартала 2001 года по второй квартал 2019 года, мы оцениваем следующую модель AR(1), используя метод наименьших квадратов:

\( (\ln \text{Продажи}_t - \ln \text{Продажи}_{t-1}) = \)
\( b_0 + b_1 (\ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) + \epsilon_t \)

Иллюстрация 26 показывает результаты этой регрессии.

Иллюстрация 26. Разность продаж: модельAR (1) - Starbucks, квартальные наблюдения, 2001-2019.

Статистики регрессии.

\( R^2 \)

0.2044

Стандартная ошибка

0.0611

Наблюдения

72

Статистика Дурбин-Уотсона

1.9904

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

0.0469

0.0080

5.8625

\( \ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) \)

-0.4533

0.1069

-4.2404

Автокорреляция остатков.

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

0.0051

0.1179

-0.0433

2

-0.1676

0.1179

-1.4218

3

-0.0130

0.1179

-0.1099

4

0.7630

0.1179

6.4720

Источник: Bloomberg.


Первое, что следует отметить в Иллюстрации 26, - это сильная сезонная автокорреляция остатков. В нижней части таблицы показано, что четвертая автокорреляция имеет значение 0.7630 и t-статистику 6.

При 72 наблюдениях и двух параметрах эта модель имеет 70 степеней свободы. Критическое значение для t-статистики составляет около 1.99 на уровне значимости 0.05.

В этом примере мы ограничиваем начало периода выборки до начала 2001 года, и мы не используем предыдущие наблюдения для временных лагов. Соответственно, количество наблюдений уменьшается с увеличением количества лагов.

В Иллюстрации 26 первое наблюдение приходится на третий квартал 2001 года, потому что мы используем до двух лагов. В Иллюстрации 27 первое наблюдение приходится на второй квартал 2002 года, потому что мы используем до пяти лагов.

Учитывая это значение t-статистики, мы должны отклонить нулевую гипотезу о том, что четвертая автокорреляция равна 0, поскольку t-статистика больше критического значения 1,99.

В этой модели четвертая автокорреляция является сезонной автокорреляцией, поскольку эта модель AR(1) оценивается с помощью квартальных данных. Иллюстрация 26 показывает сильную и статистически значимую сезонную автокорреляцию, которая возникает, когда временной ряд с сильной сезонностью моделируются без учета сезонности. Следовательно, модель AR(1) неправильно определена, и мы не должны использовать ее для прогнозирования.

Предположим, мы решили использовать авторегрессионную модель с сезонным лагом из-за сезонной автокорреляции. Мы моделируем ежеквартальные данные, поэтому применяем Уравнение 15:

\( (\ln \text{Продажи}_t - \ln \text{Продажи}_{t-1}) = \)
\( b_0 + b_1 (\ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) + \)
\( b_2 (\ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) + \epsilon_t \)

Добавление сезонной разности \( \ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) \) является попыткой удалить постоянную квартальную схему в данных, а также может устранить сезонную нестационарность, если она существует.

Результаты расчета этого уравнения приведены в Иллюстрации 27.

Иллюстрация 27. Разность продаж: модельAR (1) - Starbucks, квартальные наблюдения, 2005-2019.

Статистики регрессии

\( R^2 \)

0.7032

Стандартная ошибка

0.0373

Наблюдения

69

Статистика Дурбин-Уотсона

2.0392

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

0.0107

0.0059

1.8136

\( \ln \text{Продажи}_{t-1} - \ln \text{Продажи}_{t-2}) \)

-0.1540

0.0729

-2.1125

\( \ln \text{Продажи}_{t-4} - \ln \text{Продажи}_{t-5}) \)

0.7549

0.0720

10.4847

Автокорреляция остатков

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

0.0135

0.1204

0.1121

2

-0.0171

0.1204

-0.1420

3

0.1589

0.1204

1.3198

4

-0.1498

0.1204

-1.2442

Источник: Compustat.


Обратите внимание на автокорреляции остатка, показанные в нижней части Иллюстрации 27. Ни одна из t-статистик для первых четырех автокорреляций не является значимой.

Поскольку регрессия сильно значима в целом (F-тест, не показанный в иллюстрации, является значимым на уровне 0.01), мы можем взять модель AR(1) с сезонным лагом в ​​качестве обоснованно работающей модели для анализа продаж Starbucks.

Как мы можем интерпретировать коэффициенты в этой модели?

Чтобы предсказать рост продаж Starbucks в текущем квартале, нам нужно знать две вещи: рост продаж в предыдущем квартале и рост продаж за четыре квартала до этого.

Если продажи будут оставаться неизменными в каждом из этих двух кварталов, модель в Иллюстрации 27 предскажет, что продажи вырастут на 0.0107 (1.07%) в текущем квартале.

Если продажи вырастут на 1% в прошлом квартале и на 2% четыре квартала назад, то модель предскажет, что рост продаж в текущем квартале составит:

0.0107 - 0.0154(0.01) + 0.7549(0.02) = 0.0256 или 2.56%.

Обратите внимание, что все эти темпы роста являются экспоненциальными темпами роста. Обратите также внимание на то, что коэффициент детерминации \(R^2\) в модели с сезонным лагом (0.7032 в Иллюстрации 27) был более чем в три раза выше, чем \(R^2\) в модели без сезонного лага (0.2044 в Иллюстрации 26).

Опять же, модель с сезонным лагом гораздо лучше справляется с объяснением данных.

Пример 16. Рост продаж (исторический пример).

Мы хотим предсказать рост ежемесячных розничных продаж канадских мебельных магазинов, чтобы решить, следует ли рекомендовать покупку акций этих магазинов. Мы решаем использовать данные о розничных продажах без корректировки на сезонность.

Начнем с применения модели AR(1) для оценки аннуализированных наблюдений ежемесячного роста розничных продаж с января 1995 года по декабрь 2012 года.

Мы используем следующее уравнение:

\( \text{Рост продаж}_t = b_0 + b_1 (\text{Рост продаж}_{t-1}) + \epsilon_t \)

Иллюстрация 28 показывает результаты оценки этой модели.

Автокорреляции остатков из этой модели, показанные в нижней части Иллюстрации 28, показывают, что сезонность чрезвычайно значима в этой модели. При 216 наблюдениях и 2 параметрах эта модель имеет 214 степеней свободы. На уровне значимости 0.05 критическое значение для t-статистики составляет около 1.97.

Автокорреляция 12-го лага (сезонная автокорреляция, поскольку мы используем ежемесячные данные) имеет значение 0.7620 и t-статистику 11.21.

t-статистика по этой автокорреляции больше критического значения (1.97). Это подразумевает, что мы можем отклонить нулевую гипотезу о том, что 12-я автокорреляция равна 0.

Также обратите внимание, что многие другие t-статистики для автокорреляций, показанных в таблице, значительно отличаются от 0. Следовательно, модель, показанная в Иллюстрации 28, неправильно определена, поэтому мы не можем полагаться на ее прогноз роста продаж.

Предположим, что мы добавляем сезонный лаг роста продаж (12-й лаг) в модель AR(1), чтобы оценить уравнение:

\( \text{Рост продаж}_t = b_0 + b_1 (\text{Рост продаж}_{t-1}) + b_2 (\text{Рост продаж}_{t-12}) + \epsilon_t \)

В этом примере, хоть мы и говорим, что период выборки начинается в 1995 году, мы используем предыдущие наблюдения для лагов. Это приводит к тому же количеству наблюдений независимо от количества лагов. Иллюстрация 29 содержит результаты расчета этого уравнения.

Расчетное значение сезонной автокорреляции (12-й автокорреляции) снизилось до -0.1168. Ни одна из первых 12 автокорреляций не имеет t-статистики с абсолютным значением, превышающим критическое значение 1.97 на уровне значимости 0.05.

Мы можем сделать вывод, что в остатках этой модели нет значимой сериальной корреляции. Поскольку мы можем обоснованно считать, что модель правильно определена, мы можем использовать ее для прогнозирования роста розничных продаж.

Обратите внимание, что \(R^2\) в Иллюстрации 29 составляет 0.6724, что намного больше, чем \(R^2\) в Иллюстрации 28 (расчет модели без сезонного лага).

Иллюстрация 28. Рост ежемесячных розничных продаж канадских мебельных магазинов: модель AR(1), январь 1995 -декабрь 2012.

Статистики регрессии

\( R^2 \)

0.0509

Стандартная ошибка

1.8198

Наблюдения

216

Статистика Дурбин-Уотсона

2.0956

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

1.0518

0.1365

7.7055

\( \text{Рост продаж}_{t-1} \)

-0.2252

0.0665

-3.3865

Автокорреляция остатков

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

-0.0109

0.0680

-0.1603

2

-0.1949

0.0680

-2.8662

3

0.1173

0.0680

1.7250

4

-0.0756

0.0680

-1.1118

5

-0.1270

0.0680

-1.8676

6

-0.1384

0.0680

-2.0353

7

-0.1374

0.0680

-2.0206

8

-0.0325

0.0680

-0.4779

9

0.1207

0.0680

1.7750

10

-0.2197

0.0680

-3.2309

11

-0.0342

0.0680

-0.5029

12

0.7620

0.0680

11.2059

Источник: Статистика Канады.


Как мы можем интерпретировать коэффициенты в этой модели?

Чтобы предсказать рост розничных продаж в данном месяце, мы должны знать рост розничных продаж в прошлом месяце и рост продаж 12 месяцев назад.

Если розничные продажи оставались постоянными как в прошлом месяце, так и 12 месяцев назад, то модель из Иллюстрации 29 предскажет, что розничные продажи будут расти с годовым темпом около 23.7% в данном месяце.

Если розничные продажи растут с годовым темпом 10% в прошлом месяце и с годовым темпом 5% 12 месяцев назад, модель в Иллюстрации 29 предскажет, что розничные продажи будут расти в текущем месяце с годовым темпом

0.2371 - 0.0792(0.10) + 0.7798(0.05) = 0.2682 или 26.8%.

Иллюстрация 28. Рост ежемесячных розничных продаж канадских мебельных магазинов: модель AR(1) с сезонными лагами, январь 1995 -декабрь 2012.

Статистики регрессии

\( R^2 \)

0.6724

Стандартная ошибка

1.0717

Наблюдения

216

Статистика Дурбин-Уотсона

2.1784

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

0.2371

0.0900

2.6344

\( \text{Рост продаж}_{t-1} \)

-0.0792

0.0398

-1.9899

\( \text{Рост продаж}_{t-12} \)

0.7798

0.0388

20.0979

Автокорреляция остатков

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

-0.0770

0.0680

-1.1324

2

-0.0374

0.0680

-0.5500

3

0.0292

0.0680

0.4294

4

-0.0358

0.0680

-0.5265

5

-0.0399

0.0680

-0.5868

6

0.0227

0.0680

0.3338

7

-0.0967

0.0680

-1.4221

8

0.1241

0.0680

1.8250

9

0.0499

0.0680

0.7338

10

-0.0631

0.0680

-0.9279

11

0.0231

0.0680

0.3397

12

-0.1168

0.0680

-1.7176

Источник: Статистика Канады.