Мы говорим, что временной ряд показывает возврат к среднему или реверсию к среднему (англ. 'mean reversion'), если он имеет тенденцию снижаться, когда его уровень выше среднего значения ряда и повышаться, когда его уровень ниже среднего.

Подобно температуре в комнате, контролируемой термостатом, временные ряды с реверсией к среднему, как правило, возвращаются к своему долгосрочному среднему значению.

Как мы можем определить значение, к которому стремится временной ряд?

Если временной ряд в настоящий момент находятся на уровне возврата к среднему, модель предсказывает, что значение временного ряда будет таким же в следующем периоде.

На уровне возврата к среднему у нас есть связь:

\( x_{t+1} = x_t \).

Для модели AR(1) (\( x_{t+1} = b_0 + b_1 x_t \)) равенство \( x_{t+1} = x_t \) подразумевает уровень \( x_t = b_0 + b_1 x_t \) или то, что уровень возврата к среднему \(x_t\) определяется как:

\( \dst x_t = { b_0 \over 1 - b_1 } \)

Таким образом, модель AR(1) предсказывает, что временной ряд останется прежним, когда его текущее значение, \( b_0 \big / (1 - b_1) \), увеличивается, если его текущее значение ниже \( b_0 \big / (1 - b_1) \) и уменьшается, если ее текущее значение выше \( b_0 \big / (1 - b_1) \).

В случае валовой рентабельности Intel, уровень возврата к среднему для модели, показанной в Иллюстрации 12, составляет:

0.1513/(1 - 0.7462) = 0.5961.

Если текущая валовая рентабельность выше 0.5961, модель предсказывает, что валовая рентабельность снизится в следующем периоде. Если текущая валовая рентабельность ниже 0.5961, модель предсказывает, что валовая рентабельность будет расти в следующем периоде.

Как мы обсудим позже, все ковариантно стационарные временные ряды имеют конечный уровень возврата к среднему.

Прогнозы на несколько периодов и цепное правило прогнозирования.

Финансовые аналитики часто нуждаются в прогнозах на более чем один период. Например, мы могли бы использовать модель квартальных продаж для прогнозирования продаж компании на каждый из следующих четырех кварталов.

Чтобы использовать модель временного ряда для создания прогнозов на несколько периодов, мы должны изучить, как выполнять многопериодные прогнозы (англ. 'multiperiod forecast'), используя модель AR(1).

Прогноз \(x_t\) на один период с помощью модели AR(1) выглядит следующим образом:

\( \dst \hat x_{t+1} = \hat b_0 + \hat b_1 x_t \) (6)

Если мы хотим получить прогноз для следующего периода \(x_{t+2}\), наш прогноз будет:

\( \dst \hat x_{t+2} = \hat b_0 + \hat b_1 x_{t+1} \) (7)

К сожалению, мы не знаем \(x_{t+1}\) в периоде \(t\), поэтому мы не можем использовать Уравнение 7 напрямую, чтобы сделать прогноз на два периода. Однако мы можем использовать наш прогноз \(x_{t+1}\) и модель AR(1), чтобы сделать прогноз \(x_{t+2}\).

Цепное правило прогнозирования (англ. 'chain rule of forecasting') - это процесс, при котором значение следующего периода, предсказанное уравнением, подставляется в уравнение, чтобы получить прогнозируемое значение на два периода вперед.

Используя цепное правило прогнозирования, мы можем подставить прогнозируемое значение \(x_{t+1}\) в Уравнение 7, чтобы получить:

\( \dst \hat x_{t+2} = \hat b_0 + \hat b_1 \hat x_{t+1} \).

Мы уже знаем \(\hat x_{t+1}\) из нашего прогноза на один период, полученного с помощью Уравнения 6. Теперь у нас есть простой способ прогнозирования \(x_{t+2}\).

Многопериодные прогнозы являются более неопределенными, чем однопериодные прогнозы, потому что каждый прогнозируемый период имеет свою неопределенность. Например, при прогнозировании \(x_{t+2}\) мы сначала имеем неопределенность, связанную с прогнозированием \(x_{t+1}\) на основе \(x_t\), а затем у нас есть неопределенность, связанная с прогнозированием \(x_{t+2}\) на основе \(x_{t+1}\).

В целом, чем больше периодов в прогнозе, тем более он неопределенный. Обратите внимание, что если модель прогнозирования хорошо определена, ошибки прогноза из модели не будут сериально коррелировать.

Если ошибки прогнозирования за каждый период не являются сериально коррелированными, то дисперсия многопериодного прогноза будет выше, чем дисперсия однопериодного прогноза.

Пример 5. Прогнозирование валовой рентабельности Intel на несколько периодов.

Предположим, что в начале 2020 года мы хотим предсказать валовую рентабельность Intel на два периода вперед, используя модель, показанную в Иллюстрации 12. Предположим, что валовая рентабельность Intel в текущем периоде составляет 63%.

Однопериодный прогноз валовой рентабельности Intel на основе этой модели:

0.6214 = 0.1513 + 0.7462(0.63).

Подставив полученный однопериодный прогноз 0.6214 в уравнение регрессии, мы можем получить следующий прогноз на два периода:

0.6150 = 0.1513 + 0.7462(0.6214).

Следовательно, если текущая валовая рентабельность Intel составляет 63%, модель предсказывает, что через 2 квартала валовая рентабельность Intel составит 61.50%.

Пример 6. Моделирование инфляции Индекса потребительских цен США.

Аналитик Лизетт Миллер получила задание построить модель временных рядов для ежемесячной инфляции США. Инфляция и ожидания в отношении инфляции, конечно, оказывают значительное влияние на доходность облигаций.

Выборку за 24-летний период, с января 1995 года по декабрь 2018 года, она выбирает в качестве данных, отражающих ежемесячное процентное изменение Индекса потребительских цен (CPI).

Какую модель должна использовать Миллер?

Процесс выбора модели аналогичен Примеру 4, посвященному валовой рентабельности Intel.

Сначала Миллер оценивает модель AR(1), используя коэффициент инфляции за предыдущий месяц в качестве независимой переменной:

\( \text{Инфляция}_t = b_0 + b_1 (\text{Инфляция}_{t-1})
+ \epsilon_t\), \(t = 1,2, \ldots , 359\).

Чтобы оценить эту модель, она использует ежемесячные данные об инфляции с января 1995 года по декабрь 2018 года (\(t=1\) обозначает февраль 1995 г.). Иллюстрация 13 показывают результаты оценки этой модели.

Иллюстрация 13. Ежемесячная инфляция CPI по годовой ставке: модель AR(1) - Ежемесячные наблюдения, февраль 1995 г. - декабрь 2018 г.

Статистики регрессии

\( R^2 \)

0.1586

Стандартная ошибка

2.9687

Наблюдения

287

Статистика Дурбина-Уотсона

1.8442

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

1.3346

0.2134

6.2540

\(\text{Инфляция}_{t-1}\)

0.3984

0.0544

7.3235

Автокорреляция остатков

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

0.0777

0.0590

1.3175

2

-0.1653

0.0590

-2.8013

3

-0.1024

0.0590

-1.7362

4

-0.0845

0.0590

1.4324

Источник: Бюро статистики труда США.


Как показывает Иллюстрация 13, как точка пересечения (\(\hat b_0 = 1.3346\)), так и коэффициент по первому запаздывающему значению инфляции (\(\hat b_1 = 0.3984\)) имеют высоко статистическую значимость, с большими t-статистиками.

При 287 наблюдениях и двух параметрах эта модель имеет 285 степеней свободы. Критическое значение для t-статистики на уровне значимости 0.05 составляет около 1.97.

Следовательно, Миллер может отклонить отдельные нулевые гипотезы о том, что точка пересечения равна 0 (\(b_0 = 0\)) и коэффициент по первому временному лагу равен 0 (\(b_1 = 0\)) в пользу альтернативной гипотезы о том, что эти коэффициенты по отдельности не равны 0.

Обоснованы ли эти статистические данные?

Миллер узнает это, когда проверит, являются ли остатки этой модели сериально коррелированными. При 287 наблюдениях в этой выборке стандартная ошибка для каждой из рассчитанных автокорреляций составляет:

\( \dst 1 \Big/ \sqrt{287} = 0.0590 \).

Критическое значение для t-статистики составляет 1.97. Поскольку вторая рассчитанная автокорреляция имеет t-статистику более 1.97 в абсолютном значении, Миллер приходит к выводу, что автокорреляции значительно отличаются от 0.

Таким образом, эта модель неправильно определена, потому что остатки сериально коррелируют.

Если остатки в авторегрессионной модели сериально коррелируют, Миллер может устранить корреляцию, добавив в расчет модели большее количество лагов зависимой переменной в качестве объясняющих переменных.

Иллюстрация 14 показывает результат оценки второй модели AR(2) с использованием тех же данных, что и в анализе, показанном в Иллюстрации 13.

При 286 наблюдениях и трех параметрами эта модель имеет 283 степени свободы. Поскольку степени свободы практически такие же, как и в расчете, показанном в Иллюстрации 13, критическое значение t-статистики на уровне значимости 0.05 также почти такое же (1.97).

Оценивая уравнение с двумя лагами:

\( \text{Инфляция}_t = b_0 + b_1 (\text{Инфляция}_{t-1}) + \epsilon_t\),

Миллер обнаруживает, что все три коэффициента регрессионной модели (точка пересечения и коэффициенты по двум лагам зависимой переменной) значительно отличаются от 0.

В нижней части Иллюстрации 14 показано, что ни одна из первых четырех автокорреляций остатка не имеет t-статистики, большей в абсолютном значении, чем критическое значение 1.97.

Следовательно, Миллер не может отклонить гипотезу о том, что отдельные автокорреляции остатка равны 0. Она приходит к выводу, что эта модель правильно определена, поскольку не находит доказательств сериальной корреляции в остатках.

Иллюстрация 14. Ежемесячная инфляция CPI по годовой ставке: модель AR(2) - Ежемесячные наблюдения, февраль 1995 г. - декабрь 2018 г.

Статистики регрессии

\( R^2 \)

0.1907

Стандартная ошибка

2.9208

Наблюдения

286

Статистика Дурбина-Уотсона

1.9934

Коэффициент

Стандартная
ошибка

t-статистика

Точка пересечения

1.5996

0.2245

7.1252

\(\text{Инфляция}_{t-1}\)

0.4759

0.0583

8.1636

\(\text{Инфляция}_{t-2}\)

-0.1964

0.0583

-3.368

Автокорреляция остатков

Задержка
(Временной лаг)

Автокорреляция

Стандартная
ошибка

t-статистика

1

0.0032

0.0591

0.0536

2

0.0042

0.0591

0.0707

3

-0.0338

0.0591

-0.5696

4

0.0155

0.0591

1.7692

Источник: Бюро статистики труда США.


Аналитик выбрал модель AR(2), потому что остатки модели AR (1) были сериально коррелированы.

Предположим, что в определенный месяц инфляция составляла 4% по годовой ставке за предыдущий месяц и 3% по ставке за месяц до этого.

Какова была бы разница в прогнозе инфляции на этот месяц, если бы Миллер использовала модель AR(1) вместо модели AR(2)?


Решение:

Модель AR(1), показанная в Иллюстрации 13, предсказывала, что инфляция в следующем месяце составит 1.3346 + 0.3984(4) = 2.93% приблизительно, тогда как модель AR(2), показанная в Иллюстрации 14, предсказала инфляцию:

1.5996 + 0.4759(4) - 0.1964(3) = 2.91% приблизительно.

Если бы аналитик использовал неверную модель AR(1), она бы предсказала инфляцию на 2 б.п. выше (2,93% против 2,91%), чем при использовании модели AR(2).

Хотя в этом случае разница в прогнозируемой инфляции на самом деле очень мала, этот сценарий показывает, что использование неверного прогноза может отрицательно повлиять на качество инвестиционных решений аналитика.