Финансовым аналитикам часто приходится использовать результаты регрессии, чтобы делать прогнозы о зависимой переменной.

Например, мы можем задаться вопросом: «Как быстро будут расти продажи корпорации XYZ в этом году, если реальный ВВП вырастет на 4%?»

Но мы не просто заинтересованы в получении таких прогнозов; мы также хотим знать, насколько мы можем быть уверены в результатах прогнозов.

Прогнозируемое значение зависимой переменной Y^f  определяется с использованием оценочных значений точки пересечения (константы) и наклона, а также ожидаемого или прогнозируемого значения независимой переменной Xf:

Y^f=b^0+b^1Xf (18)

В нашей модели регрессии ROA (рентабельность активов) если мы прогнозируем, что CAPEX компании составляет 6%, то прогнозируемая ROA в соответствии с Формулой 18 составит 12.375%:

Y^f=4.815+(1.25×6)=12.375

Тем не менее, мы должны учитывать, что оценочная линия регрессии не описывает взаимосвязь между зависимыми и независимыми переменными; это среднее значение взаимосвязи между двумя переменными. Это очевидно, потому что не все остатки равны нулю.

Следовательно, для отражения этой неопределенности необходима интервальная оценка прогноза. Расчетная дисперсия ошибки прогнозирования sf2 переменной Y при независимой переменной X равна:

sf2=se2[1+1n+(XfX)2(n1)sX2]=se2[1+1n+(XfX)2i=1n(XiX)2],

а стандартная ошибка прогноза:

sf=se1+1n+(XfX)2i=1n(XiX)2  (19)

Стандартная ошибка прогноза зависит от:

  • стандартной ошибки оценки se;
  • количества наблюдений n;
  • прогнозируемого значения независимой переменной Xf, используемого для прогнозирования зависимой переменной и ее отклонения от оценочного среднего X; а также
  • изменения независимой переменной.

Из формулы для стандартной ошибки прогноза мы можем увидеть следующее:

  1. Чем лучше подбор модели регрессии, тем меньше стандартная ошибка оценки (se) и, следовательно, тем меньше стандартная ошибка прогноза.
  2. Чем больше размер выборки (n) в расчете регрессии, тем меньше стандартная ошибка прогноза.
  3. Чем ближе прогнозируемая независимая переменная (Xf) к среднему значению независимой переменной (X), используемой в расчете регрессии, тем меньше стандартная ошибка прогноза.

Когда мы получим эту оценку стандартной ошибки прогноза, нам необходимо определить интервал прогнозирования зависимой переменной ( Y^f ). Это очень похоже на оценку доверительного интервала параметра.

Интервал прогнозирования равен:

Y^f±t крит. для  α/2Sf  (20)

Мы описываем шаги для определения интервала прогнозирования в Иллюстрации 31.

Иллюстрация 31. Создание интервала прогнозирования зависимой переменной.

1

Прогнозируйте значение Y, Y^f, учитывая прогнозируемое значение X, Xf.

2

Выберите уровень значимости α для интервала прогнозирования.

3

Определите критическое значение для интервала прогнозирования, основанного на степени свободы и уровне значимости.

4

Рассчитайте стандартную ошибку прогноза.

5

Рассчитайте (1α) процентный интервал прогнозирования: Y^f±t крит. для  α/2Sf.

Учитывая, что прогнозируемое значение CAPEX составляет 6.0, прогнозируемое значение Y для нашей регрессионной модели ROA составляет 12.375:

Y^f=4.815+1.25Xf=4.875+(1.25×6.0)=12.375.

Предполагая, что уровень значимости (α) равен 5%, с n2 степенями свободы (df = 4), критические значения для интервала прогнозирования составляют ±2.776.

Стандартная ошибка прогноза:

sf=3.4595881+16+(66.1)2122.640=3.4595881.166748=3.736912.

Затем 95% интервал прогнозирования становится:

12.375±2.776(3.736912)

12.375±10.3737

{2.0013<Y^f<22.7487}

В нашем примере регрессии ROA мы можем увидеть, как изменяется стандартная ошибка прогноза (sf), поскольку наше прогнозируемое значение независимой переменной становится дальше от среднего значения независимой переменной (XfX) в Иллюстрации 32.

Среднее значение CAPEX равно 6.1%, и диапазон, который представляет одну стандартную ошибку прогноза, выше и ниже прогноза, сводится к минимуму в этой точке, и увеличивается, когда независимая переменная удаляется от X.

Иллюстрация 32. Прогнозы ROA и стандартная ошибка прогноза.

Прогнозы ROA и стандартная ошибка прогноза.
Прогнозы ROA и стандартная ошибка прогноза.

Пример 7. Прогнозирование чистой рентабельности с использованием расходов на исследования и разработки.

Предположим, мы хотим прогнозировать рентабельность по чистой прибыли компании (NPM, net profit margin) на основе ее расходов на исследования и разработки, масштабируемые ее выручкой (RDR), используя модель из Примера 2 и данные, представленные в Иллюстрации 8.

Регрессионная модель рассчитана с использованием данных о восьми компаниях следующим образом:

Y^f=16.51.3Xf.

со стандартной ошибкой оценки (se) 1.8618987 и дисперсией RDR 4.285714, рассчитанной по формуле

i=1n(XiX)2(n1).

  1. Каково прогнозируемое значение NPM, если прогнозируемое значение RDR составляет 5?
  2. Какова стандартная ошибка прогноза (sf), если прогнозируемое значение RDR составляет 5?
  3. Каков 95% интервал прогнозирования для прогнозируемого значения NPM, при использовании критических t-значений (df = 6) ±2.447?
  4. Каково прогнозируемое значение NPM, если прогнозируемое значение RDR составляет 15?
  5. Какова стандартная ошибка прогноза, если прогнозируемое значение RDR составляет 15?
  6. Каков 95% интервал прогнозирования для прогнозируемого значения NPM, при использовании критических t-значений (df = 6) ±2.447?

Решение.

  1. Прогнозируемое значение NPM равно 10:

16.5(1.3×5)=10.

  1. Чтобы получить стандартную ошибку прогноза (sf), мы сначала должны рассчитать дисперсию RDR. После этого у нас есть все значения для расчета sf:

i=1n(XiX)2=4.285714×7=30.

sf=1.86189871+18+(57.5)230=2.1499.

  1. 95% интервал прогнозирования для прогнозируемого значения NPM составит:

{10±2.447(2.1499)}

{4.7392<Y^f<15.2608}

  1. Прогнозируемое значение NPM равно -3:

16.5(1.3×15)=3.

  1. Чтобы получить стандартную ошибку прогноза, мы сначала должны рассчитать изменение RDR. После этого мы можем рассчитать sf:

i=1n(XiX)2=4.285714×7=30.

sf=1.86189871+18+(157.5)230=3.2249.

  1. 95% интервал прогнозирования для прогнозируемого значения NPM составит:

{3±2.447(3.2249)}

{10.8913<Y^f<4.8913}