Рассмотрим расчет и интерпретацию коэффициентов простой линейной регрессии (точка пересечения, наклон), а также сравнение перекрестной регрессии и регрессии временных рядов, - в рамках изучения количественных методов по программе CFA (Уровень II).
Точка пересечения или константа (intercept) - это значение зависимой переменной \(Y\), при котором независимая переменная \(X\) равна нулю. То есть, это точка, в которой линия регрессии пересекается с осью \(Y\).
Важно отметить, что в некоторых случаях это не имеет смысла, особенно когда в реальности невозможно, чтобы независимая переменная была равна нулю.
Например, если у нас есть модель, в которой объем денежной массы объясняет рост ВВП, точка пересечения не имеет значения, потому что на практике нулевая денежная масса невозможна.
Однако, если бы независимая переменная была ростом денежной массы, то точка пересечения имела бы смысл.
Наклон (slope) - это изменение зависимой переменной \(Y\) при изменении на одну единицу независимой переменной \(X\).
Предположим, что зависимая переменная \(Y\) выражена в миллионах евро, а независимая переменная \(X\) выражена в миллионах долларов США.
Если наклон 1.2 положительный, то:
Если наклон 1.2 отрицательный, то:
Используя модель регрессии ROA из Иллюстрации 6, мы интерпретируем полученные коэффициенты следующим образом:
Рентабельность активов (ROA) для компании составляет 4.875%, если компания не делает капитальных затрат (CAPEX).
Если CAPEX увеличивается на одну единицу (скажем, с 4% до 5%), то ROA увеличивается на 1.25%.
Используя оценочные коэффициенты регрессии, мы можем определить значения зависимой переменной, если они следуют средней зависимости между зависимыми и независимыми переменными.
В результате применения метода наименьших квадратов, линия регрессии будет построена так, чтобы ожидаемое значение остаточного члена (ошибки) было равно нулю:
\( E (\epsilon) = 0 \).
В Иллюстрации 7 мы показываем расчет прогнозируемой зависимой переменной и остаточного члена (residual) для каждого наблюдения в примере с ROA.
Обратите внимание, что сумма и среднее значение \(Y_i\) и \(\hat Y_i\) одинаковы, а сумма остатков равна нулю.
(1) |
(2) |
(3) |
(4) |
|
---|---|---|---|---|
Компания |
ROA |
CAPEX |
Прогнозируемая ROA |
(1) - (3) |
A |
6.0 |
0.7 |
5.750 |
0.250 |
B |
4.0 |
0.4 |
5.375 |
-1.375 |
C |
15.0 |
5.0 |
11.125 |
3.875 |
D |
20.0 |
10.0 |
17.375 |
2.625 |
E |
10.0 |
8.0 |
14.875 |
-4.875 |
F |
20.0 |
12.5 |
20.500 |
-0.500 |
Сумма |
75.0 |
36.6 |
75.000 |
0.000 |
Среднее значение |
12.5 |
6.1 |
12.5 |
0.000 |
Для компании \( C (i = 3) \),
\( \hat Y_i = \hat b_0 + \hat b_1 X_i + \epsilon_i \)
\( \hat Y_i = 4.875 + (1.25 \times 5.0) = 4.875 + 6.25 = 11.125 \)
\( Y_i - \hat Y_i = e_i = 15.0 - 11.125 = 3.875 \),
вертикальное расстояние в Иллюстрации 5.
Принимая во внимание, что по замыслу сумма остатков должна равняться нулю, в центре внимания линии регрессии в простой линейной регрессии находится минимизация суммы квадратных остаточных членов.
Регрессионный анализ использует два основных типа данных: перекрестные данные и временные ряды.
Перекрестная регрессия (cross-sectional regression) включает в себя множество наблюдений \(X\) и \(Y\) за тот же период времени.
Эти наблюдения могут поступить от разных компаний, классов активов, инвестиционных фондов, стран или других организаций, в зависимости от модели регрессии.
Например, перекрестная модель может использовать данные многих компаний, чтобы проверить, объясняет ли прогнозируемый рост EPS (прибыли на акцию) различия в коэффициенте цена/прибыль (PE) в течение определенного периода времени.
Обратите внимание, что если мы используем перекрестные наблюдения в регрессии, мы обычно обозначаем наблюдения как
\(i = 1, \ 2, \ \ldots \, \ n \).
В регрессии временных рядов (time-series regression) используется много наблюдений за разные периоды времени для одной и той же компании, одного класса активов, инвестиционного фонда, страны или другой организации, в зависимости от модели регрессии.
Например, модель временных рядов может использовать ежемесячные данные за много лет, чтобы проверить, определяет ли уровень инфляции в стране ее краткосрочные процентные ставки.
Если мы используем данные временных рядов в регрессии, мы обычно обозначаем наблюдения как:
\(t = 1, \ 2, \ \ldots \, \ T \).
Обратите внимание, что в последующих разделах мы в основном используем обозначение \(i = 1, \ 2, \ \ldots \, \ n \), даже для временных рядов.
Аналитик исследует взаимосвязь между чистой операционной рентабельностью компании и ее расходами на исследования и разработки.
Он собирает данные по отрасли и рассчитывает отношение расходов на исследования и разработки к доходам (RDR, Research and Development expenditures / Revenue), а также рентабельность по чистой прибыли (NPM, net profit margin) для восьми компаний.
В частности, он хочет объяснить различия, которые он наблюдает в рентабельности по чистой прибыли, используя различия, которые он наблюдает в расходах на исследования и разработки.
Собранные данные представлены в Иллюстрации 8.
Компания |
NPM (%) |
RDR (%) |
---|---|---|
1 |
4 |
8 |
2 |
5 |
10 |
3 |
10 |
6 |
4 |
9 |
5 |
5 |
5 |
7 |
6 |
6 |
9 |
7 |
12 |
5 |
8 |
3 |
10 |
Решения:
1. Коэффициент наклона для регрессионной модели составляет \(-1.3 \), а детали расчета показаны в Иллюстрации 9.
Компания |
NPM |
RDR (%) \(X_i\) |
\( Y_i - \overline Y \) |
\( X_i - \overline X \) |
\( (Y_i - \overline Y)^2 \) |
\( (X_i - \overline X)^2 \) |
\( (Y_i - \overline Y)( X_i - \overline X) \) |
---|---|---|---|---|---|---|---|
1 |
4 |
8 |
-2.8 |
0.5 |
7.5625 |
0.25 |
-1.375 |
2 |
5 |
10 |
-1.8 |
2.5 |
3.0625 |
6.25 |
-4.375 |
3 |
10 |
6 |
3.3 |
-1.5 |
10.5625 |
2.25 |
-4.875 |
4 |
9 |
5 |
2.3 |
-2.5 |
5.0625 |
6.25 |
-5.625 |
5 |
5 |
7 |
-1.8 |
-0.5 |
3.0625 |
0.25 |
0.875 |
6 |
6 |
9 |
-0.8 |
1.5 |
0.5625 |
2.25 |
-1.125 |
7 |
12 |
5 |
5.3 |
-2.5 |
27.5625 |
6.25 |
-13.125 |
8 |
3 |
10 |
-3.8 |
2.5 |
14.0625 |
6.25 |
-9.375 |
Сумма |
54.0 |
60.0 |
0.0 |
0.0 |
71.5000 |
30.00 |
-39.0 |
Среднее арифметическое |
6.75 |
7.5 |
Коэффициент наклона:
\( \dst \hat b_1 = {-39 \over 30} = -1.3 \)
2. Точка пересечения регрессионной модели составляет 16.5:
\( \dst \hat b_0 = 6.75 - (-1.3 \times 7.5) = 6.75 + 9.75 = 16.5 \)
3. Модель регрессии представлена формулой:
\( \dst \hat Y_i = 16.5 - 1.3 X_i + \epsilon_i \)
4. Парная корреляция составляет -0.8421:
\( \dst
r = {-39 \big / 7 \over \sqrt{71.5 \big / 7} \sqrt{30 \big / 7} }
= { -5.5714 \over (3.1960)(2.0702) } = -0.8421 \).
Аналитик рассчитал модель, в которой рентабельность акционерного капитала (ROE) регрессирует по ее перспективам роста (GO, growth opportunities).
GO определяется как трехлетний годовой темп роста продаж компании.
В модели использованы данные за 20 лет. В результате он получил следующую простую линейную регрессию:
\( \dst {\rm ROE}_i = 4 + 1.8 {\rm GO}_i + \epsilon_i \).
Обе переменные указаны в процентах, поэтому наблюдение GO в 5% представлено как 5.
1. Прогнозируемое значение ROE компании, если GO составляет 10%, ближе всего к:
2. Изменение ROE при изменении GO в диапазоне от 5% до 6%, ближе всего к:
3. Остаток, в случае, если GO равна 8%, а наблюдаемая ROE равна 21%, ближе всего к:
Решения.
1. Ответ C правильный. Прогнозируемое значение:
\( \dst {\rm ROE}_i = 4 + (1.8 \times 10) = 22 \).
2. Ответ A правильный. Коэффициент наклона 1.8 является ожидаемым изменением зависимой переменной (ROE) для изменения на одну единицу независимой переменной (GO).
3. Ответ B правильный. Прогнозируемое значение:
\( \dst {\rm ROE}_i = 4 + (1.8 \times 8) = 18.4 \).
Наблюдаемое значение ROE составляет 21, поэтому остаток составляет \( 2.6 = 21.0 - 18.4 \).