Рассмотрим формулировку нулевой и альтернативной гипотезы о значении коэффициента наклона для линейной регрессии, а также принятие/отклонение нулевой гипотезы на заданном уровне значимости, - в рамках изучения количественных методов по программе CFA (Уровень II).
Мы можем использовать F-статистику для проверки значимости коэффициента наклона (то есть, насколько значительно он отличается от нуля), но мы также можем захотеть проверить другие гипотезы о коэффициенте наклона.
Например, насколько наклон всей совокупности отличается от конкретного значения или является ли наклон положительным.
Мы можем использовать F-распределенный статистический критерий для проверки таких гипотез о коэффициенте регрессии.
Предположим, мы хотим проверить оценку акций, используя рыночную модель. Мы предполагаем, что акции имеют средний систематический риск (то есть риск, аналогичный рыночному риску), представленный коэффициентом переменной доходности рынка.
Или мы можем захотеть проверить гипотезу о том, что прогнозы экономистов об уровне инфляции непредвзяты (то есть в среднем не переоценивают или недооценивают фактические показатели инфляции).
В каждом случае, как определить, подтверждают ли доказательства выдвинутую гипотезу?
На такие вопросы можно ответить с помощью проверки гипотез о коэффициенте наклона регрессии.
Чтобы проверить гипотезу о коэффициенте наклона, мы рассчитываем статистический критерий (test statistic), вычитая гипотетический наклон совокупности (\(B_1\)) из оценочного коэффициента наклона (\(\hat b_1\)), а затем делим эту разность на стандартную ошибку коэффициента наклона, \( s_{\hat b_1} \):
\( \dst t = { \hat b_1 - B_1 \over s_{\hat b_1} } \) (15)
Этот статистический критерий является F-распределенным с \(n - k -1\) или \(n - 2\) степенями свободы, потому что в регрессии оценивались два параметра (константа и наклон).
Стандартной ошибкой коэффициента наклона (\( s_{\hat b_1} \)) для простой линейной регрессии является отношение стандартной ошибки модели оценки (\( s_e \)) к квадратному корню от изменения независимой переменной:
\( \dst s_{\hat b_1} =
{ s_e \over \sqrt { \dst \sum^n_{i=1} (X_i - \overline X)^2 }
} \) (16)
Мы сравниваем рассчитанную t-статистику с критическими значениями для проверки гипотез. Обратите внимание, что чем больше изменчивость независимой переменной, тем меньше стандартная ошибка наклона (Формула 16) и, следовательно, тем больше рассчитанная t-статистика (Формула 15).
Если рассчитанная t-статистика выходит за рамки критических t-значений, мы отклоняем нулевую гипотезу, но если рассчитанная t-статистика находится в рамках критических значений, мы не можем отклонить нулевую гипотезу.
Подобно проверке гипотез о среднем значении, альтернативная гипотеза может быть двухсторонней или односторонней.
Рассмотрим наш предыдущий простой пример линейной регрессии с ROA в качестве зависимой переменной и CAPEX в качестве независимой переменной.
Предположим, мы хотим проверить, отличается ли коэффициент наклона CAPEX от нуля, чтобы подтвердить нашу догадку о значимой связи между ROA и CAPEX.
Мы можем проверить гипотезу о коэффициенте наклона, используя шестиступенчатый процесс, как показано в Иллюстрации 24. В результате этой проверки мы заключаем, что наклон отличается от нуля; то есть CAPEX в значительной мере объясняет переменную ROA.
Шаг 1 |
Сформулируйте гипотезы. |
\(H_0 : b_1 = 0 \) против \(H_{\alpha} : b_1 \neq 0 \) |
Шаг 2 |
Определите соответствующий статистический критерий. |
\( \dst t = { \hat b_1 - B_1 \over s_{\hat b_1} } \) с \(6 – 2 = 4\) степенями свободы. |
Шаг 3 |
Установите уровень значимости. |
\(\alpha\) = 5%. |
Шаг 4 |
Укажите правило решения. |
Критические t-значения = ±2.776. Мы можем определить это с помощью Excel:
R: qt(c(.025,.975),4) Python: библиотека scipy.stats import t
Мы отклоняем нулевую гипотезу, если рассчитанная t-статистика меньше -2.776 или более +2.776. |
Шаг 5 |
Рассчитайте статистический критерий. |
Коэффициент наклона составляет 1.25 (Иллюстрация 6). Среднеквадратическая ошибка составляет 11.96875 (Иллюстрация 22). Изменение CAPEX составляет 122,640 (Иллюстрация 6). \( s_e = \sqrt {11.96875} = 3.459588 \). \( s_{\hat b_1} = \dst {3.459588 \over \sqrt {122.640} } = 0.312398 \). \( t = \dst { 1.25 - 0 \over 0.312398 } = 4.00131 \). |
Шаг 6 |
Примите решение. |
Отклоните нулевую гипотезу о нулевом наклоне. Есть достаточно доказательств, чтобы утверждать, что коэффициент наклона отличается от нуля. |
Особенность простой линейной регрессии состоит в том, что t-статистика, используемая для проверки того, равен ли коэффициент наклона нулю, и t-статистика, используемая для проверки того, равна ли парная корреляция нулю (то есть \(H_0 : p = 0 \) против \(H_{\alpha} : p \neq 0 \) ), имеют одинаковые значения.
Как и в случае проверки гипотезы о наклоне, возможны как двусторонние, так и односторонние альтернативы для проверки корреляции. Например, \(H_0 : p \leq 0 \) против \(H_{\alpha} : p > 0 \).
Статистический критерий для проверки, равна ли корреляция нулю:
\( \dst
t = \dst { r \sqrt{n-2} \over \sqrt{1 - r^2} }
\)
В нашем примере, где ROA регрессирует по CAPEX, корреляция (\(r\)) составляет 0.8945. Чтобы проверить, отличается ли эта корреляция от нуля, мы проверяем гипотезу, как показано в Иллюстрации 25.
Как вы можете видеть, мы делаем вывод, аналогичный нашей проверке гипотезы о наклоне, но он сформулирован с точки зрения корреляции между ROA и CAPEX: существует значительная корреляция между ROA и CAPEX.
Шаг 1 |
Сформулируйте гипотезы. |
\(H_0 : p = 0 \) против \(H_{\alpha} : p \neq 0 \) |
Шаг 2 |
Определите соответствующий статистический критерий. |
\( \dst с \(6 – 2 = 4\) степенями свободы. |
Шаг 3 |
Установите уровень значимости. |
\(\alpha\) = 5%. |
Шаг 4 |
Укажите правило решения. |
Критические t-значения = ±2.776. Мы отклоняем нулевую гипотезу, если рассчитанная t-статистика меньше -2.776 или более +2.776. |
Шаг 5 |
Рассчитайте статистический критерий. |
\( t = \dst { 0.8945 \sqrt{4} \over \sqrt{1 – 0.8001} } = 4.00131 \). |
Шаг 6 |
Примите решение. |
Отклоните нулевую гипотезу, если нет корреляции. Есть достаточно доказательств, чтобы утверждать, что корреляция между ROA и CAPEX отличается от нуля. |
Другая интересная особенность простой линейной регрессии состоит в том, что статистический критерий, используемый для проверки соответствия модели (то есть, F-распределенного статистического критерия), связан с рассчитанной t-статистикой, используемой для проверки того, равен ли коэффициент наклона нулю:
\(t^2 = F\); следовательно, \(4.00131^2 = 16.0104\).
Что, если вместо этого мы хотим проверить, существует ли взаимосвязь один к одному между ROA и CAPEX, подразумевающая коэффициент наклона 1.0.
Гипотезы принимают вид:
\(H_0 : b_1 = 1 \) против \(H_{\alpha} : b_1 \neq 1 \) .
Рассчитанная t-статистика:
\( t = \dst {1.25 - 1 \over 0.312398 } = 0.80026 \)
Этот рассчитанный статистический критерий выходит за пределы критических значений, ±2.776, поэтому мы не можем отвергнуть нулевую гипотезу: нет достаточных доказательств, чтобы утверждать, что наклон отличается от 1.0.
Что, если вместо этого мы хотим проверить нашу догадку о том, есть ли положительный наклон или положительная корреляция?
В этом случае все шаги проверки будут такими же, как в Иллюстрациях 24 и 25, за исключением критических значений, потому что эти проверки гипотез односторонние. Для проверки положительного наклона или положительной корреляции критическое значение для 5% уровня значимости составляет +2,132.
Мы показываем проверку гипотез о положительном наклоне и положительной корреляции в Иллюстрации 26. Наш вывод заключается в том, что существует достаточное количество доказательств, подтверждающих как положительный наклон, так и положительную корреляцию.
Проверка наклона |
Проверка корреляции |
||
---|---|---|---|
Шаг 1 |
Сформулируйте гипотезы. |
\(H_0 : b_1 \leq 0 \) против \(H_{\alpha} : b_1 > 0 \) |
\(H_0 : p \leq 0 \) против \(H_{\alpha} : p > 0 \) |
Шаг 2 |
Определите соответствующий статистический критерий. |
\( \dst t = { \hat b_1 - B_1 \over s_{\hat b_1} } \) с \(6 – 2 = 4\) степенями свободы. |
\( \dst t = \dst { r \sqrt{n-2} \over \sqrt{1 - r^2} } \) с \(6 – 2 = 4\) степенями свободы. |
Шаг 3 |
Установите уровень значимости. |
\(\alpha\) = 5%. |
\(\alpha\) = 5%. |
Шаг 4 |
Укажите правило решения. |
Критическое t-значение = 2.132. Мы отклоняем нулевую гипотезу, если рассчитанная t-статистика больше 2.132. |
Критическое t-значение = 2.132. Мы отклоняем нулевую гипотезу, если рассчитанная t-статистика больше 2.132. |
Шаг 5 |
Рассчитайте статистический критерий. |
\( t = \dst { 1.25 - 0 \over 0.312398 } = 4.00131 \) |
\( t = \dst { 0.8945 \sqrt{4} \over \sqrt{1 – 0.8001} } = 4.00131 \). |
Шаг 6 |
Примите решение. |
Отклоните нулевую гипотезу. Есть достаточно доказательств, чтобы утверждать, что коэффициент наклона больше нуля. |
Отклоните нулевую гипотезу. Есть достаточно доказательств, чтобы утверждать, что корреляция больше нуля. |