Проверка статистических гипотез о значении коэффициента корреляции позволяет оценить, является ли связь между двумя случайными величинами результатом случайности. Рассмотрим эту методику в рамках изучения количественных методов по программе CFA.
В инвестиционной практике, нам часто приходится оценивать силу линейной зависимости между двумя переменными величинами - корреляцию между ними. Общий подход заключается в использовании коэффициента корреляции.
Проверка гипотез о значении коэффициента корреляции позволяет оценить, является ли связь между двумя случайными величинами результатом случайности. Если мы решим, что связь не случайна, мы склонны использовать эту информацию в прогнозах, потому что хороший прогноз одной переменной величины поможет нам предсказать другую переменную величину.
Если коэффициент корреляции между двумя переменными величинами равен нулю, мы заключаем, что не существует линейной зависимости между этими величинами.
Мы используем проверку гипотез для оценки того, насколько значительно отличается коэффициент корреляции от нуля.
После того, как мы рассчитали коэффициент корреляции, мы должны задаться вопросом, есть ли существенное отличие его значения от 0. Прежде чем мы сможем ответить на этот вопрос, мы должны выяснить, что представляет собой распределение совокупности базовых переменных величин.
Для простоты предположим, что обе переменные нормально распределены.
На самом деле, мы должны считать, что каждое наблюдение \((x, y)\) двух переменных величин \((X, Y)\) является случайным наблюдением из двумерного нормального распределения.
В двумерном нормальном распределении (англ. 'bivariate normal distribution'), т.е. нормальном распределении двух переменных величин, каждая отдельная переменная имеет нормальное распределение и их взаимосвязь полностью описываются коэффициентом корреляции \(\rho\) между ними.
Для получения более подробной информации см., например, Daniel и Terrell (1995) и Greene (2018).
Мы предлагаем две гипотезы:
нулевую гипотезу \(H_0\), о том, что корреляция в совокупности равна 0 (\(\rho = 0)\); и
альтернативную гипотезу \(H_a\) о том, что корреляция в совокупности отличается от 0 (\(\rho \neq 0)\).
Альтернативная гипотеза является проверкой того, что корреляция не равна 0; поэтому, здесь целесообразна двусторонняя проверка. Если эти две переменные распределены нормально, мы можем проверить, следует ли отвергнуть нулевую гипотезу будет, используя выборочный коэффициент корреляции \(r\).
Формула для t-теста:
\(\dst \large t = {r \sqrt{n-2} \over \sqrt{1-r^2}} \) (Формула 17)
Эта тестовая статистика имеет t-распределение Стьюдента с \(n - 2\) степенями свободы, если нулевая гипотеза верна.
Практически важной особенностью Формулы 17 является то, что величина \(r\), необходимая, чтобы отклонить нулевую гипотезу \(H_0: \rho = 0 \), уменьшается по мере возрастания размера выборки \(n\), по двум причинам.
Так, например, при размере выборки \(n = 12\), корреляция \(r = 0.58\) дает t-статистику 2.252, которая является едва значимой при уровне значимости 0.05 (\(t_c = 2.228\)).
При размере выборки \(n = 32\), меньшая выборочная корреляция \(r = 0.35\) дает t-статистику 2.046, которая едва значима при уровне значимости 0.05 (\(t_c = 2.042\)). Коэффициент корреляции \(r = 0.35\) не будет значимым для выборки размером 12, даже на уровне значимости 0.10.
При отборе выборок из одной и той же совокупности, ложная нулевая гипотеза \(H_0: \rho = 0\), скорее всего, будет отвергнута, если мы увеличим размер выборки, при прочих равных условиях, так как большее количество наблюдений увеличивает числитель тестовой статистики.
Выборочная корреляция между месячной доходностью британского фунта (GBP) к японской иене (JPY) и канадскому доллару (САВ) составляет 0.5132 за период с января 2011 по декабрь 2017 года (Источник данных об обменных курсах: http://fx.sauder.ubc.ca/ ).
Можно ли отклонить нулевую гипотезу о том, что корреляция по совокупности равна 0 при уровне значимости 0.05?
Решение:
Для периода в 84 месяца с января 2011 года по декабрь 2017 года, мы используем следующую статистику, чтобы проверить нулевую гипотезу \(H_0\) о том, что истинная корреляция по совокупности равна 0, против альтернативной гипотезы \(H_a\) о том, что корреляция по совокупности отличается от 0:
\(\dst t = {0.5132 \sqrt{84-2} \over \sqrt{1-0.5132^2} } = 5.4146 \)
В таблицах t-распределений мы найдем, что при уровне значимости 0.05, критическим значением для этой тестовой статистики будет 1.99 (\(n = 84\), значение степеней свободы = 82).
Если тестовая статистика либо больше 1.99, либо меньше -1.99, мы можем отвергнуть гипотезу о том, что корреляция по совокупности равна 0. Тестовая статистика равна 5.4146, поэтому мы можем отклонить нулевую гипотезу.