Проверка гипотез о разнице между дисперсиями выполняется с использованием F-распределения и часто применяется для анализа различий в изменчивости показателей разных временных периодов. Рассмотрим эту методику в рамках изучения количественных методов по программе CFA.
Предположим, у нас есть гипотеза об относительных значениях дисперсий двух нормально распределенных совокупностей со средними \(\mu_1\) и \(\mu_1\) и дисперсиями \(\sigma^2_1\) и \(\sigma^2_2\). Мы можем сформулировать все гипотезы в виде следующих вариантов:
Обратите внимание, что в точке равенства, нулевая гипотеза \(\sigma^2_1 = \sigma^2_2\) означает, что отношение дисперсий равно 1: \( \sigma^2_1 \big / \sigma^2_2 = 1 \). При независимых случайных выборках из этих совокупностей, проверки, связанные с этими гипотезами, основаны на F-тесте (англ. 'F-test'), который представляет собой отношение выборочных дисперсий.
Предположим, что мы используем \(n_1\) наблюдений при расчете выборочной дисперсии \( \sigma^2_1\) и \(n_2\) наблюдений при расчете выборочной дисперсии \( \sigma^2_2\).
Проверки гипотез о разнице между дисперсиями двух совокупностей выполняются с использованием F-распределения.
Как и хи-квадрат распределения, F-распределение представляет собой семейство асимметричных распределений, ограниченных снизу 0. Каждое F-распределение определяется двумя значениями степеней свободы, называемыми степенями свободы для числителя и степенями свободы для знаменателя.
Взаимосвязь между хи-квадрат распределением и F-распределением выглядит следующим образом:
Если \( \chi^2_1\) является одной хи-квадрат случайной величиной с \(m\) степенями свободы и \( \chi^2_2\) является другой хи-квадрат случайной величиной с \(n\) степенями свободы, то \(F = \big ( \chi^2_1 /m \big ) \Big / \big ( \chi^2_2 /n \big ) \) следует F-распределение со степенями свободы для числителя \(m\) и степенями свободы для знаменателя \(n\).
F-тест, как и критерий хи-квадрат, не устойчив к нарушениям его допущений.
Предположим, у нас есть два выборки, первая с \(n_1\) наблюдений и выборочной дисперсией \(s^2_1\), и вторая с \(n_2\) наблюдений и выборочной дисперсией \(s^2_2\).
Выборки являются случайными, независимыми друг от друга, и отобраны из нормально распределенных совокупностей. Проверка различий между дисперсиями двух совокупностей основана на соотношении выборочных дисперсий:
\( \large \dst { F = {\chi^2_1 \over \chi^2_2} } \) (Формула 16)
с \( {\rm df}_1 = n_1 - 1\) степенями свободы для числителя и \( {\rm df}_2 = n_2 - 1\) степенями свободы для знаменателя. Обратите внимание, что \( {\rm df}_1\) и \( {\rm df}_2\) являются делителями, используемыми при расчете \(s^2_1\) и \(s^2_2\) соответственно.
По соглашению или в обычной практике, в качестве фактической тестовой статистики используется большее из двух соотношений:
\( \sigma^2_1 \big / \sigma^2_2 \) и \( \sigma^2_2 \big / \sigma^2_1 \).
Когда мы следуем этому соглашению, значение тестовой статистики всегда больше или равно 1. Соответственно, таблицы критических значений F должны включать только значения больше или равные 1.
В соответствии с этим соглашением, критическим значением для любой формулировки гипотез является одно значение в правой части соответствующего F-распределения.
Обратите внимание, что маркировка совокупностей как «1» или «2» произвольна в любом случае.
Следуя соглашению об использовании большего из двух соотношений \( \sigma^2_1 \big / \sigma^2_2 \) и \( \sigma^2_2 \big / \sigma^2_1 \), рассмотрим два случая:
Таким образом, если мы проводим двустороннюю проверку при уровне значимости \(\alpha = 0.01\), нам необходимо найти критическое значение в F-таблицах при уровне значимости \(\alpha/2 = 0.01/2 = 0.005\) для односторонней проверки (Случай 1). Но односторонняя проверка при уровне значимости 0.01 использует критические значения из F-таблиц для \(\alpha = 0.01\) (Случай 2).
В качестве примера предположим, что мы проводим двусторонний тест на уровне значимости 0.05. Мы вычислили значение \(F\) равное 2.77 со степенями свободы 12 для числителя и 19 степенями свободы для знаменателя.
Используя F-таблицу для 0.05 / 2 = 0.025, мы найдем критическое значение 2.72. Поскольку значение 2.77 больше, чем 2.72, мы отвергаем нулевую гипотезу на уровне значимости 0.05.
Если бы мы не следовали соглашению, описанному выше, и получили бы расчетное значение F меньше 1, то могли бы мы по-прежнему использовать F-таблицы?
Ответ: да. Используя свойство обратной зависимости F-статистики, можно рассчитать необходимое значение. Самый простой способ объяснить это свойство - показать пример расчета.
Предположим, что для двусторонней проверки выбранный уровень значимости составляет 0.05, и мы имеем значение F = 0.11, с 7 степенями свободы для числителя и 9 степенями свободы для знаменателя.
Мы находим обратное значение: 1/0.11 = 9.09.
Затем мы ищем это значение в F-таблице для уровня значимости 0.025 (поскольку это двусторонняя проверка) со степенями свободы в обратном порядке (т.е. меняем местами числитель и знаменатель): 9 для числителя и 7 для знаменателя.
Другими словами, \( F_{9,7} = 1 / F_{9,7} \) и 9.09 превышает критическое значение 4.82, поэтому \( F_{9,7} = 0.11 \) при уровне значимости 0.05.
Вы исследуете, изменилась ли дисперсия доходности индекс фондового рынка Южной Кореи KOSPI после глобального финансового кризиса, который достиг пика в 2008 году.
Для этого исследования, вы рассматриваете данные с 1999 по 2006 год, как за докризисный период, и с 2010 по 2017 год, как за посткризисный период.
Вы собираете данные, представленные в Таблице 9, которые включают доходность за 418 недель с 1999 по 2006 год и за 418 недель с 2010 до 2017 год. Вы определили уровень значимости 0.01.
n |
Средняя еженедельная доходность (%) |
Дисперсия доходности |
|
---|---|---|---|
До кризиса: с 1999 по 2006 год |
418 |
0.307 |
18.203 |
После кризиса: 2010 по 2017 год |
418 |
0.114 |
3.919 |
Источник данных о доходности: finance.yahoo.com по состоянию на 19 августа 2018.
Решение для части 1:
У нас есть альтернативная гипотеза «не равно»:
\(H_0: \sigma^2_{\text{до}} = \sigma^2_{\text{после}}\) против \(H_a: \sigma^2_{\text{до}} \neq \sigma^2_{\text{после}}\)
Решение для части 2:
Для того, чтобы проверить нулевую гипотезу о равенстве двух дисперсий, мы используем \( F = {\sigma^2_1 \Big / \sigma^2_2} \) с 418 - 1 = 417 степенями свободы для числителя и знаменателя.
Решение для части 3:
Выборочная дисперсия «до» больше, поэтому, следуя соглашению для расчета F-статистики, выборочная дисперсия «до» попадает в числитель:
\(F = 18.203 / 3.919 = 4.645\)
Поскольку это двусторонняя проверка, мы используем F-таблицы для уровня значимости 0.005 (=0.01/2), чтобы получить значение для уровня значимости 0.01.
Самое близкое значение к 417 степеням свободы составляет 120 степеней свободы. На уровне значимости 0.01, критическим значением будет 1.61.
Поскольку 4.645 больше, чем критическое значение 1.61, мы отвергаем нулевую гипотезу о том, что дисперсия доходности по совокупности является одинаковой в периоды до и после финансового кризиса.
Похоже, что рынок Южной Кореи был более волатильным до финансового кризиса.
Начиная с 2001 года, на финансовых рынках США в один день в течение четырех месяцев текущего года истекают сроки четырех видов производных инструментов (деривативов) - опционов на акции, индексных опционов, индексных фьючерсов и отдельных опционов на акции.
Такие дни известны как «четверные колдовские дни» (см. также: тройной колдовской час). Вы хотите исследовать, демонстрируют ли четверные колдовские дни большую волатильность, чем обычные дни.
В Таблице 10 представлено ежедневное стандартное отклонение доходности для обычных дней и дней истечения срока действия опционов/фьючерсов в течение четырехлетнего периода. Данные таблицы относятся к опционам и фьючерсам по 30 акциям, входящим в состав индекса Dow Jones Industrial Average.
Тип дня |
n |
Стандартное отклонение (%) |
---|---|---|
Нормальная торговля |
138 |
0.821 |
Истечение сроков опционов / фьючерсов |
16 |
1.217 |
Решение для части 1:
У нас есть альтернативная гипотеза «больше чем»:
\(H_0: \sigma^2_{\text{истечение}} \leq \sigma^2_{\text{норма}}\) против \(H_a: \sigma^2_{\text{истечение}} > \sigma^2_{\text{норма}}\)
Решение для части 2:
Пусть \(\sigma^2_1\) представляют дисперсию дней истечения и \(\sigma^2_2\) - дисперсию нормальных дней, в соответствии с соглашением по выбору числителя и знаменателя, описанного выше.
Чтобы проверить нулевую гипотезу, мы используем \( F = {\sigma^2_1 \Big / \sigma^2_2} \) с 16 - 1 = 15 степенями свободы для числителя и 138 - 1 = 137 степенями свободы для знаменателя.
Решение для части 3:
\(F = (1.217)^2 / (0.821)^2 = 1.481/0.674 = 2.20\)
Поскольку это односторонняя проверка на уровне значимости 0.05, мы используем F-таблицу для уровня 0.05 непосредственно. Самое близкое значение к 137 степеням свободы составляет 120 степеней свободы.
На уровне значимости 0.05, критическое значение составляет 1.75. Поскольку 2.20 больше 1.75, мы отвергаем нулевую гипотезу. Оказывается, что четверные колдовские дни демонстрируют волатильность выше нормальной.