Предположим, у нас есть гипотеза об относительных значениях дисперсий двух нормально распределенных совокупностей со средними \(\mu_1\) и \(\mu_1\) и дисперсиями \(\sigma^2_1\) и \(\sigma^2_2\). Мы можем сформулировать все гипотезы в виде следующих вариантов:

  • \(H_0: \sigma^2_1 = \sigma^2_2\) против \(H_a: \sigma^2_1 \neq \sigma^2_2\)
  • \(H_0: \sigma^2_1 \leq \sigma^2_2\) против \(H_a: \sigma^2_1 > \sigma^2_2\)
  • \(H_0: \sigma^2_1 \geq \sigma^2_2\) против \(H_a: \sigma^2_1 < \sigma^2_2\)

Обратите внимание, что в точке равенства, нулевая гипотеза \(\sigma^2_1 = \sigma^2_2\) означает, что отношение дисперсий равно 1: \( \sigma^2_1 \big / \sigma^2_2 = 1 \). При независимых случайных выборках из этих совокупностей, проверки, связанные с этими гипотезами, основаны на F-тесте (англ. 'F-test'), который представляет собой отношение выборочных дисперсий.

Предположим, что мы используем \(n_1\) наблюдений при расчете выборочной дисперсии \( \sigma^2_1\) и \(n_2\) наблюдений при расчете выборочной дисперсии \( \sigma^2_2\).

Проверки гипотез о разнице между дисперсиями двух совокупностей выполняются с использованием F-распределения.

Как и хи-квадрат распределения, F-распределение представляет собой семейство асимметричных распределений, ограниченных снизу 0. Каждое F-распределение определяется двумя значениями степеней свободы, называемыми степенями свободы для числителя и степенями свободы для знаменателя.

Взаимосвязь между хи-квадрат распределением и F-распределением выглядит следующим образом:

Если \( \chi^2_1\) является одной хи-квадрат случайной величиной с \(m\) степенями свободы и \( \chi^2_2\) является другой хи-квадрат случайной величиной с \(n\) степенями свободы, то \(F = \big ( \chi^2_1 /m \big ) \Big /  \big ( \chi^2_2 /n \big ) \) следует F-распределение со степенями свободы для числителя \(m\) и степенями свободы для знаменателя \(n\).

F-тест, как и критерий хи-квадрат, не устойчив к нарушениям его допущений.

Тестовая статистика для проверки гипотезы о различиях между дисперсиями двух совокупностей (нормально распределенные совокупности).

Предположим, у нас есть два выборки, первая с \(n_1\) наблюдений и выборочной дисперсией \(s^2_1\), и вторая с \(n_2\) наблюдений и выборочной дисперсией \(s^2_2\).

Выборки являются случайными, независимыми друг от друга, и отобраны из нормально распределенных совокупностей. Проверка различий между дисперсиями двух совокупностей основана на соотношении выборочных дисперсий:

\( \large \dst { F =  {\chi^2_1 \over \chi^2_2} } \) (Формула 16)

с \( {\rm df}_1 = n_1 - 1\) степенями свободы для числителя и \( {\rm df}_2 = n_2 - 1\) степенями свободы для знаменателя. Обратите внимание, что \( {\rm df}_1\) и \( {\rm df}_2\) являются делителями, используемыми при расчете \(s^2_1\) и \(s^2_2\) соответственно.

По соглашению или в обычной практике, в качестве фактической тестовой статистики используется большее из двух соотношений:

\( \sigma^2_1 \big / \sigma^2_2 \) и \( \sigma^2_2 \big / \sigma^2_1 \).

Когда мы следуем этому соглашению, значение тестовой статистики всегда больше или равно 1. Соответственно, таблицы критических значений F должны включать только значения больше или равные 1.

В соответствии с этим соглашением, критическим значением для любой формулировки гипотез является одно значение в правой части соответствующего F-распределения.

Обратите внимание, что маркировка совокупностей как «1» или «2» произвольна в любом случае.

Критические значения для проверки гипотез об относительных значениях двух дисперсий совокупности.

Следуя соглашению об использовании большего из двух соотношений \( \sigma^2_1 \big / \sigma^2_2 \) и \( \sigma^2_2 \big / \sigma^2_1 \), рассмотрим два случая:

  1. Альтернативная гипотеза «не равно»: нулевая гипотеза отклоняется на уровне значимости \(\alpha\), если тестовая статистика больше, чем верхняя точка \(\alpha / 2\) F-распределения с заданными степенями свободы для числителя и знаменателя.
  2. Альтернативные гипотезы «больше чем» или «меньше чем»: нулевая гипотеза отклоняется на уровне значимости \(\alpha\), если тестовая статистика больше, чем верхняя точка \(\alpha\) F-распределения с заданными степенями свободы для числителя и знаменателя.

Таким образом, если мы проводим двустороннюю проверку при уровне значимости \(\alpha = 0.01\), нам необходимо найти критическое значение в F-таблицах при уровне значимости \(\alpha/2 = 0.01/2 = 0.005\) для односторонней проверки (Случай 1). Но односторонняя проверка при уровне значимости 0.01 использует критические значения из F-таблиц для \(\alpha = 0.01\) (Случай 2).

В качестве примера предположим, что мы проводим двусторонний тест на уровне значимости 0.05. Мы вычислили значение \(F\) равное 2.77 со степенями свободы 12 для числителя и 19 степенями свободы для знаменателя.

Используя F-таблицу для 0.05 / 2 = 0.025, мы найдем критическое значение 2.72. Поскольку значение 2.77 больше, чем 2.72, мы отвергаем нулевую гипотезу на уровне значимости 0.05.

Если бы мы не следовали соглашению, описанному выше, и получили бы расчетное значение F меньше 1, то могли бы мы по-прежнему использовать F-таблицы?

Ответ: да. Используя свойство обратной зависимости F-статистики, можно рассчитать необходимое значение. Самый простой способ объяснить это свойство - показать пример расчета.

Предположим, что для двусторонней проверки выбранный уровень значимости составляет 0.05, и мы имеем значение F = 0.11, с 7 степенями свободы для числителя и 9 степенями свободы для знаменателя.

Мы находим обратное значение: 1/0.11 = 9.09.

Затем мы ищем это значение в F-таблице для уровня значимости 0.025 (поскольку это двусторонняя проверка) со степенями свободы в обратном порядке (т.е. меняем местами числитель и знаменатель): 9 для числителя и 7 для знаменателя.

Другими словами, \( F_{9,7} = 1 / F_{9,7} \) и 9.09 превышает критическое значение 4.82, поэтому \( F_{9,7} = 0.11 \) при уровне значимости 0.05.

Пример (8). Волатильность и глобальный финансовый кризис конца 2000-х годов.

Вы исследуете, изменилась ли дисперсия доходности индекс фондового рынка Южной Кореи KOSPI после глобального финансового кризиса, который достиг пика в 2008 году.

Для этого исследования, вы рассматриваете данные с 1999 по 2006 год, как за докризисный период, и с 2010 по 2017 год, как за посткризисный период.

Вы собираете данные, представленные в Таблице 9, которые включают доходность за 418 недель с 1999 по 2006 год и за 418 недель с 2010 до 2017 год. Вы определили уровень значимости 0.01.

Таблица 9. Доходность и дисперсия индекса KOSPI до и после мирового финансового кризиса конца 2000-х годов.

n

Средняя еженедельная доходность (%)

Дисперсия доходности

До кризиса: с 1999 по 2006 год

418

0.307

18.203

После кризиса: 2010 по 2017 год

418

0.114

3.919

Источник данных о доходности: finance.yahoo.com по состоянию на 19 августа 2018.

  1. Сформулируйте нулевую и альтернативную гипотезы в соответствии с описанием цели исследования.
  2. Определите тестовую статистику для проведения проверки гипотез из части 1.
  3. Определите, отвергается ли нулевая гипотеза на уровне значимости 0.01. (используйте F-таблицу).

Решение для части 1:

У нас есть альтернативная гипотеза «не равно»:

\(H_0: \sigma^2_{\text{до}} = \sigma^2_{\text{после}}\) против \(H_a: \sigma^2_{\text{до}} \neq \sigma^2_{\text{после}}\)


Решение для части 2:

Для того, чтобы проверить нулевую гипотезу о равенстве двух дисперсий, мы используем \( F =  {\sigma^2_1 \Big / \sigma^2_2} \)  с 418 - 1 = 417 степенями свободы для числителя и знаменателя.


Решение для части 3:

Выборочная дисперсия «до» больше, поэтому, следуя соглашению для расчета F-статистики, выборочная дисперсия «до» попадает в числитель:

\(F = 18.203 / 3.919 = 4.645\)

Поскольку это двусторонняя проверка, мы используем F-таблицы для уровня значимости 0.005 (=0.01/2), чтобы получить значение для уровня значимости 0.01.

Самое близкое значение к 417 степеням свободы составляет 120 степеней свободы. На уровне значимости 0.01, критическим значением будет 1.61.

Поскольку 4.645 больше, чем критическое значение 1.61, мы отвергаем нулевую гипотезу о том, что дисперсия доходности по совокупности является одинаковой в периоды до и после финансового кризиса.

Критическое значение уменьшается по мере увеличения степеней свободы. Таким образом, критическое значение для 417 степеней свободы даже меньше, чем 1.61, и мы можем отклонить нулевую гипотезу.

Похоже, что рынок Южной Кореи был более волатильным до финансового кризиса.

Пример (9). Волатильность в дни истечения сроков действия деривативов.

Начиная с 2001 года, на финансовых рынках США в один день в течение четырех месяцев текущего года истекают сроки четырех видов производных инструментов (деривативов) - опционов на акции, индексных опционов, индексных фьючерсов и отдельных опционов на акции.

Такие дни известны как «четверные колдовские дни» (см. также: тройной колдовской час). Вы хотите исследовать, демонстрируют ли четверные колдовские дни большую волатильность, чем обычные дни.

В Таблице 10 представлено ежедневное стандартное отклонение доходности для обычных дней и дней истечения срока действия опционов/фьючерсов в течение четырехлетнего периода. Данные таблицы относятся к опционам и фьючерсам по 30 акциям, входящим в состав индекса Dow Jones Industrial Average.

Таблица 10. Стандартное отклонение доходности:
Нормальные торговые дни и
дни истечения сроков деривативов.

Тип дня

n

Стандартное отклонение (%)

Нормальная торговля

138

0.821

Истечение сроков опционов / фьючерсов

16

1.217

  1. Сформулируйте нулевую и альтернативную гипотезы, исходя из предположения, что четверные колдовские дни демонстрируют волатильность выше нормальной.
  2. Определите тестовую статистику для проведения проверки гипотез из части 1.
  3. Определите, следует ли отклонить нулевую гипотезу на уровне значимости 0.05 (используйте F-таблицы).

Решение для части 1:

У нас есть альтернативная гипотеза «больше чем»:

\(H_0: \sigma^2_{\text{истечение}} \leq \sigma^2_{\text{норма}}\) против \(H_a: \sigma^2_{\text{истечение}} > \sigma^2_{\text{норма}}\)


Решение для части 2:

Пусть \(\sigma^2_1\) представляют дисперсию дней истечения и \(\sigma^2_2\) - дисперсию нормальных дней, в соответствии с соглашением по выбору числителя и знаменателя, описанного выше.

Чтобы проверить нулевую гипотезу, мы используем \( F =  {\sigma^2_1 \Big / \sigma^2_2} \) с 16 - 1 = 15 степенями свободы для числителя и 138 - 1 = 137 степенями свободы для знаменателя.


Решение для части 3:

\(F = (1.217)^2 / (0.821)^2 = 1.481/0.674 = 2.20\)

Поскольку это односторонняя проверка на уровне значимости 0.05, мы используем F-таблицу для уровня 0.05 непосредственно. Самое близкое значение к 137 степеням свободы составляет 120 степеней свободы.

На уровне значимости 0.05, критическое значение составляет 1.75. Поскольку 2.20 больше 1.75, мы отвергаем нулевую гипотезу. Оказывается, что четверные колдовские дни демонстрируют волатильность выше нормальной.