В предыдущем разделе мы использовали два t-теста, чтобы разобраться в различиях между средними значениями по совокупности. Эти тесты были основаны на двух выборках.

Предположение о допустимости использования этих тестов для проверки гипотезы было основано на том, что выборки были независимыми - т.е., не связанными друг с другом.

Когда мы хотим проверить гипотезу для двух средних значений, основанных на выборках, которые, по нашему мнению, зависят друг от друга, мы применяем методы, представленные в данном разделе.

t-тест, описанный в этом разделе, основан на данных, расположенных попарно, т.е. в виде парных наблюдений, а сам этот тест иногда называют тестом парного (т.е. попарного) сравнения.

Парные наблюдения  (англ. 'paired observations') - это наблюдения, которые зависят друг от друга, потому что у них есть нечто общее.

Тест парного сравнения (парный тест или парный двухвыборочный t-тест для средних, англ. 'paired comparisons test') представляет собой статистическую проверку различий между зависимыми элементами.


Например, нас может интересовать разница в дивидендной политике компании до и после изменения в налоговом законодательстве, регулирующем налогообложение дивидендов.

В этом случае, мы имеем пару наблюдений «до» и «после» для одних и тех же компаний. Мы можем проверить гипотезу о среднем значении различий (среднее разности, англ. 'mean differences'), которые мы наблюдаем в разных компаниях.

В других случаях, парные наблюдения могут быть основаны на разных группах наблюдений.

Например, мы можем проверить, были ли средняя доходность двух инвестиционных стратегий равна в течение рассматриваемого периода. Здесь наблюдения связаны друг с другом в том смысле, что есть только одно наблюдение для каждой стратегии в каждом месяце, и оба наблюдения зависят от основных факторов рыночного риска.

Поскольку доходность обеих стратегий может быть связана с некоторыми общими факторами риска, такими, как рыночная доходность, эти выборки зависят друг от друга.

Благодаря расчету стандартной ошибки, основанному на различиях, t-тест, представленный ниже, учитывает корреляцию между наблюдениями.


Пусть \(A\) обозначает «после», а \(B\) - «до». Предположим, что у нас есть наблюдения для случайных величин \(X_A\) и \(X_B\) и что выборки зависимы. Мы располагаем наблюдения попарно.

Пусть \(d_i\) обозначает разность между двумя парными наблюдениями. Мы можем использовать обозначение \(d_i = x_{Ai} - x_{Bi}\), где \(x_{Ai}\) и \(x_{Bi}\) являются \(i\)-й парой наблюдений, где \(i = 1,2, \ldots, n\).

Пусть \(\mu_d\) обозначает разность средних по совокупности, а \(\mu_{d0}\) обозначает гипотетическое значение разности средних по совокупности.

Мы можем сформулировать следующие пары гипотез для \(\mu_{d0}\):

  1. \(H_0: \mu_d = \mu_{d0}\) против \(H_a:\mu_d \neq \mu_{d0}\)
  2. \(H_0: \mu_d \leq \mu_{d0}\) против \(H_a:\mu_d > \mu_{d0}\)
  3. \(H_0: \mu_d \geq \mu_{d0}\) против \(H_a:\mu_d < \mu_{d0}\)

На практике, наиболее часто используемым значением для \(\mu_{d0}\) является 0.

Как обычно, мы имеем дело со случаем нормально распределенными совокупностями с неизвестными дисперсиями совокупности,  мы будем выполнять t-тест.

Для вычисления t-статистики, мы сначала должны найти выборочную среднюю разность:

\(\Large { \overline d = {1 \over n} \dsum^n_{i=1} d_i }\) (Формула 10)

где \(n\) - число пар наблюдений.

Выборочная дисперсия, обозначенная как \(s^2_d\), рассчитывается по формуле:

\(\Large { s^2_d = {\dsum^n_{i=1} (d_i - \overline d)^2 \over n-1 } }\) (Формула 11)

Найдя квадратный корень из этой величины, мы получим стандартное отклонение выборки \(s_d\), который позволяет нам рассчитать стандартную ошибку средней разности следующим образом:

\(\Large \dst { s_{\overline d} = {s_d \over \sqrt n} }\) (Формула 12)

Мы можем также использовать следующее эквивалентное выражение, которое использует корреляцию между двумя переменными величинами:

\( \dst s_{\overline d} = \sqrt {s^2_A + s^2_B - 2r(X_A, X_B)s_A s_B} \Big / \sqrt n \)

где

  • \(s^2_A\) является выборочной дисперсией \(X_A\),
  • \(s^2_B\) является выборочной дисперсией \(X_B\), а
  • \(r(X_A, X_B) \) является выборочной корреляцией между \(X_A\) и \(X_B\).

Тестовая статистика для проверки средней разности (нормально распределенные совокупности, неизвестные дисперсии совокупности).

Когда у нас есть данные, состоящие из парных наблюдений из выборок, отобранных из нормально распределенных совокупностей с неизвестными дисперсиями, t-тест рассчитывается следующим образом:

\(\large \dst t = {\overline d - \mu_{d0} \over s_{\overline d}} \) (Формула 13)

с \(n - 1\) степенями свободы, где

  • \(n\) - число парных наблюдений,
  • \(\overline d \) - выборочная средняя разность (определяемая по Формуле 10) и
  • \(s_{\overline d} \) - стандартная ошибка \(\overline d \) (определяемая по Формуле 12).

В Таблице 7 представлена ежеквартальная доходность за 6 лет для двух управляемых портфелей, специализирующихся на драгоценных металлах. Эти два портфеля подвержены схожим рискам (по оценке с помощью стандартного отклонения доходности и других показателям) и имеют почти одинаковые доли расходов.

Инвестиционная компания присвоила Портфелю B более высокий рейтинг, чем Портфелю A. Мы исследуем относительную эффективность портфелей, и предположим, что мы хотим проверить гипотезу о том, что средняя квартальная доходность Портфеля A равна средней квартальной доходности Портфеля B в течение шестилетнего периода.

Поскольку два портфеля подвержены по существу одному и тому же набору факторов риска, их доходность зависима друг от друга, поэтому целесообразно выполнить тест парного сравнения.

Пусть \(\mu_d\) обозначает среднее по совокупности значение разности между доходностью двух портфелей за этот период.

Мы проверяем нулевую гипотезу \(H_0: \mu_d = 0\) против альтернативной гипотезы \(H_a:\mu_d \neq 0\) на уровне значимости 0.05.

Таблица 7. Квартальная доходность двух управляемых портфелей.

Квартал

Портфель A (%)

Портфель B (%)

Разность
(Портфель A - Портфель B)

4КВ:Год 6

11.40

14.64

-3.24

3КВ:Год 6

-2.17

0.44

-2.61

2КВ:Год 6

10.72

19.51

-8.79

1КВ:Год 6

38.91

50.40

-11.49

4КВ:Год 5

4.36

1.01

3.35

3КВ:Год 5

5.13

10.18

-5.05

2КВ:Год 5

26.36

17.77

8.59

1КВ:Год 5

-5.53

4.76

-10.29

4КВ:Год 4

5.27

-5.36

10.63

3КВ:Год 4

-7.82

-1.54

-6.28

2КВ:Год 4

2.34

0.19

2.15

1КВ:Год 4

-14.38

-12.07

-2.31

4КВ:Год 3

-9.80

-9.98

0.18

3КВ:Год 3

19.03

26.18

-7.15

2КВ:Год 3

4.11

-2.39

6.50

1КВ:Год 3

-4.12

-2.51

-1.61

4КВ:Год 2

-0.53

-11.32

10.79

3КВ:Год 2

5.06

0.46

4.60

2КВ:Год 2

-14.01

-11.56

-2.45

1КВ:Год 2

12.50

3.52

8.98

4КВ:Год 1

-29.05

-22.45

-6.60

3КВ:Год 1

3.60

0.10

3.50

2КВ:Год 1

-7.97

-8.96

0.99

1КВ:Год 1

-8.62

-0.66

-7.96

Среднее

1.87

2.52

-0.65

Выборочное стандартное отклонение разностей = 6.71.


Выборочное среднее разности \(\overline d\), между Портфелем A и Портфелем B составляет -0.65% в квартал. Стандартная ошибка выборочного среднего разности равна:

\( s_{\overline d} = 6.71 \big / \sqrt{24} = 1.369673\)

Тестовая статистика равна \(t = (-0.65 - 0)/1.369673 = -0.475\) при \(n - 1 = 24 - 1 = 23\) степенях свободы.

На уровне значимости 0.05, мы отвергаем нулевую гипотезу, если \(t> 2.069\) или если \(t < -2.069\).

Поскольку -0.475 не меньше, чем -2.069, мы не отвергаем нуль. На уровне значимости 0.10 значимости мы отвергаем нулевую гипотезу, если \(t> 1.714\) или если \(t < -1.714\).

Таким образом, разница в средней квартальной доходности не является значимой при любом обычном уровне значимости.

Следующий пример иллюстрирует применение этого теста для оценки двух конкурирующих инвестиционных стратегий.

Пример (6) сравнения двух портфелей.

Вы выясняете, отличается ли эффективность портфеля акций компаний со всего мира от эффективности портфеля только акций американских компаний.

Для анализа всемирного портфеля, вы решили сосредоточиться на индексе биржевого инвестиционного фонда Vanguard Total World Index Stock ETF.

Фонд ETF (биржевой инвестиционный фонд, от англ. 'exchange-traded fund') стремится отслеживать эффективность индекса FTSE Global All Cap Index, который является взвешенным индексом рыночной капитализации, предназначенным для оценки рыночной эффективности акций компаний из развитых и развивающихся рынков.

Для анализа портфеля США, вы решили сосредоточиться на SPDR S&P 500, фонда ETF, который стремится отслеживать эффективность индекса S&P 500.

Вы проанализировали месячные данные по обоим ETF с августа 2013 года по июль 2018 года и подготовили следующую сводную таблицу.

Таблица 8. Месячная общая доходность для фондов Vanguard Total World Index Stock ETF и
SPDR S&P 500 ETF:
с августа 2013 года по июль 2018 года (\(n = 60\)).

Стратегия

Средняя доходность

Стандартное
отклонение

Мировая

0.79%

2.93%

США

1.06

2.81

Разность

-0.27

1.00 *

* Выборочное стандартное отклонение разности.

Источник данных о доходности: finance.yahoo.com, по состоянию на 18 августа 2018 г.


В Таблице 8 мы имеем \(\overline d\) = -0.27% и \(s_d\) = 1.00%.

  1. Сформулируйте нулевую и альтернативную гипотезы для двухсторонней проверки того, средняя разность между мировой стратегией и стратегией акций США равна 0.
  2. Определите тестовую статистику для проведения проверки гипотез из части 1.
  3. Определите критическое значение или значения для проверенных гипотез из части 1 на уровне значимости 0.01.
  4. Определите, отвергается или нет нулевая гипотеза на уровне значимости 0.01. (используйте таблицы t-распределения)
  5. Обоснуйте выбор теста парного сравнения.

Решение для части 1:

Приняв \(\mu_d\) в качестве средней разности между стратегиями, мы имеем пару гипотез:

\(H_0: \mu_d = 0\) против \(H_a:\mu_d \neq 0\)


Решение для части 2:

Поскольку дисперсия генеральной совокупности неизвестна, тестовой статистикой является t-тест с 60 - 1 = 59 степенями свободы.


Решение для части 3:

В таблице t-распределения, ближайшим значением к df = 59 будет df = 60. Критическим значением, при 60 степенях свободы и уровне значимости 0.005, будет 2.66. Мы отвергаем нуль, если находим, что \(t> 2.66\) или \(t <-2.66\).


Решение для части 4:

\( \dst t_{59} = {-0.27 \over 1.00 \big / \sqrt{60}} = {-0.27 \over 0.129099} = -2.09\)

Поскольку \(-2.09 > -2.66\), мы не можем отвергнуть нулевую гипотезу. Соответственно, мы приходим к выводу, что разница в средней доходности двух стратегий не является статистически значимой.


Решение для части 5:

Несколько американских акций, которые являются частью индекса S&P 500, также включены в ETF Vanguard Total World Index Stock. Профиль мирового фонда ETF показывает, что девять из десяти крупнейших холдингов в ETF являются американскими акциями.

В результате, выборки двух портфелей не являются независимыми. В целом, корреляция доходности фондов Vanguard Total World Index Stock ETF и SPDR S&P 500 ETF должна быть положительной.

Поскольку выборки зависимые, парный тест был обоснованным.