Методы проверки статистических гипотез, которые мы обсуждали до этого, имеют две общие характеристики. Во-первых, они связаны с параметрами. Во-вторых, их действенность зависит от конкретного набора допущений.

Например, среднее значение и дисперсия - это два параметра или определяющие величины нормального распределения. Проверка гипотез также опирается на конкретные допущения - в частности, допущения о характере совокупности, из которой делается выборка.

Любая проверка или процедура, обладающая любой из двух указанных выше характеристик, является параметрическим тестом или методом (проверкой параметрической гипотезы, англ. 'parametric test').

Однако, в некоторых случаях, нас интересуют величины, не являющиеся параметрами распределений. В других случаях, мы можем предполагать, что допущения параметрических тестов не выполняются для имеющихся у нас конкретных данных.

В таких случаях, может быть полезен непараметрический тест или метод (проверка непараметрической гипотезы, англ. 'nonparametric test').

Непараметрический тест представляет собой проверку гипотезы, не связанную с параметром, или проверку с минимальными допущениями о совокупности, из которой сделана выборка.

Некоторые авторы проводят различие между «непараметрическими» тестами и тестами «без распределения» (англ. 'distribution-free').

Они ссылаются на методы, которые не касаются параметров распределения, как на непараметрические и на методы, которые делают минимальные допущения о распределении совокупности как на методы без распределения.

Мы следуем общепринятой терминологии и в обоих случаях используем термин «непараметрический тест».

В первую очередь мы используем непараметрические методы в трех ситуациях:

  • когда данные, которые мы используем, не соответствуют допущениям о распределении,
  • когда данные представлены в рангах (ранжированы), или
  • когда проверяемая гипотеза не связана с параметром.

Первая ситуация возникает, когда доступные для анализа данные свидетельствуют о том, что допущения о распределении параметрического теста не выполняются.

Например, мы хотим проверить гипотезу о среднем по совокупности, но считаем, что ни t-тест, ни z-тест не подходит, поскольку выборка мала и может быть отобрана из явно ненормально распределенной совокупности. В этом случае мы можем использовать непараметрический тест.

Непараметрический тест часто включает преобразование наблюдений (или функцию наблюдений) в ранги в соответствии с величиной, а иногда он может означать работу только с гипотезами о неравенствах «больше» или «меньше» (с использованием знаков + и - для обозначения этих неравенств).

Характерно, что для выполнения таких проверок необходимо обращаться к специализированным статистическим таблицам для определения критических значений тестовой статистики, по крайней мере, для малых выборок.

Для больших выборок, часто выполняется преобразование тестовой статистики, что позволяет использовать таблицы для стандартного нормального распределения или t-распределения.

Такие проверки, как правило, формулируют нулевую гипотезу как тезис о рангах или знаках. В Таблице 11 приведены примеры непараметрических альтернатив для проверки параметрических гипотез о средних, которые мы обсуждали в этом чтении.

В некоторых случаях, есть несколько непараметрических альтернатив для параметрического теста.

Читатель должен обратиться к продвинутому учебнику по бизнес-статистике для проведения таких тестов. Например, Hettmansperger and McKean (2010) или Siegel and Castellan (1988).

Таблица 11. Непараметрические альтернативы
для параметрических тестов о средних.

Параметрические тесты

Непараметрические тесты

Проверка среднего значения

t-тест
z-тест

Тест знаковых рангов Уилкоксона

Проверка разницы между средними значениями

t-тест
приближенный t-тест

U-тест Манна-Уитни

Проверка среднего значения разности (тест парного сравнения)

t-тест

Тест знаковых рангов Уилкоксона
Тест знаков

Мы отметили, что когда мы используем непараметрические тесты, мы часто преобразовываем исходные данные в ранги. В некоторых случаях исходные данные уже ранжированы. В этих случаях мы также используем непараметрические тесты, потому что параметрические тесты обычно требуют более точную шкалу измерения, чем ранги.

Например, если наши данные являются рейтингами инвестиционных менеджеров, гипотезы об этих рейтингах будут проверяться с использованием непараметрических методов.


Вторая ситуация связана с использованием ранжированных данных, которые встречаются во многих других областях финансов.

Например, Heaney, Koga, Oliver и Tran (1999) изучали взаимосвязь между размером японских компаний (по выручке) и использованием ими деривативов (производных финансовых инструментов). Исследуемые компании использовали деривативы для хеджирования одного или более из пяти видов риска: риск изменения процентной ставки, валютный риск, риск изменения цен на сырьевые товары, риск изменения рыночных цен на акции и кредитный риск.

Исследователи дали оценку «масштаба предполагаемой подверженности риску» для каждой компании, которая равнялась числу видов риска, которые хеджировались компанией.

Хотя выручка оценивалась по точной шкале (шкале отношений), масштаб подверженности риску оценивался только по ранговой (порядковой) шкале.

Таким образом, исследователи использовали непараметрические статистические данные для изучения взаимосвязи между использованием деривативов и размером компаний.


Третья ситуация, в которой мы используем непараметрические методы, встречается, когда наш вопрос не связан с параметром.

Например, для ответа на вопрос о том, является ли выборка случайной или нет, мы используем соответствующий непараметрический тест (так называемый «тест серии», англ. 'runs test').

Другой тип непараметрического вопроса может быть о том, отобрана ли выборка из совокупности, соответствующей определенному распределению вероятностей (с использованием теста Колмогорова-Смирнова, например).

В завершение этого чтения, мы рассмотрим непараметрическую статистику, которая часто используется в инвестиционных исследованиях, - коэффициент ранговой корреляции Спирмена.

Непараметрические тесты, касающиеся корреляции: коэффициент ранговой корреляции Спирмена.

Ранее в этом чтении, мы выполняли t-тест для проверки гипотезы о корреляции двух переменных величин, на основе коэффициента корреляции. Как было отмечено, этот тест основан на довольно строгих допущениях.

Когда мы считаем, что рассматриваемая совокупность значительно отклоняется от этих допущений, мы можем использовать тест, основанный на коэффициенте ранговой корреляции Спирмена \(r_S\).

Коэффициент ранговой корреляции Спирмена (англ. 'Spearman rank correlation coefficient'), по существу, эквивалентен обычному коэффициенту корреляции, рассчитанному для рангов двух переменных величин (скажем, \(X\) и \(Y\)) в пределах их соответствующих выборок.

Таким образом, коэффициент ранговой корреляции Спирмена - это число в диапазоне от -1 до +1, где -1 (+1) обозначает идеальную обратную (положительное) прямолинейную связь между переменными величинами, при этом 0 означает отсутствие какой-либо прямолинейной связи (отсутствие корреляции).

Для расчета \( r_S \) необходимо выполнить следующие шаги:

  1. Ранжируйте наблюдения \(X\) от самых больших до самых маленьких. Назначьте порядковый номер (т.е. ранг) 1 наблюдению с наибольшим значением, ранг 2 наблюдению со вторым по величине значением, и так далее.

    В случае наличия связей, мы назначаем каждому связанному наблюдению средний ранг, который связанные наблюдения занимают совместно.

    Например, если третьи и четвертые наибольшие значения связаны, мы назначаем обоим наблюдениям ранг 3.5 (среднее 3 и 4). Выполните ту же процедуру для наблюдений переменной величины \(Y\).
  2. Вычислите разность \(d_i\), между рангами для каждой пары наблюдений переменных \(X\) и \(Y\).
  3. Затем, для выборки размера \(n\), найдите коэффициент ранговой корреляции Спирмена по формуле:

\( \Large \dst  r_S = 1 - {6 \dsum^n_{i=1} d^2_i \over n(n^2 - 1) } \) (Формула 18)

Расчет обычного коэффициента корреляции для рангов даст примерно тот же результат, что и Формула 18.

Предположим, что инвестор хочет вложить деньги в диверсифицированный взаимный фонд развивающихся рынков. Он сузил свой выбор до 10 таких фондов, которые оцениваются как 5-звездочные по рейтингу Morningstar.

При анализе фондов возник вопрос о том, связаны ли последние коэффициенты Шарпа и коэффициенты расходов (англ. 'expense ratio') фондов по состоянию на середину 2018 года.

Поскольку допущения t-теста для коэффициента корреляции могут не выполняться, целесообразно провести тест для коэффициента ранговой корреляции.

Коэффициент расходов (отношение операционных расходов фонда, к средней стоимости чистых активов) ограничен снизу (нулем) и сверху.

На практике, коэффициент Шарпа также наблюдается в пределах ограниченного диапазона.

Таким образом, ни одна из переменных не может распределяться нормально, и, следовательно, совместно они не могут следовать двумерному нормальному распределению. Одним словом, допущения t-теста не выполняются.

В Таблице 12 приведен расчет \(r_S\).

Первые два ряда содержат исходные данные.

Ряд с рангами \(X\) содержит коэффициенты Шарпа, преобразованные ранги.

Ряд с рангами \(Y\) содержит коэффициенты расходов, преобразованные ранги.

Мы хотим проверить нулевую гипотезу \(H_0: \rho = 0\) против альтернативной гипотезы \(H_a: \rho \neq 0\), где \(\rho\) - корреляция по совокупности \(X\) и \(Y\)  после ранжирования.

Для небольших выборок, критические значения для проверки на основе \(r_S\) приведены в Таблице 13.

Для больших выборок (скажем, \(n>30\)), мы можем выполнить t-тест, используя формулу:

\(\Large \dst t= {(n-2)^{1/2} r_S \over (1 - r^2_S)^{1/2}} \) (Формула 19)

c \(n - 2\) степенями свободы.

Таблица 12. Пример коэффициента
ранговой корреляции Спирмена.

Взаимный фонд

1

2

3

4

5

6

7

8

9

10

Коэффициент Шарпа (Х)

0.65

0.80

0.68

0.72

0.64

0.54

0.71

0.76

0.62

0.64

Коэффициент расходов (Y)

1.04

1.05

1.79

1.26

1.33

1.64

1.01

3.20

6.81

1.07

Ранг X

5.5

1

5.5

3

7.5

10

4

2

9

7.5

Ранг Y

9

8

3

6

5

4

10

2

1

7

\(d_i\)

-3.5

-7

2.5

-3

2.5

6

-6

0

8

0.5

\(d^2_i\)

12.25

49

6.25

9

6.25

36

36

0

64

0.25

\( \small \begin{aligned} r_S &= 1 - {6 \sum d^2_i \over 10(100 - 1)} \\[1ex]
&= 1 - {6(219) \over 10(100-1)} = -0.3273 \end{aligned} \)

Источник коэффициентов Шарпа и коэффициентов расходов: https://markets.on.nytimes.com/research/screener/mutual_funds/mutual_funds.asp по состоянию на 19 августа 2018.


В этом примере, для двусторонней проверке с уровнем значимости 0.05, Таблица 13 содержит верхнее критическое значение для \(n = 10\) равное 0.6364 (мы используем столбец 0.025 для двусторонней проверки с уровнем значимости 0.05).

Соответственно, мы отвергаем нулевую гипотезу, если \(r_S\) меньше -0.6364 или больше 0.6364. При \(r_S\) равном -0.3273, мы не отвергаем нулевую гипотезу.

Таблица 13. Приблизительные критические верхние значения
распределения ранговой корреляции Спирмена.

Размер выборки: \(n\)

\(\alpha\) = 0.05

\(\alpha\) = 0.025

\(\alpha\) = 0.01

5

0.8000

0.9000

0.9000

6

0.7714

0.8286

0.8857

7

0.6786

0.7450

0.8571

8

0.6190

0.7143

0.8095

9

0.5833

0.6833

0.7667

10

0.5515

0.6364

0.7333

11

0.5273

0.6091

0.7000

12

0.4965

0.5804

0.6713

13

0.4780

0.5549

0.6429

14

0.4593

0.5341

0.6220

15

0.4429

0.5179

0.6000

16

0.4265

0.5000

0.5824

17

0.4118

0.4853

0.5637

18

0.3994

0.4716

0.5480

19

0.3895

0.4579

0.5333

20

0.3789

0.4451

0.5203

21

0.3688

0.4351

0.5078

22

0.3597

0.4241

0.4963

23

0.3518

0.4150

0.4852

24

0.3435

0.4061

0.4748

25

0.3362

0.3977

0.4654

26

0.3299

0.3894

0.4564

27

0.3236

0.3822

0.4481

28

0.3175

0.3749

0.4401

29

0.3113

0.3685

0.4320

30

0.3059

0.3620

0.4251

Примечание: соответствующее нижнее критическое значение получается путем изменения знака верхнего критического значения.


В примере с взаимным фондом, мы преобразовали наблюдения двух переменных величин в ранги. Если одна или оба исходных переменных представлены в виде рангов, мы должны использовать \(r_S\), чтобы исследовать корреляцию.


Непараметрические статистические методы расширяют охват статистического вывода, потому используют меньше допущений, могут использоваться с ранжированными данными, а также для решения вопросов, не связанных с параметрами.

Довольно часто непараметрические тесты представляются параллельно с параметрическими тестами.

Читатель исследования может оценить, насколько чувствителен статистический вывод к допущениям, лежащим в основе параметрического теста.

Однако, если допущения параметрического теста выполнены, то параметрический тест (если таковой имеется), как правило, предпочтителен, чем непараметрический тест, так как параметрический тест, как правило, позволяет сделать более четкие выводы.

Используя понятие мощности проверки, введенное в предыдущем разделе, можно сказать, что параметрический тест часто является более мощным.

Для полного охвата всех непараметрических методов, которых могут встречаться в финансовой и инвестиционной литературе, лучше всего обратиться к специальному учебнику.

См., например: Hettmansperger and McKean (2010) или Siegel and Castellan (1988).