Русский математик Пафнутий Чебышев вывел неравенство, использующее стандартное отклонение в качестве меры дисперсии. Это неравенство позволяет найти долю значений в пределах \(k\) стандартных отклонений от среднего.

Определение неравенства Чебышева.

Согласно неравенству Чебышева, для любого распределения с конечной дисперсией доля наблюдений в пределах \(k\) стандартных отклонений от среднего арифметического составляет по крайней мере \(1 - 1/k^2\) для всех \(k > 1\).

Таблица 23 иллюстрирует доли наблюдений, которые должны лежать в пределах определенного числа стандартных отклонений от среднего значения по выборке.

Таблица 23. Доли наблюдений, вытекающие из неравенства Чебышева.

k

Интервал отклонений
от среднего значения выборки

Доля наблюдений (%)

1.25

\( \overline X \pm 1,25s \)

36

1.50

\( \overline X \pm 1,50s \)

56

2.00

\( \overline X \pm 2s \)

75

2.50

\( \overline X \pm 2,50s \)

84

3.00

\( \overline X \pm 3s \)

89

4.00

\( \overline X \pm 4s \)

94

Примечание: стандартное отклонение обозначается как \(s\).

Например, когда \(k = 1.25\), неравенство утверждает, что минимальная доля наблюдений, которые находятся в пределах \( \pm 1.25s\), составляет:

 1 - 1/(1.25)2 = 1 - 0.64 = 0.36 или 36%.

Наиболее часто цитируемые факты, вытекающие из неравенства Чебышева, заключаются в том, что интервал в 2 стандартных отклонения вокруг среднего значения должен содержать не менее 75% наблюдений, а интервал в 3 стандартных отклонения вокруг среднего значения должен содержать не менее 89% наблюдений, независимо от того, как распределены данные.

Важность неравенства Чебышева вытекает из того, что это общий принцип для распределений. Неравенство справедливо для выборок и совокупностей, а также для дискретных и непрерывных данных независимо от формы распределения.

Как мы увидим в чтении о выборке, мы можем сделать гораздо более точные утверждения об интервалах, если предположим, что выборка взята из совокупности, которая следует определенному распределению, называемому нормальным распределением.

Однако часто мы не можем с уверенностью предположить, что имеем дело с именно таким распределением.

Следующий пример иллюстрирует использование неравенства Чебышева.

Пример использования неравенства Чебышева.

Согласно Таблице 22, средние арифметические и стандартные отклонения месячной доходности S&P 500 составляли 0.94% и 5.50%, соответственно, в течение 1926-2012 годов. Этот период включает в общей сложности 1044 ежемесячных наблюдений.

Используя эту информацию, сделайте следующее:

  1. Рассчитайте конечные точки интервала, который должен содержать не менее 75% ежемесячных показателей доходности, в соответствии с неравенством Чебышева.
  2. Определите, какое минимальное и максимальное количество наблюдений должно лежать в интервале, вычисленном в части 1, согласно неравенству Чебышева.

Решение для части 1:

Согласно неравенству Чебышева, по крайней мере, 75% наблюдений должны находиться в пределах 2 стандартных отклонений от среднего значения, \( \overline X \pm 2s \).

Для ежемесячной серии доходности S&P 500 мы имеем:

0.94% \( \pm \) 2(5.50%) = 0.94% \( \pm \) 11.00%.

Таким образом, нижняя конечная точка интервала, которая должна содержать не менее 75% наблюдений, составляет

0.94% - 11.00% = -10.06%

а верхняя конечная точка составляет

0.94% + 11.00% = 11.94%


Решение для части 2:

Для выборки объемом 1044 не менее 0.75(1,044) = 783 наблюдений должны находиться в интервале от -10.06% до 11.94%, который мы вычислили в части 1.

Неравенство Чебышева дает минимальную долю наблюдений, который должен попадать в данный интервал около среднего, но оно не дает максимальную долю.

Таблица 4 содержит данные о распределении частот месячной доходности по S&P 500. Данные в приведенной таблице соответствуют неравенству Чебышева.

Набор интервалов от -10.0% до 12.0% примерно равен ширине интервала 2 стандартных отклонений: от -10.06% до 11.94%. В общей сложности 1004 наблюдения (приблизительно 96% наблюдений) находятся в диапазоне от -10.0% до 12.0%.

Таблица 4. Распределение частот для месячной доходности S&P 500 с января 1926 по декабрь 2012 (выдержка).

Интервал
доходности (%)

Абсолютная
частота

-10.0 до -8.0

23

-8.0 до -6.0

34

-6.0 до -4.0

59

-4.0 до -2.0

98

-2.0 до 0.0

157

0.0 до 2.0

220

2.0 до 4.0

173

4.0 до 6.0

137

6.0 до 8.0

63

8.0 до 10.0

25

10.0 до 12.0

15

1,004