Рассмотренный ранее метод простой случайной выборки не может быть лучшим подходом во всех ситуациях. Наиболее часто используемой альтернативой является стратифицированная случайная выборка.

Определение стратифицированной случайной выборки.

В стратифицированной случайной выборке (или послойной / районированной случайной выборке, от англ. 'stratified random sampling'), совокупность делится на подсовокупности (страты или слои, от англ. 'strata' или 'stratum') на основе одного или более критериев классификации.

Далее, из каждого слоя извлекаются простые случайные выборки в размерах, пропорциональных относительному размеру каждого слоя в совокупности.

Затем эти выборки объединяются, чтобы сформировать стратифицированную случайную выборку.

В отличии от простой случайной выборки, стратифицированная случайная выборка гарантирует, что в выборке будет представлены срезы данных (слои), представляющие интерес для аналитика.

Другое преимущество заключается в том, что оценки параметров, полученные из стратифицированной выборки, имеют большую точность - то есть, меньшую изменчивость или дисперсию, - по сравнению с оценками, полученными из простой случайной выборки.


Индексирование по облигациям (или привязка к индексу облигаций, от англ. 'bond indexing') является одной из областей, в которых часто применяется стратифицированная выборка. Индексирование (англ. 'indexing') является инвестиционной стратегией, при которой инвестор планирует портфель так, чтобы отразить характеристики опреденного индекса.

При чистом индексировании по облигациям, также называемым подходом полной репликации (англ. 'full-replication approach'), инвестор пытается полностью реплицировать (т.е. воспроизвести) индекс, добавляя в портфель все облигации индекса пропорционально весу их рыночной стоимости.

Многие индексы облигаций состоят из тысяч эмиссий, поэтому, так чистое индексирование по облигациям трудно реализовать. Кроме того, транзакционные издержки будут высокими, поскольку многие облигации не имеют ликвидных рынков.

Хотя простая случайная выборка может решить проблему транзакционных издержек, полученная выборка, вероятно, не будет совпадать с основными факторами риска индекса - чувствительностью процентной ставки, например. Поскольку основные факторы риска портфелей с фиксированным доходом хорошо известны и поддаются количественной оценке, стратифицированная выборка предлагает более эффективный подход.

При таком подходе мы разделим совокупность облигаций индекса на группы по аналогичной чувствительности процентной ставки, распределению денежных потоков, сектору, кредитному качеству и возможности досрочного погашения.

В контексте данного анализа мы ссылаемся на каждую группу как на страту (англ. 'stratum') или ячейку (англ. 'cell') .

См. Fabozzi (2007).

Затем мы делаем выборку из каждой страты, пропорционально относительному рыночному весу страты в реплицируемом индексе.

Пример (1). Индексы облигаций и стратифицированная выборка.

Предположим, что вы менеджер взаимного фонда, индексируемого с учетом индекса государственных облигаций Lehman Brothers Government Index. Вы исследуете несколько подходов к индексации, в том числе метод стратифицированной выборки.

Сначала отделяете облигации агентств (госучреждений) от казначейских облигаций США.

Для каждой из этих двух групп вы определили 10 интервалов по срокам погашения:

  • от 1 до 2 лет,
  • от 2 до 3 лет,
  • от 3 до 4 лет,
  • от 4 до 6 лет,
  • от 6 до 8 лет,
  • от 8 до 10 лет,
  • от 10 до 12 лет,
  • от 12 до 15 лет,
  • от 15 до 20 лет, и
  • от 20 до 30 лет.

Также вы отделили купонные облигации с купонами (в годовых процентных ставках) на 6% или менее от облигаций с купонами более чем на 6%.

  1. Сколько ячеек или страт предполагает этот план выборки?
  2. Если вы используете этот план выборки, какое минимальное количество эмиссий может иметь индексированный портфель?
  3. Предположим, что при отборе ценных бумаг для каждой ячейки, вы применяете критерий ликвидности рынка ценной бумаги. Будет ли такая выборка случайной? Поясните свой ответ.

Решение для части 1:

У вас есть 2 категории классификации по эмитентам, 10 категорий - по срокам погашения и 2 категории - по купонным ставкам.

Таким образом, в общей сложности, этот план предусматривает 2(10)(2) = 40 различных страт (слоев)  или ячеек.

Этот ответ получен с применением правила умножения при подсчете результатов, описанном в чтении о концепциях теории вероятности.

[см.: CFA - Принципы подсчета результатов в финансовом анализе]


Решение для части 2:

У вас не может быть меньше 1 эмиссии для каждой ячейки, поэтому индексированный портфель должен включать, по меньшей мере, 40 ячеек.


Решение для части 3:

Если применить какие-либо дополнительные критерии отбора ценных бумаг для ячеек, то не каждая ценная бумага будет имеет равную вероятность быть отобранной. В результате, выборка не будет случайной.

На практике, индексирование с использованием стратифицированной выборки, как правило, не означает строго случайную выборку, поскольку отбор выпусков облигаций для ячеек подвергаются различным дополнительным критериям.

Так как в данном случае целью выборки является не оценка параметра совокупности, а индексирование портфеля, то отсутствие случайности само по себе не является проблемой в этом применении стратифицированной выборки.


В следующем разделе мы обсудим типы данных, используемые финансовыми аналитиками для выборочных методов и практических вопросов, возникающих при отборе выборок.