Каждый день мы наблюдаем высокие, низкие и заключительные значения фондовых индексов по всему миру. Такие индексы, как S&P 500 и Nikkei-Dow Jones Average, представляют собой выборки акций. Хоть индексы S&P 500 и Nikkei и не включают всю генеральную совокупность американских или японских акций, мы рассматриваем их как надежные показатели поведения всей совокупности акций.

Как финансовые аналитики, мы привыкли использовать эту выборочную информацию, чтобы оценивать ситуацию на различных рынках со всего мира. Любые статистические данные, рассчитанные на основе выборочной информации, однако, являются лишь оценкой основных параметров генеральной совокупности.

Выборка, то есть подмножество совокупности, - это подмножество, анализируемое с целью сделать выводы о самой совокупности.

Это чтение посвящено изучению того, как мы делаем выборку и используем выборку для оценки параметров совокупности. Далее мы рассмотрим выборочный метод или семплирование - т.е. процесс получения выборки.


В инвестициях, мы постоянно используем среднее значение в качестве меры центральной тенденции случайных величин, таких как доходность и прибыль на акцию.

Даже тогда, когда распределение вероятностей случайной величины неизвестно, мы можем сделать вероятностные утверждения о среднем по совокупности с использованием центральной предельной теоремы. Далее, в этом чтении мы обсудим и проиллюстрируем эту концепцию.

[см.: CFA - Центральная предельная теорема и распределение выборочного среднего]

После обсуждения выборочного метода мы обратимся к статистической оценке. Статистическая оценка или оценивание ищет точные ответы на вопрос: «Каково значение этого параметра?»

Центральная предельная теорема и статистическая оценка лежат в основе методов, представленных в этом чтении. В инвестициях, мы применяем эти и другие статистические методы для анализа финансовых данных; мы часто интерпретируем результаты с целью сделать вывод о том, что работает и что не работает в инвестициях.

Мы закончим это чтение обсуждением интерпретации статистических результатов, основанных на финансовых данных и возможных ошибках в этом процессе.

Выборочный метод.

Далее мы рассмотрим различные методы получения информации о генеральной совокупности (все элементы рассматриваемой группы элементов) через выборки (части совокупности).

[см. также описание концепций выборки и совокупности]

Информация о совокупности, которую мы стараемся получить, как правило, касается значения какого-либо параметра (англ. 'parameter'), величина которого вычисляется или используется для описания совокупности данных.

Когда мы используем выборку для оценки параметра, мы используем выборочные статистики (или просто статистики, для краткости).

Выборочная статистика (англ. 'sample statistic') - это величина, которая вычисляется на основе выборки данных или используется для описания выборки данных.

Мы делаем выборки по одной из двух причин:

  • В некоторых случаях, и нас нет возможности рассматривать каждый элемент совокупности.
  • В других случаях, рассмотрение каждого элемента совокупности экономически неэффективно.

Таким образом, экономия времени и денег - это два основных фактора, которые вынуждают финансового аналитика использовать выборку, чтобы ответить на вопрос о совокупности.

В этом разделе мы рассмотрим два метода извлечения случайной выборки (выборочный метод или семплирование, от англ. 'sampling'): простую случайную выборку и стратифицированную случайную выборку.

Затем мы определим и проиллюстрируем два типа данных, которые использует финансовый аналитик: перекрестные данные и временные ряды данных.

Простая случайная выборка.

Предположим, финансовый аналитик, занимающийся телекоммуникационной отраслью, хочет выяснить, сколько крупные клиенты потратят в среднем на телекоммуникационное оборудование в течение следующего года.

Одна из стратегий заключается в опросе всей совокупности клиентов, чтобы выяснить, каковы их планы закупок.

С точки зрения статистики, характеристики планируемых расходов всей совокупности клиентов, как правило, выражаются описательных мерами, такими как среднее значение и дисперсия. Опрос всех клиентов компании, однако, был бы очень дорогостоящим мероприятием с точки зрения времени и денег.

С другой стороны, аналитик может сделать репрезентативную выборку компаний и опросить эти компании о предстоящих расходах на телекоммуникационное оборудование. В этом случае аналитик будет вычислять статистику - выборочные средние расходы \(\overline X\). Эта стратегия имеет существенное преимущество по сравнению с опросом всей совокупности клиентов, потому что это можно сделать более быстро и с меньшими затратами.


Получение выборки, однако, вносит ошибку в статистику. Ошибка возникает потому, что опрашиваются не все компании в совокупности. Аналитик, который прибегает к выборке, выигрывает время и деньги за счет ошибки выборки.

Когда финансовый аналитик делает выборку, он должен составить план выборки. План выборки (англ. 'sampling plan') является набором правил, по которым делается выборка.

Основной тип выборки, позволяющий сделать статистически обоснованные выводы о совокупности, - это простая случайная выборка (или случайная выборка, для краткости).

Определение простой случайной выборки.

Простая случайная выборка (или случайная выборка, для краткости, англ. 'simple random sample') является подмножеством большей совокупности, извлеченным таким образом, что каждый элемент совокупности может быть включен в это подмножество с равной вероятностью.

Процедура извлечения выборки (англ. 'draw sample') из совокупности, соответствующая определению простой случайной выборки называется простым случайным выбором или отбором простой случайной выборки (англ. 'simple random sampling').

Как сделать простую случайную выборку?

Нам нужен метод, который гарантирует случайность, т.е. отсутствие какой-либо предопределенной схемы при извлечении выборки.

Для конечных или ограниченных совокупностей (англ. 'finite population'), наиболее распространенный способ получения случайной выборки предполагает использование случайных чисел (чисел с гарантированными свойствами случайности).


Во-первых, мы последовательно нумеруем элементы совокупности.

Например, если совокупность содержит 500 элементов, мы нумеруем их последовательно с трехзначными случайными числами, начиная с 001 и заканчивая 500.

Предположим, что нам нужна простая случайная выборка из 50 элементов.

В этом случае с помощью компьютерного генератора случайных чисел (см. CFA - Метод Монте-Карло) или таблицы случайных чисел, мы получаем серию трехзначных случайных чисел. Затем мы сопоставляем эти случайные числа с численными номерами элементов совокупности, пока не выберем из совокупности 50 элементов.

Иногда мы не можем пронумеровать (или даже определить) все элементы совокупности. В таких случаях, мы часто используем систематический отбор выборки.

Систематический отбор выборки или систематическая выборка (англ. 'systematic sampling') означает отбор каждого \(k\text{-го}\) элемента до тех пор, пока не будет отобрана выборка нужного размера.

Выборка, извлекаемая в результате этой процедуры, должна быть приблизительно случайной. Практические ситуации могут потребовать, чтобы мы использовали приблизительно случайную выборку (англ. 'approximately random sample').


Предположим, что финансовый аналитик опрашивает случайную выборку клиентов телекоммуникационной компании, чтобы определить их средние расходы на телекоммуникационное оборудование.

Выборочное среднее предоставит аналитику оценку средних расходов всей совокупности клиентов. Разница между выборочным средним значением и средним значением по совокупности называется ошибкой выборки.

Определение ошибки выборки.

Ошибка выборки, выборочная ошибка или ошибка отбора (англ. 'sampling error') представляет собой разницу между наблюдаемым значением статистики, и истинным значением статистики, которое должно получиться в результате оценки (т.е. значением по всей совокупности).

Случайная выборка отражает свойства совокупности непредвзятым образом, и выборочные статистики, такие как выборочное среднее, вычисленные на основе случайной выборки, являются надежными обоснованными оценками основных параметров всей совокупности.

Выборочная статистика является случайной величиной. Другими словами, распределение имеют не только исходные данные совокупности, но и выборочные статистики, полученные на основе совокупности.

Это распределение называется выборочным распределением статистики.

Определение выборочного распределения статистики.

Выборочное распределение статистики (англ. 'sampling distribution of a statistic') является распределением всех различных возможных значений, которые может принимать статистика, вычисляемая на основе выборок одного и того же размера, случайным образом извлеченных из той же совокупности.

В случае с выборочным средним значением, например, под этим подразумевается «выборочное распределение среднего значения по выборке» или просто «распределение выборочного среднего».

Далее мы рассмотрим выборочные распределения более подробно. И также рассмотрим другой выборочный метод, полезный в инвестиционном анализе.