Размер выборки влияет на стандартную ошибку и ширину доверительного интервала. Рассмотрим факторы, которые нужно учитывать при определении размера выборки, а также соответствующий пример из инвестиционной практики, - в рамках изучения количественных методов по программе CFA.
Что влияет на ширину доверительного интервала?
К этому моменту мы обсудили два фактора, которые влияют на ширину интервала:
Эти два варианта определяют фактор надежности.
Напомним, что доверительный интервал имеет следующую структуру:
Точечная оценка \(\pm\) Фактор надежности \(\times\) Стандартная ошибка.
Выбор размера выборки также влияет на ширину доверительного интервала. При прочих равных, больший размер выборки уменьшает ширину доверительного интервала.
Напомним формулу стандартной ошибки выборочного среднего:
\( \Large \substack{ \textbf{Стандартная ошибка} \\ \textbf{выборочного среднего} } = { \textbf{Стандартное отклонение выборки} \over \sqrt { \textbf{Размер выборки}}} \)
Мы видим, что стандартная ошибка меняется обратно пропорционально квадратному корню из размера выборки.
По мере увеличения размера выборки, стандартная ошибка уменьшается и, следовательно, ширина доверительного интервала также уменьшается. Чем больше размер выборки, тем выше точность, с которой мы можем оценить параметр совокупности.
Существует формула для определения размера выборки, необходимого для получения доверительного интервала нужной ширины.
Определим \(E\) = Фактор надежности \(\times\) Стандартная ошибка.
Чем меньше \(E\), тем меньше ширина доверительного интервала, так как \(2E\) - это ширина доверительного интервала.
Размер выборки, необходимый для получения нужного значения \(E\) при заданной степени уверенности \((1 - \alpha) \) равен:
\( \Large {n = [(t_{\alpha / 2}s) / E]^2} \).
При прочих равных, более крупные выборки лучше в этом смысле. На практике, однако, два соображения могут повлиять на решение против увеличения размера выборки.
Таким образом, есть три фактора, которые финансовый аналитик должен оценить при определении размера выборки, - это:
Инвестиционный менеджер хочет построить 95-процентный доверительный интервал для притоков и оттоков денежных средств своих клиентов в течение следующих 6 месяцев.
Он начинается с обзвона случайной выборки из 10 клиентов, чтобы опросить их о планируемых взносах и изъятиях средств из инвестиционного фонда.
Затем менеджер вычисляет изменение денежного потока для каждого клиента из выборки, как процентное изменение от общего объема средств, размещенных у менеджера. Положительное процентное изменение указывает на чистый приток денежных средств на счет клиента, а отрицательное процентное изменение указывает на чистый отток денежных средств со счета клиента.
Менеджер взвешивает каждый ответ клиента по относительному размеру счета в рамках выборки, а затем вычисляет взвешенное среднее.
Проделав все это, инвестиционный менеджер вычисляет взвешенное среднее значение равное 5.5%. Таким образом, проведенная точечная оценка означает, что общая сумма средств под управлением менеджера увеличится на 5.5% в течение следующих 6 месяцев.
Стандартное отклонение наблюдений в выборке составляет 10%. Гистограмма прошлых данных выглядит довольно близко к нормальному распределению, так что менеджер предполагает, что генеральная совокупность также соответствует нормальному распределению.
1. Рассчитайте 95-процентный доверительный интервал для среднего по совокупности и интерпретируйте результаты.
Менеджер решил проанализировать, каким будет доверительный интервал, если использовать размер выборки 20 или 30, и получил то же самое среднее (5.5%) и стандартное отклонение (10%).
2. Используя выборочное среднее 5.5% и стандартное отклонение 10%, вычислите доверительный интервал для размеров выборки от 20 до 30. Для размера выборки 30 используйте Формулу 6.
3. Интерпретируйте результаты для частей 1 и 2.
Решение для части 1:
Поскольку совокупность неизвестна, а размер выборки мал, менеджер должен использовать t-статистику из Формулы 6 для расчета доверительного интервала.
Для выборки размера 10, \(\rm{df} = n - 1 = 10 - 1 = 9\).
Для 95-процентного доверительного интервала, он должен использовать значение \(t_{0.025}\) для df = 9.
В соответствии с таблицами распределения Стьюдента это значение равно 2.262.
Таким образом, 95-процентный доверительный интервал для среднего значения по совокупности равен:
\( \begin{aligned} \overline X \pm t_{0.025} {s \over \sqrt{n}} &= 5.5\% \pm 2.262 {10\% \over \sqrt {10}} \\ &= 5.5\% \pm 2.262(3.162) \\ &= 5.5\% \pm 7.15\% \end{aligned} \)
Доверительный интервал для среднего по совокупности охватывает значения -1.65% до + 12,65%.
Менеджер может быть уверен на 95%, что этот диапазон включает в себя среднее значение по совокупности.
Решение для части 2:
В Таблице 4 приведены расчеты для выборок трех размеров.
Распределение |
95% доверительный интервал |
Нижняя граница |
Верхняя граница |
Относительный размер |
---|---|---|---|---|
\( t(n = 10) \) |
\(5.5\% \pm 2.262(3.162) \) |
-1.65% |
12.65% |
100.0% |
\( t(n = 20) \) |
\(5.5\% \pm 2.093(2.236) \) |
0.82 |
10.18 |
65.5 |
\( t(n = 30) \) |
\(5.5\% \pm 2.045(1.826) \) |
1.77 |
9.23 |
52.2 |
Решение для части 3:
Ширина доверительного интервала уменьшается по мере увеличения размера выборки. Это уменьшение является функцией стандартной ошибки, которая становится меньше при увеличении \(n\).
Коэффициент надежности также становится меньше, так как число степеней свободы возрастает.
В последней колонке Таблицы 4 показан относительный размер ширины доверительных интервалов, если принять \(n = 10 \) за 100%. Размер выборки 20 уменьшает ширину доверительного интервала до 65.5% от ширины интервала для размера выборки 10.
При размере выборки 30 ширина интервала сокращается почти в два раза. На основе этих данных, инвестиционный менеджер получил бы наиболее точные результаты, используя размер выборки 30.
Рассмотрев многие из фундаментальных понятий статистической выборки и оценки, мы можем сосредоточить внимание на вопросах отбора выборки, представляющих особый интерес для финансовых аналитиков. Качество выводов зависит от качества данных, а также от качества используемого плана выборки.
Финансовые данные создают особые проблемы, и планы выборки часто отражают одну или несколько систематических ошибок (смещений). В следующем разделе этого чтения обсуждаются эти вопросы.