Статистические методы предоставляют финансовым аналитикам мощный набор инструментов для анализа данных и получения из них выводов. Независимо от того, анализируем ли мы доходность активов, темпы роста прибыли, цены на сырьевые товары или любые другие финансовые данные, статистические инструменты помогают нам количественно определять важные характеристики финансовых данных.

В этом разделе представлены основы описания и анализа данных - раздел статистики, известный как описательная статистика. Раздел предоставляет набор полезных концепций и инструментов, проиллюстрированных в различных инвестиционных контекстах.

Он также демонстрирует статистические методы, которые позволяют нам обобщать и анализировать статистические распределения доходности. Мы исследуем четыре характеристики распределений доходности:

  • Насколько близка доходность к среднему значению или центру распределения (центральная тенденция, англ. 'central tendency');
  • Насколько далека доходность от центра распределения (дисперсия, англ. 'dispersion');
  • Образует ли распределение доходности симметричную или ассиметричную форму (асимметрия, англ. 'skewness'); а также
  • Возможны ли экстремальные значения (эксцесс, англ. 'kurtosis').

Эти понятия в целом применимы и к другим типам данных.

Что представляет собой финансовая статистика?

Термин статистика (англ. 'statistics') может иметь два широких значения: одно связано с данными, а другое - с методом. Средняя прибыль компании на акцию (EPS) за последние 20 кварталов или ее средняя прибыль за последние 10 лет - это статистика.

Мы также можем проанализировать исторические показатели прибыли на акцию, чтобы спрогнозировать будущую прибыль на акцию, или использовать прошлые показатели прибыли компании, чтобы рассчитать ее риски.

Совокупность методов, которые мы используем для сбора и анализа данных, также называется статистикой.


Статистические методы включают в себя описательную статистику и статистический вывод (индуктивная или инференциальная статистика, англ. 'inferential statistics').

Описательная статистика (англ. 'descriptive statistics') - это изучение того, как можно эффективно суммировать данные для описания важных аспектов больших совокупностей данных. Путем объединения массы чисел, описательная статистика превращает большие массивы данных в понятную информацию.

Статистический вывод (англ. 'statistical inference') подразумевает получение прогнозов, оценочных значений или суждений о большей группе значений на основе фактически наблюдаемой небольшой группы значений. Основой для статистического вывода является теория вероятности.

Наше внимание в данном разделе сосредоточено на описательной статистике.

Совокупности и выборки.

На протяжении всего изучения статистики мы проводим критическое различие между совокупностью и выборкой. В этом разделе мы объясним эти два термина, а также связанные термины «параметр» и «выборочная статистика».

Определение совокупности.

Совокупность (англ. 'population') - это все совокупность всех элементов указанной группы значений.

Любой описательный показатель, характеризующий совокупность, называется параметром (англ. 'parameter'). Несмотря на то, что у совокупности может быть много параметров, инвестиционных аналитиков, как правило, интересуют только некоторые из них, такими как среднее значение, размах доходности инвестиций и дисперсия.

Даже если можно наблюдать за всеми элементами совокупности, зачастую это слишком непрактично с точки зрения времени или денег.

Например, если совокупность включает всех клиентов телекоммуникационной компании по всему миру, а аналитик заинтересован в прогнозе сбыта компании, он сочтет слишком дорогостоящим наблюдение за всей генеральной совокупностью. Аналитик может решить эту ситуацию, сделав выборку из совокупности.

Определение выборки.

Выборка (англ. 'sample') является подмножеством совокупности.

Делая выборку, аналитик надеется, что она характерна для данной совокупности. Область статистики, известная как выборка или выборочный метод (англ. 'sampling'), связана с получением выборки соответствующими способами для достижения хорошей репрезентативности совокупности.

Ранее мы упоминали статистику как понятие, связанное с данными. Точно так же, как параметр является описательным показателем совокупности, выборочная статистика (или для краткости статистика) является описательным показателем характеристики выборки.

Определение выборочной статистики.

Выборочная статистика или статистика (англ. 'sample statistics') представляет собой величину, вычисляемую или используемую для описания выборки.

Большая часть этого раздела посвящена объяснению и иллюстрации использования статистики в этом смысле. Эта концепция имеет решающее значение также в статистическом выводе, который решает такие проблемы, как оценка неизвестного параметра совокупности с использованием выборочной статистики.

Измерительные шкалы в статистике.

Чтобы выбрать подходящие статистические методы для обобщения и анализа данных, нам необходимо различать различные шкалы измерений или уровни измерений. Все измерения данных проводятся по одной из четырех основных шкал: номинальная, порядковая, интервальная или относительная.


Номинальные шкалы (англ. 'nominal scales') представляют собой самый поверхностный уровень измерения: они классифицируют данные, но не ранжируют их.

Если мы присвоим целые числа взаимным фондам, которые следуют различным инвестиционным стратегиям, число 1 может относиться к фонду с низкой капитализацией, число 2 к фонду с более высокой капитализацией и т. д. для каждого возможного уровня капитализации. Эта номинальная шкала классифицирует фонды согласно их капитализации, но не ранжирует их.


Порядковые шкалы (англ. 'ordinal scales') отражают более сильный уровень измерения. Порядковые шкалы сортируют данные с учетом некоторой характеристики.

Например, рейтинги Morningstar и Standard & Poor's для взаимных фондов представляют собой порядковую шкалу, в которой одна звезда представляет группу фондов, которые, по оценкам, имеют относительно худшие показатели, а две, три, четыре и пять звезд представляют группы с возрастающими показателями эффективности, по оценке этих рейтинговых агентств.

Порядковая шкала может также включать числа для определения категорий. Например, при ранжировании сбалансированных взаимных фондов на основе их 5-летнего совокупного дохода мы могли бы присвоить число 1 верхним 10% фондов и т. д., чтобы число 10 представляло нижние 10% фондов.

Порядковая шкала лучше, чем номинальная, поскольку она показывает, что фонд с рейтингом 1 показал лучшие результаты, чем фонд с рейтингом 2. Однако эта шкала ничего не говорит нам о разнице в эффективности между фондами с рейтингом 1 и 2 по сравнению с разницей в эффективности между фондами с рейтингом 3 и 4 или 9 и 10.


Интервальные шкалы (англ. 'interval scales') обеспечивают не только ранжирование, но и гарантируют, что различия между значениями шкал равны. В результате значения шкал можно осмысленно складывать и вычитать.

Шкалы Цельсия и Фаренгейта являются интервальными измерительными шкалами. Разница температур между 10 и 11 °C равна разнице между 40 и 41 °C. Мы можем точно сказать, что 12 °C = 9 °C + 3 °C, например.

Тем не менее, нулевая отметка интервальной шкалы не отражает полного отсутствия измеряемой величины; это не истинная нулевая точка или естественный ноль. Нулевой градус Цельсия соответствует точке замерзания воды, а не отсутствию температуры.

Из-за отсутствия истинной нулевой точки, мы не можем осмысленно формировать пропорции на интервальных шкалах. Например, 50 °C, хотя и в 5 раз больше, чем 10 °C, не представляет в 5 раз большую температуру.

Кроме того, шкалы анкет также часто рассматриваются как интервальные шкалы. Если инвестора просят оценить его неприятие риска по шкале от 1 (крайне не склонный к риску) до 7 (чрезвычайно склонный к риску), иногда предполагается, что разница между ответом 1 и ответом 2 представляет ту же разницу в неприятии риска как разница между ответами 6 и 7. Если это предположение оправдано, данные измеряются по интервальной шкале.


Шкалы отношений или пропорциональные шкалы (англ. 'ratio scale') представляют самый сильный уровень измерения. Они обладают всеми характеристиками интервальных шкал, а также имеют истинную нулевую точку в качестве начала координат.

С помощью шкал отношений мы можем осмысленно вычислять пропорции, а также осмысленно складывать и вычитать суммы в пределах шкалы. В результате мы можем применять самый широкий спектр статистических инструментов к данным, измеренным по шкале отношений.

Ставки доходности измеряются по шкале отношений, как и деньги. Если у нас вдвое больше денег, то у нас вдвое больше покупательной способности. Обратите внимание, что эта шкала имеет естественный ноль - ноль означает отсутствие денег.

Пример определения шкалы измерения.

Определите шкалу измерения в каждой из перечисленных ситуаций:

  1. Кредитные рейтинги для облигационных выпусков.
  2. Выплаты дивидендов на акцию.
  3. Типы классификации хедж-фондов.
  4. Сроки обращения облигаций в годах.

Решение для части 1:

Кредитные рейтинги измеряются по порядковой шкале. Рейтинг помещает выпуск облигаций в определенную категорию, а категории располагаются в соответствии с ожидаемой вероятностью дефолта.

Но разница в ожидаемой вероятности дефолта между AA- и A +, например, не обязательно равна разнице между BB- и B +. Другими словами, буквенные кредитные рейтинги не измеряются по интервальной шкале.

Решение для части 2:

Выплаты дивидендов на акцию оценивается по шкале отношений. Для этого показателя 0 означает полное отсутствие дивидендов; это истинная нулевая точка.

Решение для части 3:

Типы классификации хедж-фондов оцениваются по номинальной шкале. Каждый тип объединяет хедж-фонды с похожими инвестиционными стратегиями. Однако, в отличие от кредитных рейтингов по облигациям, классификация хедж-фондов не предполагает ранжирования. Таким образом, такие схемы классификации не измеряются по порядковой шкале.

Решение для части 4:

Сроки обращения облигаций измеряется по шкале отношений.