Инвестиционные аналитики обычно работают как с временными рядами, так и с перекрестными данными.

Временной ряд данных (англ. 'time series data') представляет собой последовательность ставок доходности, собранных через дискретные и одинаковые интервалы времени (например, исторические ряды ежемесячных ставок доходности акций).

Перекрестные данные (англ. 'cross-sectional data') - это данные о некоторой характеристике отдельных людей, групп, географических регионов или компаний в один и тот же момент времени. Балансовая стоимость на акцию на конец 2014 года для всех компаний Нью-Йоркской фондовой биржи является примером перекрестных данных.

Экономическая или финансовая теория не дает никакой основы для определения того, следует ли выбрать длинный или короткий период времени, чтобы сделать выборку. Как финансовым аналитикам, нам, возможно, придется самим искать тонкие подсказки.


Например, объединение данных за период, когда наблюдались фиксированные обменные курсы, с данными за другой период, с плавающими валютными курсами, было бы неуместным.

Дисперсия обменных курсов, в тот период, когда они были фиксированными, конечно, будет меньше, чем за период с плавающим курсом. Как следствие, мы не должны делать выборку из генеральной совокупности, описываемой одним набором параметров.

Когда среднее или дисперсия временного ряда не постоянны с течением времени, временной ряд не является стационарным.

Направление денежно-кредитной политики [жесткая (сдерживающая) или мягкая (свободная или стимулирующая)] также влияет на распределение доходности акций. Таким образом, объединение данных из периода с жесткой и мягкой денежно-кредитной политикой было бы неуместным.

Пример (2) иллюстрирует проблемы, которые могут возникнуть при выборке из более чем одного распределения данных.

Пример (2) расчета коэффициента Шарпа за один или два года квартальных данных.

Аналитики часто используют коэффициент Шарпа для оценки эффективности управляющего портфеля. Коэффициент Шарпа является средней доходностью портфеля сверх безрисковой ставки, деленной на стандартное отклонение доходности. Это соотношение оценивает избыточную доходность (англ. 'excess return'), заработанную на единицу стандартного отклонения доходности.

[см. также подробное описание этой концепции: CFA - Коэффициент Шарпа]


Предположим, что для вычисления коэффициента Шарпа аналитик использует ряд значений избыточной доходности (т.е. совокупная доходность сверх безрисковой ставки) за 8 кварталов. В течение 1-го года инвестиционный менеджер портфеля следовал стратегии с низким уровнем риска, а в течение 2-го года менеджер следовал стратегии высокого риска.

Для каждого года аналитик также отслеживает ежеквартальную избыточную прибыль с относительно некоторого эталонного показателя, по которому будет оцениваться эффективность работы менеджера. Для 1 и 2 года эталонный коэффициент Шарпа составляет 0.21.

В Таблице 1 приведено вычисление коэффициента Шарпа для портфеля.

Таблица 1. Расчет коэффициентов Шарпа
для стратегий низкого и высокого риска.

Квартал / Показатель

1 год

2 год

Избыточная доходность

Избыточная доходность

1-й квартал

-3%

-12%

2-й квартал

5

20

3-й квартал

-3

-12

4-й квартал

5

20

Квартальное среднее

1%

4%

Квартальное стандартное отклонение

4.62%

18.48%

Коэффициент Шарпа = 0.22 = 1/4.62 = 4/18.48

В течение первого года, когда менеджер следует стратегии с низким уровнем риска, средняя квартальная доходность сверх безрисковой ставки составила 1% со стандартным отклонением 4.62%. Коэффициент Шарпа, таким образом, составил 1/4.62 = 0.22.

Результаты второго года идентичны результатам первого года, за исключением более высокой средней доходности и волатильности. Коэффициент Шарпа за второй год составляет 4/18.48 = 0.22. Эталонный коэффициент Шарпа составляет 0.21 за первый и второй год.

Поскольку большие коэффициенты Шарпа лучше, чем меньшие (обеспечение более высокой доходности на единицу риска), менеджер, кажется, превзошел эталон.

Теперь предположим, что аналитик считает, что большая выборка даст более достоверный результат. Поэтому он решает объединить эти два года и рассчитать коэффициент Шарпа, основанный на совокупности восьми квартальных наблюдений.

Среднеквартальная избыточная доходность за 2 года равна среднему значению среднеквартальной избыточной доходности каждого года. Для двухлетнего периода она составляет (1 + 4)/2 = 2.5% в квартал.

Стандартное отклонение для всех восьми кварталов при выборочном среднем 2.5% составляет 12.57%. Коэффициент Шарпа для двухлетнего периода теперь составляет 2.5/12.57 = 0.199. Эталонный коэффициент Шарпа остается 0.21.

Таким образом, при объединении ставок доходности за двухлетний период, менеджер, по-видимому, обеспечит меньшую доходность на единицу риска, по сравнению с эталоном, и меньшую доходность по сравнению с отдельными годовыми результатами.

Проблема с использованием квартальных данных за 8 кварталов заключается в том, что аналитик нарушил допущение о том, что выборка ставок доходности берется из той же генеральной совокупности. В результате изменения в инвестиционной стратегии менеджера, ставки доходности за 2-й год имеют иное распределение, чем ставки доходности за 1-й год.

Очевидно, что в течение 1 года, выборка доходности была получена из совокупности с более низким средним и дисперсией, чем в совокупности второго года. Объединение результатов первого и второго года дало выборку, не соответствующую ни одной совокупности - ни 1-го, ни 2-го года.

Поскольку большая выборка не удовлетворяет допущениям модели, любые выводы, полученные аналитиком на основании нее, будут ошибочны.

В этом примере аналитику лучше использовать меньшую выборку (т.е. за год), так как она представляет собой более равномерное распределение доходности.

Перекрестные данные.

Второй основной тип данных представляет собой перекрестные данные.

Читатель может также столкнуться с двумя типами данных, которые включают как временные ряды, так и перекрестные данные. Многомерный временной ряд (англ. 'panel data') состоит из наблюдений, сделанных на протяжении определенного времени для одной характеристики нескольких наблюдательных объектов (например, компаний).

Например, годовой уровень инфляции в странах еврозоны в течение пяти лет будет представляет собой многомерный временной ряд.

Продольные данные (или продольный срез данных, англ. 'longitudinal data') состоят из наблюдений характеристик(и) одного и того же наблюдаемого объекта в течении периода времени.

Наблюдения для набора финансовых коэффициентов для одной компании за 10-летний период является примером продольных данных.

И перекрестные и продольные данные могут быть представлены в виде массивов данных (матриц), в которых последовательные строки представляют собой наблюдения за последовательные периоды времени.

В перекрестных данных (или поперечном срезе данных, англ. 'cross-sectional data') наблюдения выборки представляет собой характеристику отдельных людей, групп, географических регионов или компаний в определенный общий момент времени. Поэтому поперечные данные также называют одномоментной выборкой данных.

Пример с анализом клиентов телекоммуникационной компании, обсуждавшийся ранее, по существу, заключался в сборе перекрестных планируемых капитальных расходов клиентов на предстоящий год.

Всякий раз, когда мы делаем перекрестную выборку данных, должны выполняться некоторые допущения, если мы хотим осмысленно обобщать эти данные. Опять же, разумным подходом будет воспринимать интересующее наблюдение как случайную величину, принадлежащую некоторой генеральной совокупности с заданным средним и дисперсией.

Как мы делаем нашу выборку и начинаем обобщать данные, мы должны быть уверены, что все эти данные, действительно, на самом деле, принадлежат одной общей генеральной совокупности.


Например, аналитик может быть заинтересован в определении того, насколько эффективно компании используют свои запасы.

Некоторые компании, однако, оборачивают свои запасы быстрее, чем другие, из-за отличий их операционной среды (например, продуктовые магазины обычно оборачивают свои запасы значительно быстрее, чем производители автомобилей). Таким образом, распределение коэффициентов оборачиваемости запасов для всех компаний нельзя охарактеризовать одним распределением с заданным средним значением и дисперсией.

Таким образом, обобщение оборачиваемости запасов по всем компаниям может быть неуместным.

Если случайные величины относятся к различным распределениям вероятности, то статистики, вычисленные по объединенным выборкам, не будут связаны с одним общим параметром лежащей в основе генеральной совокупности. Размер ошибки выборки в таких случаях неизвестен.

В подобных случаях аналитики часто обобщают данные на уровне компаний, принадлежащих одной отрасли. Попытка обобщения данных по отрасли частично решает проблему разных распределений, но крупные корпорации часто присутствуют в более чем в одной отрасли, поэтому аналитики должны быть уверены, что они понимают, к каким отраслевым группам относятся компании.

Имеем ли мы дело с временными рядами или перекрестными данными, мы должны быть уверены, что получили случайную выборку, репрезентативную рассматриваемой совокупности.

Задавшись целью получения информации на основе репрезентативных выборок, мы переходим к следующей части этого чтения, которая посвящена центральной предельной теореме, а также точечной и интервальной оценке среднего значения совокупности.