Моделирование курса акций AAPL и IBM

дипломная работа

2.3 Моделирование тенденции временного ряда акции AAPL

Рассматривается временной ряд, составленный из 252 значений цены акции AAPL (приложение А), взятых за год, за период с 4 января 2010 г. по 31 декабря 2010 г. Значения являются ежедневными, в неделе 5 дней торгов.

В первую очередь приведем график исходных данных (значение цены акции, приходящееся на определенную дату торгов), который имеет вид:

Рисунок 2.1 - График исходных данных для курса акции AAPL

Рассматриваемый ряд данных характеризуется возрастающей тенденцией. Динамика представляет собой постепенное возрастание цены с небольшими спадами в период с 29 января по 4 февраля и с 24 по 31 августа 2010 года. Наиболее экстремальные скачки в цене проявляются в период с 20 апреля по 2 июля.

После публикации финансовых результатов компании Apple стало известно, что подобный результат явился следствием успешной продажи новых моделей компьютеров Mac, телефонов и плееров IPhone и IPod, а также планшетов IPad.

Кроме того ряд содержит большое количество мелких и более крупных скачков, что свойственно курсам акций, которые являются достаточно ликвидными и, благодаря своей высокой волатильности, привлекают инвесторов и спекулянтов.

Вначале проверим ряд на наличие тренда методом Форстера-Стюарта. На основании результатов сравнения каждого из уровней со всеми предыдущими по формулам (1.2) и (1.3) получили две вспомогательные выборки и , которые были преобразованы в ряды вида (1.4) и (1.5). Рассчитав величины и , а также t-статистику для каждой из них по формуле (1.7) получили, что и . Следовательно, нулевая гипотеза отклоняется и тренд присутствует. Теперь подберем его для данного ряда.

При добавлении линий тренда к графику исходных данных видно (рисунок 2.2), что линейный тренд и полиномиальный тренд пятой степени наиболее точно соответствуют тенденции исследуемого ряда.

Рисунок 2.2 - График линейной и полиномиальной моделей для курса AAPL

Модели имеют вид: линейный тренд

полиномиальный тренд 5-го порядка

Коэффициенты детерминации для линейной и полиномиальной модели равны соответственно и . Следовательно, построенная полиномиальная модель (2.8) аппроксимирует исходные данные на 94.8%, остальные 5.2% приходятся на ошибки. Т.е. полиномиальный тренд 5-го порядка очень хорошо описывает ряд, линейная модель (2.7) - также хорошо, т.к. в обоих случаях. Будем рассматривать полиномиальную модель 5-го порядка как более точную.

Используем критерий Стьюдента для проверки значимости коэффициентов и критерий Фишера с уровнем значимости 0.05 для проверки значимости уравнения полиномиальной регрессии в целом.

При уровне значимости получили, что , в свою очередь фактические значения, вычисленные по (1.9) для соответствующего коэффициента, равны:

Видно, что для любого . Т.е. для модели (2.8) все коэффициенты уравнения регрессии значимы.

Значение критерия Фишера (1.11) , что намного больше табличного значения . Поскольку статистика , то можно сделать вывод о значимости уравнения регрессии по данному критерию на заданном уровне значимости.

После построения модели необходимо проверить 5 предпосылок Гаусса-Маркова: равенство нулю математического ожидания остатков; подчинение остатков нормальному закону распределения; случайный характер остатков модели; гомоскедастичность дисперсии остатков; отсутствие автокорреляционной зависимости в остатках.

При выполнении всех пяти предпосылок оценки коэффициентов регрессии будут обладать свойствами несмещенности Несмещенные оценки - это оценки, выборочное математическое ожидание которых равно оцениваемому параметру всей совокупности значений ряда. , эффективности Эффективные оценки - оценки, характеризующиеся наименьшей линейной дисперсией по сравнению с остальными оценками параметра. и состоятельности Состоятельные оценки - точечные оценки, сходящиеся по вероятности к оцениваемому параметру при увеличении объема рассматриваемых значений выборки. . График остатков представлен на рисунке 2.3:

Рисунок 2.3 - График остатков полиномиальной модели для курса AAPL

1. Математическое ожидание остатков имеет значение , которое очень близко к нулю. Отличие от нуля обусловлено погрешностью вычислений.

2. Вычислим - стандартную ошибку регрессии, используя формулу (1.10). Значение

По правилу трех сигм при заданном уровне значимости можно считать, что случайная величина, распределенная по нормальному закону, принадлежит интервалу . Поскольку математическое ожидание близко к нулю, то остатки принадлежат интервалу . Следовательно, на данном этапе нельзя отклонить гипотезу о нормальном распределении остатков. Вычислим коэффициенты асимметрии и эксцесса и воспользуемся статистикой Жака-Бера по формуле (1.15). Значение статистики , что меньше квантили распределения . Следовательно, гипотеза о нормальном распределении остатков не отклоняется.

3. Для проверки остатков на случайность используем критерий "поворотных точек".

C помощью MS Excel вычисляем для ряда остатков:

.

Правая часть неравенства (1.16) в свою очередь при уровне значимости 0.05 принимает значение 166.373. Следовательно, выборка остатков неслучайна.

4. Для проверки наличия гетероскедастичности используем ранговый коэффициент корреляции Спирмена.

Для рассматриваемого ряда остатков по формуле (1.17). Оценим статистическую значимость с помощью t-критерия по формуле (1.18): . Сравнив эту величину с табличной при уровне значимости , получили, что . Следовательно, гипотеза об отсутствии гетероскедастичности остатков отклоняется.

5. Для проверки наличия автокорреляции в остатках воспользуемся критерием Дарбина-Уотсона.

Используя формулу (1.19) получаем . Сравнивая рассчитанную величину с нижним значением критерия и принимая во внимание значение , делаем вывод - в остатках присутствует положительная автокорреляция.

Подведем итоги анализа ряда остатков. Последние три предпосылки Гаусса-Маркова: случайный характер остатков модели, гомоскедастичность дисперсии остатков и отсутствие автокорреляционной зависимости в остатках - оказались не соблюденными, что говорит о том, что построенные по МНК оценки коэффициентов уравнения регрессии не являются состоятельными и эффективными. Следовательно, данную модель необходимо корректировать.

Для того чтобы избавиться от автокорреляционной зависимости, попробуем улучшить модель (2.8), построив для ряда остатков модель авторегрессии AR (p), где - параметр, определяющий порядок авторегрессии.

Порядок модели AR (p) определяется исходя из внешнего вида графиков автокорреляционной (АКФ) и частной автокорреляционной (ЧАКФ) функций ряда остатков.

Вычислим коэффициенты автокорреляции уровней ряда по формуле:

где - значения ряда остатков,

Вычислим коэффициенты частной автокорреляции по формулам:

АКФ и ЧАКФ ряда представлены на рисунке 2.4 АКФ экспоненциально убывает и имеет достаточно много положительных значений, величина которых вероятнее всего обусловлена "распространением" автокорреляции при лаге 1, что подтверждается графиком ЧАКФ, из которого видно, что значимым является лишь значение ЧАКФ при лаге 1. Следовательно, для ряда будем строить модель AR (1) в виде:

Рисунок 2.4 - АКФ и ЧАКФ ряда остатков модели (2.8)

Построение модели проводилось в программе Statistica 6.0 [2,13]. Оценка параметров проведена с помощью метода наименьших квадратов. Получена следующая модель:

Теперь объединим модели (2.8) и (2.12) и построим график получившейся модели (рисунок 2.5):

Рисунок 2.5 - График модели (2.13) и фактических значений акции AAPL

Анализ остатков модели (2.13) показал, что ряд остатков удовлетворяет всем пяти предпосылкам регрессионного анализа. В частности статистика , что больше Следовательно, удалось избавиться от автокорреляции остатков. По критерию поворотных точек получили , что указывает на случайность остатков и, как следствие, адекватность построенной трендовой модели. Также для рассматриваемого ряда остатков скорректированной модели . Значит, . Следовательно, удалось получить гомоскедастичные остатки.

Проверим уравнение (2.13) на значимость по F-критерию Фишера.

Для модели (2.13) значение критерия Фишера (1.11) равно , что во много раз превышает табличное значение , следовательно, построенное уравнение (2.13) значимо.

Коэффициент детерминации получившейся модели равен , что говорит о высокой точности приближения построенной модели к исходному ряду данных, всего 1.2% приходится на ошибку.

Делись добром ;)