logo
УМП Прогнозирование деятел предприятия (3)

Оценка адекватности, точности и надежности моделей тренда

Независимо от вида построенной модели динамического ряда решение о возможности ее применения в целях анализа и прогнозирования экономического явления принимается только после того, как установлено качество данной модели. Качество модели временного ряда в статистических пакетах оценивается, как правило, по аналогии с парными и множественными регрессионными моделями с помощью двух дополняющих друг друга характеристик: а) адекватность; б) точность и надежность. Каждая из этих характеристик имеет несколько критериев.

Оценка адекватности, т.е. соответствия модели исследуемому явлению или объекту, базируется на анализе ряда остатков (), выражающих отклонения расчетных значений зависимой переменной () от фактических (yt):

Модель считается адекватной, если остаточное отклонение временного ряда удовлетворяет свойствам случайной компоненты. Поэтому адекватность модели оценивается следующими критериями:

- случайность колебаний остаточных отклонений;

- нормальность распределения остатков;

- равенство математического ожидания уровней ряда остатков нулю;

- независимость значений уровней ряда остаточных отклонений.

При оценке адекватности функции тренда учитывается также коэффициент детерминации, получаемый для анализируемого ряда на основе данной функции.

Проверка случайности колебаний остаточных отклонений означает проверку правильности выбора вида тренда. Для данной проверки необходимо получить ряд остатков (6.55) функции тренда. Свойство этих уровней остатков (отклонений) анализируется с применением ряда непараметрических критериев.

В статистических пакетах программ АРМ СтОД, ОЛИМП и СтатЭксперт предусмотрен критерий серий, определяемый на основе медианы () ряда остатков. Здесь используется следующая схема вычислений.

Ряд остатков , упорядочивается по возрастанию значений, затем определяется медиана полученного вариационного ряда. Если ряд имеет четное количество (n) элементов, то медиана () равна срединному значению, а при нечетном n она определяется как средняя арифметическая из двух срединных значений ряда.

После данной процедуры все элементы исходного ряда (6.55) последовательно сравниваются с , при этом знак «+» ставится, если > , и знак «–», если < . При = для сравнения берется следующее значение Таким образом получаются последовательности, состоящие из знаков «+» и «–»; их общее количество не превышает n. Непрерывную последовательность подряд идущих знаков «+» или «–» принято называть серией.

Чтобы последовательность отклонений () считать случайной выборкой, протяженность самой длинной серии не должна быть чрезмерно большой, а общее количество серий – слишком малым. Для количественного обоснования данного качественного умозаключения в статистике используются неравенства следующего вида (здесь квадратные скобки означают целую часть числа):

где Smax – протяженность самой длинной серии;

V – общее число серий.

Гипотеза о случайном характере () – отклонений фактических уровней временного ряда от рассчитанных по тренду подтверждается, если выполняются одновременно неравенства (6.56) и (6.57) для уровня значимости 0,05. В этом случае трендовая модель признается адекватной.

Если хотя бы одно из этих неравенств не соблюдается, гипотеза о случайности отклонений отвергается и трендовая модель признается неадекватной.

Другим критерием данной проверки является критерий поворотных точек. Остаток считается поворотной точкой, если < > , или > < . Общее число поворотных точек для остаточной последовательности обозначается через p.

Математическое ожидание числа точек поворота () и дисперсия () в случайной выборке выражаются следующими формулами:

где n – количество уровней временного ряда.

В качестве критерия случайности последовательности остатков с доверительной вероятностью 95% используется неравенство

Если данное неравенство соблюдается, то делается вывод о случайности колебаний уровней остаточной последовательности и трендовая модель считается адекватной.

В противном случае модель признается неадекватной.

Соответствие распределения ряда остатков нормальному закону проверяется приближенно: анализируются значения показателей асимметрии (А1) и эксцесса (E1), поскольку временные ряды экономического характера обычно не очень велики. Как известно, при нормальном распределении значения А1 = 0 и Е1 = 0.

Если одновременно выполняются неравенства применительно к эксцессу и асимметрии остатков тренда, то гипотеза о приближенном нормальном распределении уровней ряда остаточных отклонений принимается. В этом случае допустимо определение статистически достоверного доверительного интервала прогноза по данному тренду.

где максимальный и минимальный уровни ряда остатков;

- среднеквадратическое отклонение остатков (ошибок).

Определяется из выражения

Из таблицы критических уровней RS - критерия при числе наблюдений n и уровне значимости α (обычно α = 0,05) определяются нижняя и верхняя границы уровней RS1, и RS2. Если расчетное значение критерия RSp попадает в интервал между этими критическими границами, т.е. RS1 < RSp < RS2, то гипотеза о нормальности распределения отклонения принимается с заданным уровнем значимости и модель тренда считается адекватной. В противном случае модель признается неадекватной.

Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется так же, как для пространственных данных, на основе t - критерия Стьюдента. Такая проверка требует, чтобы распределение значений было нормальным.

Выдвигается нулевая гипотеза о равенстве нулю среднего значения ряда остаточных отклонений, т.е.. Вычисляется расчетное значение t - критерия (tр) по формуле

где – среднее значение уровней ряда остаточных отклонений ;

n – количество уровней ряда;

– стандартное (среднеквадратическое) отклонение для данной последовательности остатков , вычисляемое из выражения (6.61).

Определяется табличное значение t - критерия для заданного уровня значимости

Α (обычно α = 0,05 или 0,10) и при числе степеней свободы v = n - 1. Если tр > tт(α; v), то на уровне значимости а нулевая гипотеза отклоняется и трендовая модель считается неадекватной. В противном случае гипотеза о равенстве нулю математического ожидания последовательности случайных остаточных отклонений тренда принимается и модель признается адекватной.

В статистических пакетах среди характеристик остаточных отклонений тренда предусмотрено и вычисление среднего значения этих остатков (). Если = 0 или значение близко к нулю, то и без вычисления t - критерия можно судить о равенстве математического ожидания остатков тренда нулю.

Независимость значений уровней ряда остаточных отклонений устанавливается путем проверки наличия (отсутствия) существенной автокорреляции в остаточной последовательности тренда с помощью d - критерия Дарбина – Уотсона.

Поскольку полного однозначного соответствия статистической модели реальному процессу или явлению не бывает, в определенной мере адекватность – понятие условное. Поэтому, как следует из рассмотренных критериев, при моделировании экономических процессов имеется в виду адекватность не вообще, а по тем свойствам, которые принято считать существенными для исследования.

Точность и надежность модели характеризуют близость расчетных значений наблюдений к фактическим на периоде аппроксимации. При этом ряд характеристик модели оценивается с заданной доверительной вероятностью, определяющей надежность тех или иных статистических выводов.

Критериями оценки точности и надежности модели являются:

среднеквадратическое отклонение () или дисперсия () остатков;

средняя относительная ошибка аппроксимации;

коэффициенты парной корреляции, корреляционного отношения, детерминации;

существенность уравнения по F - критерию с заданной вероятностью (р);

значимость коэффициентов регрессии по F - критерию с вероятностью (р).

Все перечисленные критерии для трендов вычисляются по аналогии с парными и множественными регрессиями с применением указанных формул и имеют одинаковую интерпретацию. Заметим, что для трендов оценка значимости коэффициентов регрессии используется в меньшей степени из-за включения в модель одного-единственного фактора времени (t). Эти оценки имеют значение для полиномов высоких степеней, так как каждая степень (t2, t3 и т.д.) рассматривается как самостоятельная независимая переменная.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4