logo search
Uchebnik_ADFHDP_2011 (1) / Учебник АДФХДП 2011 на гриф

Парный корреляционно-регрессионный анализ

Применение корреляционно-регрессионного анализа позволяет определить формулу расчета изменения результативного показателя под воздействием одного или нескольких факторов (в абсолютном измерении) и установить относительную степень зависимости результативного показателя от фактора.

Для решения первой задачи подбирается соответствующий тип математического уравнения, которое наилучшим образом отражает характер изучаемой связи. Легче всего определить тип модели используя графический анализ (Рисунок 7)

Рисунок 7 - Графический анализ характера изучаемой связи между факторным и результирующим показателем.

В случае, если графический анализ показывает зависимость между фактором и результатом, можно использовать корреляционный анализ для оценки степени близости фактических точек разброса к функции того или иного вида.

Прямолинейную зависимость характеризует уравнение прямой: Y = a + bx, где х – факторный показатель, Y – результативный показатель, a – постоянная величина результативного показателя, которая не связана с изменением данного фактора, b – показывает среднее изменение результативного показателя с повышением или понижением величины фактора на единицу его измерения.

При криволинейной зависимости между изучаемыми явлениями уравнение связи решается по такому же принципу. Уравнение может быть уравнением гиперболы, параболы и т.д.

Часто при графическом анализе колебания настолько велики, что догадаться о форме зависимости не представляется возможным. В этом случае сначала используются методы сглаживания, потом выявляется тренд.

Степень "прямолинейности" можно измерить с помощью Присоновского коэффициента корреляции (линейного коэффициент корреляции r)

Для линейной функции значение r находится в пределах от +1 до –1. Этот коэффициент измеряет тесноту связи с линейной зависимостью.

Коэффициенты корреляции, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться под действием случайных причин. Поэтому необходима проверка их сущности. Для оценки значимости r применяется t-критерий Стьюдента . При этом определяется фактическое значение критерия tr и сравнивается с критерием tк, которое берется из таблицы (Таблица 18). Если tr > tк, то величина коэффициента корреляции признается существенной.

Таблица 18 - Количественные критерии оценки тесноты связи (шкала Чеддока)

В случае сравнения индикатора и результата высокий положительный коэффициент корреляции (скажем, больше +0,70) означает, что за изменением фактора должно последовать соответствующее изменение показателя результата. Высокая отрицательная корреляция (например, меньше 0,70) говорит о том, что изменение индикатора обычно вызывает изменение результата в противоположном направлении. Низкий (т.е. близкий к нулю) коэффициент корреляции означает слабую взаимосвязь результата и фактора.

Коэффициент детерминации (возведенный в квадрат коэффициент корреляции) можно использовать для количественного определения характеристики, связывающей фактор и результат. Например, если коэффициент детерминации при расчете зависимости объема реализации от расходов на рекламу равен 0,64, то можно говорить о том, что 64% изменений в объеме реализации связаны с изменением расходов на рекламу.

Для ранговой корреляции находятся разницы между парами рангов (d) и коэффициент ранговой корреляции , гдеn – число значений в ряду. Этот коэффициент измеряет тесноту связи между ранжированными рядами. Значение его находится в пределах от +1 до –1, чем ближе он к +1 или –1, тем зависимость больше.

Для нелинейных зависимостей оценка тесноты связи производится путем исчисления корреляционного отношения, которое можно применять при любой форме зависимости, однако для его исчисления сначала необходимо с помощью регрессионного анализа функцию и рассчитать выровненные значения результативного показателя yх=f(x):

где

При истолковании получившихся значений необходимо оценивать результат с точки зрения логики. Например, при расчете двух рядов был получен весьма высокий коэффициент корреляции, однако явной причинной зависимости между рядами не наблюдается. Это может быть связано с тем, что оба эти ряда зависят от одной и той же третьей величины (фактора), который при анализе во внимание не принимался.

Наряду с определением тесноты связи необходимо выявить аналитическую форму связи. При стохастическом подходе такая задача решается методом регрессионного анализа. Слово "регрессия" (латинское regressio) означает "движение назад". В отличие от корреляционного анализа, при котором выявляются связи, зачастую, между случайными величинами, при регрессионном анализе ставится задача нахождения средней величины случайной переменной в том случае, если величина другой переменной (или других переменных - в зависимости от поставленной задачи) известна.

Регрессионный анализ включает в себя три этапа:

Линия регрессии – это линия наилучшего соответствия, проходящая через точки графика разброса. Уравнение линии регрессии при линейной зависимости могут быть рассчитаны на основе решения уравнения: y = a + bx

по формулам:

При связи по формуле:

решается уравнение

При связи по формуле:

решается уравнение

Важным условием успешного применения методов корреляционного и регрессионного анализов является обязательное осуществление предварительного качественного экономического анализа исследуемых процессов, объектов, явлений и показателей, позволяющего выявить реальные взаимосвязи, а также соблюдение требований математической статистики в отношении объема выборки.

Если же выявленные функции носят более сложную форму, находить коэффициент функции более сложно. В этом случае часто используют метод подстановки (вводом промежуточной переменной для упрощения модели)