Корреляционный анализ количественных признаков
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.
По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.
Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.
По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.
Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.
Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.
Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.
Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.
- 67 Содержание
- Введение
- Раздел 1 сущность и значение статистики
- Предмет, метод и задачи статистики
- Понятие статистики, методы и задачи
- Методы статистического наблюдения
- Характеристика сводки и обработки первичной информации
- Характеристика обобщения и анализа статистической информации
- 1.2 Задачи и принципы организации государственной статистики в Российской Федерации
- Развитие статистики как науки
- История развития муниципальной статистики в Российской Федерации
- Организация статистики в Российской Федерации
- Органы государственной статистики в Российской Федерации
- Раздел 2
- Этапы проведения статистического наблюдения
- 2.2 Формы, виды и способы организации статистического наблюдения
- Формы статистической отчётности
- Планирование и организация статистического наблюдения
- Раздел 3 сводка и группировка статистических данных
- Задачи и виды статистической сводки
- Понятие и виды сводки
- Характеристика простой сводки
- Характеристика типологических группировок
- Характеристика аналитических группировок
- Характеристика структурных группировок
- Принципы построения группировок
- Ряды распределения в статистике
- Построение рядов распределения
- Виды рядов распределения
- Графическое изображение рядов распределения
- Раздел 4
- Виды таблиц
- Основные правила оформления и чтения таблиц
- Статистические графики и правила их построения
- Основные элементы статистических графиков
- Классификация графиков по видам
- Диаграммы сравнения
- Статистические карты
- Раздел 5 статистические показатели
- Абсолютные и относительные величины в статистике
- Статистический показатель и его виды
- Абсолютные показатели, единицы их измерения
- Относительные показатели
- Средние величины в статистике
- Понятие среднего показателя
- Средняя арифметическая и её свойства
- Другие виды средних показателей
- Структурные средние
- Показатели вариации в статистике
- Основные показатели, характеризующие вариацию
- Способы расчёта показателей вариации
- Раздел 6 ряды динамики в статистике
- 6.1. Виды и методы анализа рядов динамики
- Динамические ряды и их виды
- Моментные и интервальные ряды динамики
- 6.2. Основные показатели анализа динамических рядов
- Абсолютный прирост
- Темп роста
- Темп прироста
- Средние показатели
- Раздел 7 индексы в статистике
- 7.1. Понятие статистических индексов и их роль в экономике
- Индивидуальные индексы
- Общие индексы и их свойства
- Индексы цены и индексы физического объёма
- 7.2. Среднеарифметические и среднегармонические индексы
- Понятие среднеарифметических и среднегармонических индексов
- Формулы расчёта среднеарифметических и среднегармонических индексов
- Раздел 8 выборочное наблюдение в статистике
- 8.1. Способы формирования выборочной совокупности
- Понятие выборочного наблюдения
- Способы отбора единиц при выборочном обследовании
- 8.2. Методы оценки результатов выборочного наблюдения
- Понятие ошибки выборочного наблюдения
- Оптимальная численность выборки
- Раздел 9 статистическое изучение связи между явлениями
- 9.1. Методы изучения связи между явлениями
- Основные понятия методов изучения связи между явлениями
- Виды зависимостей между экономическими явлениями
- 9.2. Корреляционно-регрессионный анализ
- Корреляционный анализ количественных признаков
- Корреляционный анализ порядковых переменных
- Метод наименьших квадратов
- Метод наименьших модулей
- Двумерное линейное уравнение регрессии