27 Гомоскедастичность остатков регрессионной функции. Гетероскедастичность остатков регрессионной функции.
Дисперсия - среднее арифметическое из квадратов отклонений наблюденных значений (x1, x2,...,xn) случайной величины от их среднего арифметического.Гомоскедастичность остатков означает, что для каждого значения фактора xj остатки имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетеродастичности можно наглядно видеть из поля корреляции. а — дисперсия остатков растет по мере увеличения х; б — дисперсия остатков достигает максимальной величины при средних значениях переменной х и уменьшается при минимальных и максимальных значениях х; в — максимальная дисперсия остатков при малых значениях х и дисперсия остатков однородна по мере увеличения значений х. Наличие гомоскедастичности или гетероскедастичности можно видеть и по графику зависимости остатков от теоретических значений результативного признака . Большая дисперсия для больших значений . Гетероскедастичность будет сказываться на уменьшении эффективности оценок В частности, становится затруднительным использование формулы стандартной ошибки коэффициента регрессии предполагающей единую дисперсию остатков для любых значений фактора. Практически при нарушении гомоскедастичности мы имеем неравенства: или При этом величина может меняться при переходе от одного значения фактора к другому. Это означает, что сумма квадратов отклонений для зависимости при наличии гетероскедастичности должна иметь вид: При минимизации этой суммы квадратов отдельные ее слагаемые взвешиваются: наблюдениям с наибольшей дисперсией придается пропорционально меньший вес. Задача состоит в том, чтобы определить величину и внести поправку в исходные переменные. С этой целью рекомендуется использовать обобщенный метод наименьших квадратов, который эквивалентен обыкновенному МНК, примененному к преобразованным данным. Чтобы убедиться в необходимости использования обобщенного МНК, обычно не ограничиваются визуальной проверкой гетероскедастичности, а приводят ее эмпирическое подтверждение. При малом объеме выборки для оценки нарушения гомоскедастичности можно использовать метод Гольдфельда-Квандта, который включает: 1.Упорядочение наблюдений n по мере возрастания переменной х. 2. Исключения из рассмотрения центральных наблюдений C; при этом где p – число оцениваемых параметров. 3. Разделение совокупности на две группы (с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии. 4. Определение остаточной суммы квадратов для обеих групп и и нахождение их отношения: При выполнении нулевой гипотезы о гомоскедастичности отношение R будет соответствовать F-критерию с степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табл. значение F-критерия, тем больше нарушена предпосылка о равенстве дисперсий остаточных величин.
26 Предпосылки метода наименьших квадратов. При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей , которая представляет собой в уравнении ненаблюдаемую величину. Исследования остатковпредполагают проверку наличия следующих пяти предпосылок МНК: 1) случайный характер остатков. С этой целью строится график отклонения остатков от теоретических значений признака. Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и применение МНК оправдано. В других случаях необходимо применить либо другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами. 2) нулевая средняя величина остатков, т.е. , не зависящая от хi. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков от теоретических значений результативного признака ух строится график зависимости случайных остатков от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj. Если же график показывает наличие зависимости и хj то модель неадекватна. Причины неадекватности могут быть разные. 3. Гомоскедастичность — дисперсия каждого отклонения одинакова для всех значений хj. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. 4. Отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. 5. Остатки подчиняются нормальному распределению. В тех случаях, когда все пять предпосылок выполняются, оценки, полученные по МНК и методу максимального правдоподобия, совпадают между собой. Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель, изменить ее спецификацию, добавить (исключить) некоторые факторы, преобразовать исходные данные, что в конечном итоге позволяет получить оценки коэффициентов регрессии aj, которые обладают свойством несмещаемости, имеют меньшее значение дисперсии остатков, и в связи с этим более эффективную статистическую проверку значимости параметров регрессии.
- 35 Моделирование тенденции временного ряда
- 34 Автокорреляция уровней временного ряда. Анализ структуры временного ряда на основании коэффициентов автокорреляции
- 33 Коэффициент автокорреляции. Их свойства
- Анализ временных рядов
- Примеры временных рядов
- 31 Автокорреляция уровней временного ряда и выявление его структуры
- 30 Основные элементы временного ряда
- Метод Гольдфельда-Квандта проверки гипотезы гомоскедастичности
- 27 Гомоскедастичность остатков регрессионной функции. Гетероскедастичность остатков регрессионной функции.
- 25 Фиктивные переменные во множественной регрессии
- 21 Множественная корреляция (multiple correlation)
- Частные уравнения регрессии
- 15 10.2. Отбор факторов при построении множественной регрессии