В чем состоит анализ регрессионной модели?
Задачи регрессионного анализа
Основная задача регрессионного анализа заключается в нахождении по выборке объемом n оценки неизвестных коэффициентов регрессии b0, b1,..., bk. Задачи регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным для переменных Xi и Y:
получить наилучшие оценки неизвестных параметров b0, b1,..., bk;
проверить статистические гипотезы о параметрах модели;
проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).
Регрессионный анализ — метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ — раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных.
Регрессия — зависимость математического ожидания (например, среднего значения) случайной величины от одной или нескольких других случайных величин (свободных переменных), то есть . Регрессионным анализом называется поиск такой функции , которая описывает эту зависимость. Регрессия может быть представлена в виде суммы неслучайной и случайной составляющих.
где — функция регрессионной зависимости, а или — аддитивная случайная величина с нулевым математическим ожиданием (ошибка).
Выборка может быть не функцией (функциональная зависимость), а отношением. Например, данные для построения регрессии могут быть такими: . В такой выборке одному значению переменной соответствует несколько значений переменной (статистическая зависимость).
- Контрольные вопросы по курсу «Математическая статистика»
- Что называют дискретным вариационным рядом? Интервальным вариационным рядом? Что называют частостями вариационного ряда? Что называют накопленной частотой и накопленной частостью?
- Пример:
- 2. Что называют полигоном вариационного ряда? Что называют гистограммой частот (частостей) вариационного ряда? Что называют кумулятой вариационного ряда?
- Медиана
- Коэффициент вариации
- Дайте определения начальных и центральных моментов вариационного ряда. Дайте определение коэффициента асимметрии вариационного ряда. Дайте определение эксцесса вариационного ряда.
- Что понимается под генеральной совокупностью? Что понимается под случайной выборкой из генеральной совокупности?
- 6. Каковы основные задачи математической статистики?
- 7. Дайте определение выборочной функции распределения. Дайте определение выборочной средней арифметической. Дайте определение выборочной дисперсии.
- 8. Дайте определение выборочных начальных и центральных моментов.
- Дайте определение статистического ряда выборки.
- 10. Дайте определение эмпирической функции распределения. Дайте определение эмпирической плотности распределения.
- 20. Какова цель дисперсионного анализа? Запишите модель однофакторного дисперсионного анализа.
- 21. Что понимают под уровнем фактора? (ответ в Вопросе 22)
- 22. Как ставится основная гипотеза в случае однофакторного дисперсионного анализа?
- 23. Что такое вектор входных переменных (факторов), вектор выходных переменных (откликов)?
- 24. Что называют корреляционным полем, корреляционной таблицей?
- 26. Какую функцию называют функцией регрессии? Какие переменные называют входными (факторами), выходными (откликами)? Какую регрессионную модель называют линейной?
- 27. Сформулируйте исходные предположения метода наименьших квадратов.
- В чем состоит анализ регрессионной модели?
- 29. Какую статистику используют для проверки значимости модели регрессии?
- 30. Какую линейную регрессионную модель называют адекватной?