Медиана
Определение. Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина — больше.
Собственно, этим и ограничивается смысловое значение медианы. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных.
Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как
Пусть, например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12 14 14 18 20 22 22 26 28. Тогда ранг медианы
и медиана, обозначаемая символом Ме, совпадает с пятым членом ряда: Ме = 20.
Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 членов: 6 8 10 12 14 16 18 20 22 24.
Ранг медианы оказывается равным
Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.
Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом.
Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n/2 (n — объем выборки) или накопленная относительная частота — больше 0,5.
Внутри медианного интервала медиана определяется по следующей формуле:
(3.3)
где xMeн — нижняя граница медианного интервала; — половина объема выборки; hme — ширина медианного интервала; — накопленная частота интервала, предшествующего медианному, nMe — частота медианного интервала.
Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.
Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, среднее арифметическое теряет свою практическую ценность, поскольку при этом значительно большая часть значений признака оказывается выше или ниже среднего арифметического. В этой ситуации медиана представляет собой лучшую характеристику центра распределения.
Мода
Определение. Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто (наиболее часто встречающееся значение в выборке).
Ряд называется унимодальным, если в нем только одно модальное значение и полимодальным, если есть несколько значений признака, которые встречаются одинаково часто. Для полимодального ряда моду не вычисляют.
Для дискретного ряда мода находится по определению.
Интервал группировки с наибольшей частотой называется модальным.
Для определения моды в интервальном ряду используется следующая формула:
(3.4)
где хмон — нижняя граница модального интервала; h — ширина интервала группировки; nMo — частота модального интервала; nMo-1 — частота интервала, предшествующего модальному; nMo+1 — частота интервала, следующего за модальным.
Дисперсия являются важнейшей характеристикой рассеяния исследуемой случайной величины x.
Определение. Дисперсией D(x) называется средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая но выборочным данным, называется выборочной дисперсией и обозначается (S(x)).
Выборочную дисперсию вычисляют по приведенным ниже формулам:
Для несгруппированных данных:
. (3.5)
В этой формуле — сумма квадратов отклонений значений признака xi от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.
Для сгруппированных в интервальный вариационный ряд данных:
. (3.6)
Здесь хi — срединные значения интервалов группировки; — взвешенная сумма квадратов отклонений.
Размерность дисперсии не совпадает с единицами измерения варьирующего признака. Дисперсия измеряется в единицами измерения признака в квадрате.
Стандартное отклонение
Определение. Стандартным отклонением (или средним квадратическим отклонением) называется корень квадратный из дисперсии:
. (3.9)
где или S(x) - выборочная дисперсия вариационного ряда.
Размерность стандартного отклонения в отличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.
- Контрольные вопросы по курсу «Математическая статистика»
- Что называют дискретным вариационным рядом? Интервальным вариационным рядом? Что называют частостями вариационного ряда? Что называют накопленной частотой и накопленной частостью?
- Пример:
- 2. Что называют полигоном вариационного ряда? Что называют гистограммой частот (частостей) вариационного ряда? Что называют кумулятой вариационного ряда?
- Медиана
- Коэффициент вариации
- Дайте определения начальных и центральных моментов вариационного ряда. Дайте определение коэффициента асимметрии вариационного ряда. Дайте определение эксцесса вариационного ряда.
- Что понимается под генеральной совокупностью? Что понимается под случайной выборкой из генеральной совокупности?
- 6. Каковы основные задачи математической статистики?
- 7. Дайте определение выборочной функции распределения. Дайте определение выборочной средней арифметической. Дайте определение выборочной дисперсии.
- 8. Дайте определение выборочных начальных и центральных моментов.
- Дайте определение статистического ряда выборки.
- 10. Дайте определение эмпирической функции распределения. Дайте определение эмпирической плотности распределения.
- 20. Какова цель дисперсионного анализа? Запишите модель однофакторного дисперсионного анализа.
- 21. Что понимают под уровнем фактора? (ответ в Вопросе 22)
- 22. Как ставится основная гипотеза в случае однофакторного дисперсионного анализа?
- 23. Что такое вектор входных переменных (факторов), вектор выходных переменных (откликов)?
- 24. Что называют корреляционным полем, корреляционной таблицей?
- 26. Какую функцию называют функцией регрессии? Какие переменные называют входными (факторами), выходными (откликами)? Какую регрессионную модель называют линейной?
- 27. Сформулируйте исходные предположения метода наименьших квадратов.
- В чем состоит анализ регрессионной модели?
- 29. Какую статистику используют для проверки значимости модели регрессии?
- 30. Какую линейную регрессионную модель называют адекватной?