logo search
ВОПРОСЫ контр матстат

Медиана

Определение. Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина — больше.

      Собственно, этим и ограничивается смысловое значение медианы. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных.

      Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как

     

Пусть, например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12 14 14 18 20 22 22 26 28. Тогда ранг медианы

     

и медиана, обозначаемая символом Ме, совпадает с пятым членом ряда: Ме = 20.

      Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 членов: 6 8 10 12 14 16 18 20 22 24.

      Ранг медианы оказывается равным

     

Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.

      Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом.

      Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n/2 (n — объем выборки) или накопленная относительная частота — больше 0,5.

Внутри медианного интервала медиана определяется по следующей формуле:

                                                   (3.3)

где xMeн — нижняя граница медианного интервала;  — половина объема выборки; hme — ширина медианного интервала;  — накопленная частота интервала, предшествующего медианному, nMe — частота медианного интервала.

Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.

      Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, среднее арифметическое теряет свою практическую ценность, поскольку при этом значительно большая часть значений признака оказывается выше или ниже среднего арифметического. В этой ситуации медиана представляет собой лучшую характеристику центра распределения.

      Мода

Определение. Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто (наиболее часто встречающееся значение в выборке).

      Ряд называется унимодальным, если в нем только одно модальное значение и полимодальным, если есть несколько значений признака, которые встречаются одинаково часто. Для полимодального ряда моду не вычисляют.

      Для дискретного ряда мода находится по определению.

      Интервал группировки с наибольшей частотой называется модальным.

      Для определения моды в интервальном ряду используется следующая формула:

                                      (3.4)

где хмон — нижняя граница модального интервала; h — ширина интервала группировки; nMo — частота модального интервала; nMo-1 — частота интервала, предшествующего модальному; nMo+1 — частота интервала, следующего за модальным.

Дисперсия являются важнейшей характеристикой рассеяния исследуемой случайной величины x.

      Определение. Дисперсией D(x) называется средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая но выборочным данным, называется выборочной дисперсией и обозначается (S(x)).

      Выборочную дисперсию вычисляют по приведенным ниже формулам:

      Для несгруппированных данных:

.                                                            (3.5)

В этой формуле — сумма квадратов отклонений значений признака xi от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.

      Для сгруппированных в интервальный вариационный ряд данных:

.                                                          (3.6)

Здесь хi — срединные значения интервалов группировки; — взвешенная сумма квадратов отклонений.

      Размерность дисперсии не совпадает с единицами измерения варьирующего признака. Дисперсия измеряется в единицами измерения признака в квадрате.

Стандартное отклонение

Определение. Стандартным отклонением (или средним квадратическим отклонением) называется корень квадратный из дисперсии:

.                                                                  (3.9)

где или S(x) - выборочная дисперсия вариационного ряда.

Размерность стандартного отклонения в отличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.