2. Что называют полигоном вариационного ряда? Что называют гистограммой частот (частостей) вариационного ряда? Что называют кумулятой вариационного ряда?
Полигон частот(вариационного ряда) представляет собой ломаную линию, в которой концы отрезков прямой имеют координаты (xi, mi), где xi – координата середины i-го интервала.
Графическое представление экспериментальных данных | ||
Частоты | mi (абсолютных частот) | wi (относительных частот) |
Полигон частот |
|
|
Гистограмма частот (частостей) вариационного ряда – это графическое представление выборки, где по оси абсцисс (ОХ) отложены величины интервалов, а по оси ординат (ОУ) – величины частот mi, попадающих в данный i-й интервал. При увеличении до бесконечности размера выборки выборочные функции распределения превращаются в теоретические: гистограмма превращается в график плотности распределения.
Гистог-рамма частот |
|
|
Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников, как показано на рис. 2.1. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые. Таким образом, высоты прямоугольников должны быть пропорциональны величинам
, (2.6)
где ni — частота i-го интервала группировки; hi — ширина i-го интервала группировки.
На графике гистограммы основание прямоугольников откладывается по оси абсцисс (x), а высота — по оси ординат (у) прямоугольной системы координат.
Однако в тех случаях, когда ширина всех интервалов группировки одинакова, вид гистограммы не изменится, если по оси ординат откладывать не величины рi, а частоты интервалов ni.
Рис. 2.1
Кумулята частот (кумулятивная кривая) представляет собой кривую накопленных частот. Накопленная частота интервалов – это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему. Пусть x некоторое число. Тогда количество данных , значения которых меньше x, называется накопленной частотой: .
Для интервальных данных ломаная линия начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте, равной нулю. Другие точки этой ломаной соответствуют концам интервалов и накопленным частотам.
Кумулята относительных частот отличается тем, что накапливаются относительные частоты: , где mi - - частота интервалов.
Куму-лята частот |
|
|
3. Дайте определение средней арифметической вариационного ряда. Сформулируйте ее свойства. Дайте определение моды и медианы дискретного вариационного ряда. Дайте определение дисперсии вариационного ряда, сформулируйте ее свойства. Дайте определение среднего квадратического отклонения вариационного ряда. Дайте определение коэффициента вариации вариационного ряда.
Чаще всего в математической статистике употребляются такие характеристики положения, как среднее арифметическое, медиана и мода.
Среднее арифметическое вариационного ряда, или просто среднее, — одна из основных характеристик выборки.
Определение. Среднее арифметическое вариационного ряда – такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).
Если воспользоваться геометрической интерпретацией, то среднее арифметическое можно определить как точку на оси х, которая является абсциссой центра масс гистограммы.
Среднее принято обозначать той же буквой, что и варианты выборки, с той лишь разницей, что над буквой ставится символ усреднения — черта. Например, если обозначить исследуемый признак через X, а его числовые значения — через xi, то среднее арифметическое имеет обозначение .
Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.
Для несгруппированных данных среднее арифметическое определяется по следующей формуле:
(3.1)
где n — объем выборки; хi — варианты выборки.
Если данные сгруппированы, то
(3.2)
где n — объем выборки; k — число интервалов группировки; ni — частота i-ого интервала; хi — срединное значение i-ого интервала.
Среднее арифметическое – величина того же наименования, что и значения признаков.
Нахождение среднего арифметического непрерывного вариационного ряда осложняется если крайние интервалы не замкнуты (то есть имеют вид “менее 10” ”более 60”). В этом случае считается, что ширина первого интервала равна ширине второго, а ширина последнего – ширине предпоследнего.
Среднее арифметическое, вычисленное по формуле (3.2), называют также взвешенным средним, подчеркивая этим, что в формуле (3.2) xi, суммируются с коэффициентами (весами), равными частотам попадания в интервалы группировки.
- Контрольные вопросы по курсу «Математическая статистика»
- Что называют дискретным вариационным рядом? Интервальным вариационным рядом? Что называют частостями вариационного ряда? Что называют накопленной частотой и накопленной частостью?
- Пример:
- 2. Что называют полигоном вариационного ряда? Что называют гистограммой частот (частостей) вариационного ряда? Что называют кумулятой вариационного ряда?
- Медиана
- Коэффициент вариации
- Дайте определения начальных и центральных моментов вариационного ряда. Дайте определение коэффициента асимметрии вариационного ряда. Дайте определение эксцесса вариационного ряда.
- Что понимается под генеральной совокупностью? Что понимается под случайной выборкой из генеральной совокупности?
- 6. Каковы основные задачи математической статистики?
- 7. Дайте определение выборочной функции распределения. Дайте определение выборочной средней арифметической. Дайте определение выборочной дисперсии.
- 8. Дайте определение выборочных начальных и центральных моментов.
- Дайте определение статистического ряда выборки.
- 10. Дайте определение эмпирической функции распределения. Дайте определение эмпирической плотности распределения.
- 20. Какова цель дисперсионного анализа? Запишите модель однофакторного дисперсионного анализа.
- 21. Что понимают под уровнем фактора? (ответ в Вопросе 22)
- 22. Как ставится основная гипотеза в случае однофакторного дисперсионного анализа?
- 23. Что такое вектор входных переменных (факторов), вектор выходных переменных (откликов)?
- 24. Что называют корреляционным полем, корреляционной таблицей?
- 26. Какую функцию называют функцией регрессии? Какие переменные называют входными (факторами), выходными (откликами)? Какую регрессионную модель называют линейной?
- 27. Сформулируйте исходные предположения метода наименьших квадратов.
- В чем состоит анализ регрессионной модели?
- 29. Какую статистику используют для проверки значимости модели регрессии?
- 30. Какую линейную регрессионную модель называют адекватной?