- Меры разброса
- Знать определения понятий: размах, дисперсия, среднее квадратичное отклонение
- Уметь определять значения мер разброса
- Что такое центральные тенденции?
- Что такое среднее выборки?
- Что такое мода?
- Что такое медиана?
Меры разброса
В предыдущем параграфе мы рассмотрели числовые характеристики, позволяющие оценить выборку «в среднем» (центральные тенденции). Это далеко не всегда даёт полное представление о поведении изучаемой величины. Например, на планете Меркурий средняя температура . Исходя из этого статистического показателя, можно подумать, что на Меркурии умеренный климат, удобный для жизни людей. Однако на самом деле это не так. Температура на Меркурии колеблется от до . Значит, чтобы получить представление о поведении случайной величины, помимо центральных тенденций надо знать характеристики разброса, показывающие, насколько значения выборки различаются между собой, как сильно они разбросаны, рассеяны вокруг средних. Простейшей такой характеристикой является размах.
Определение 1
Размах () – это разность наибольшего и наименьшего значений случайной величины выборки.
Для температуры на Меркурии, например, размах равен
.
Очевидно, что такого перепада температур человек выдержать не может. Размах вычисляется очень просто, но не всегда несёт достоверную информацию, т.к. на его величину может сильно повлиять какое-то одно значение выборки. Поэтому в реальных статистических исследованиях чаще используют другую характеристику разброса – дисперсию, которая сложнее вычисляется, но зато меньше подвержена таким колебаниям. Прежде, чем дать определение этого понятия, рассмотрим следующую выборку некоторой случайной величины: 3; 4; 9; 7; 2.
Найдём среднее арифметическое этих значений:
.
Самым естественным кажется, на первый взгляд, посчитать отклонение от среднего для каждого значения выборки и затем найти их среднее арифметическое:
.
Нуль получен не случайно: при вычислении «среднего разброса» часть отклонений входит со знаком «плюс», часть – со знаком «минус». В результате сложения получаем нуль. Можно доказать, что такой результат будет и при любом другом ряде чисел.
Поэтому полученный результат (нуль) не даёт никакого представления о том, как в среднем разбросаны значения выборки. Какой же выход? Можно находить среднее арифметическое, например, модулей отклонений. Но с модулем не всегда удобно работать. Поэтому в статистике решили находить среднее арифметическое не самих отклонений и не модулей отклонений, а квадратов отклонений от среднего.
Определение 2
Дисперсией () выборки называется среднее арифметическое квадратов отклонений от среднего арифметического:
Таким образом, для рассмотренной выше выборки (3; 4; 9; 7; 2) дисперсия равна:
.
У дисперсии есть один существенный недостаток: если исходные значения выборки измеряются в каких-то единицах (например, в рублях), то у дисперсии эти единицы возводятся в квадрат («квадратные» рубли). Избавиться от этого недостатка можно, если использовать другую характеристику разброса – среднее квадратичное отклонение.
Определение 3
Средним квадратичным отклонением () называют квадратный корень из дисперсии:
.
В рассмотренном примере среднее квадратичное отклонение равно
.
Дисперсию и среднее квадратичное отклонение в статистике называют мерами рассеивания значений случайной величины около среднего значения.
Пример 1
Ученик получил в течение первой учебной четверти следующие отметки по алгебре: 5; 2; 4; 5; 5; 4; 4; 5; 5; 5. Найти размах, дисперсию и среднее квадратичное отклонение.
Решение
1) Найдём размах выборки .
2) Для вычисления дисперсии найдём сначала среднее выборки
.
Теперь найдём дисперсию
.
3) Найдём среднее квадратичное отклонение .
Ответ: ; ; .
Пример 2
Найдите среднее квадратичное отклонение значений случайной величины , распределение которых по частотам представлено в таблице
|
3
|
4
|
5
|
12
|
20
|
|
2
|
3
|
6
|
4
|
5
|
Решение
Для удобства результаты последовательных вычислений занесём в таблицу.
|
3
|
4
|
5
|
12
|
20
|
|
2
|
3
|
6
|
4
|
5
|
|
-6,8
|
-5,8
|
-4,8
|
2,2
|
10,2
|
|
46,24
|
33,64
|
23,04
|
4,84
|
104,04
|
|
92,48
|
100,92
|
138,24
|
19,36
|
520,2
|
Ответ: .
Упражнение
1. Найти размах, дисперсию и среднее квадратичное отклонение выборки:
2; 4; 3; 5; 7; 3; 2; 6; 8; 3.
2. Найдите среднее квадратичное отклонение значений случайной величины , распределение которых по частотам представлено в таблице.
|
–2
|
0
|
4
|
5
|
7
|
|
4
|
5
|
7
|
3
|
6
|
Контрольные вопросы
- Что такое размах выборки?
- Что такое дисперсия?
- Что такое среднее квадратичное отклонение?
Упражнение
- ; ; ;
- .