- Центральные тенденции.
- Знать определения понятий: генеральная совокупность, репрезентативная выборка, среднее, мода и медиана;
- Уметь определять центральные тенденции (среднее, мода и медиана).
- Что такое абсолютная частота случайного события в серии испытаний?
- Что такое относительная частота случайного события в серии испытаний?
- Что такое закон распределения случайной величины?
Центральные тенденции
Основным методом статистики является выборочный метод. Суть его состоит в том, что в реальном опыте мы наблюдаем не всю совокупность явлений или объектов, которые хотели бы изучить, а лишь какую-то их часть. Например, при определении уровня заработной платы работающих граждан вместо выяснения зарплаты всех работающих граждан проводят выборочное исследование лишь малой их части.
Определение 1
Вся совокупность явлений или объектов, подлежащих статистическому исследованию, называется генеральной совокупностью.
В рассмотренном примере генеральная совокупность – все работающие граждане. Подвергать статистическому исследованию всю генеральную совокупность в некоторых случаях слишком трудоёмко или дорого, а в каких-то даже невозможно. Поэтому из всей генеральной совокупности для статистического исследования выбирают небольшое (по сравнению с генеральной совокупностью) конечное множество элементов, которые составляют случайную выборку. Эти элементы изучают, выявляют различные характеристики и закономерности, а затем переносят полученные результаты на всю генеральную совокупность. В этом и состоит суть выборочного метода – по результатам, полученным в выборке, попытаться сделать выводы обо всей генеральной совокупности.
Однако, такое обобщение не всегда возможно. Представьте себе ситуацию, что в рассмотренном примере мы выбрали для исследования работников какой-то одной сферы некоторого региона. Можно ли считать, что полученная в результате исследования средняя зарплата равна средней зарплате по всей России? Вряд ли. Хотя и такое возможно, но маловероятно. Чтобы такие выводы можно было сделать с большей уверенностью, следовало бы тщательно подойти к формированию случайной выборки, сделать её, как говорят, более репрезентативной (от фр. representative – представительный). Видимо, при выборке работающих граждан должны быть пропорционально представлены все регионы, сферы деятельности и т.д.
Определение 2
В статистических исследованиях выборку называют репрезентативной, если в ней присутствуют те и только те значения случайной величины, что и в генеральной совокупности, причём частоты имеющихся в ней данных находятся практически в тех же отношениях, что и в генеральной совокупности.
Например, пусть некоторая случайная величина X распределена следующим образом:
X
|
-2
|
1
|
5
|
7
|
Y
|
200
|
300
|
400
|
100
|
и совокупность всех значений этой величины представляет собой генеральную совокупность.
Тогда выборку из этой совокупности со следующим распределением
X
|
-2
|
1
|
5
|
7
|
Y
|
2
|
3
|
4
|
1
|
можно считать репрезентативной, так как 200:300:400:100=2:3:4:1 и в выборке присутствуют только те значения величины X, которые есть и в генеральной совокупности.
Совокупность числовых данных удобно характеризовать некоторым числом, которое называют мерой центральной тенденции числовых значений случайной величины. К таким характеристикам относятся среднее, мода и медиана.
Определение 3
Среднее (среднее арифметическое) выборки – это число, равное отношению суммы всех чисел выборки к их количеству.
Если рассматривается совокупность значений случайной величины , то её среднее обозначают .
В большинстве реальных исследований именно среднее арифметическое несёт наиболее важную информацию об изучаемом явлении. Достаточно вспомнить выражения «средний балл», «средняя зарплата», «средний доход», хорошо знакомые большинству людей.
Пример 1
Ученик получил в течение первой учебной четверти следующие отметки по алгебре: 5; 2; 4; 5; 5; 4; 4; 5; 5; 5.
Найти средний балл.
Решение
.
Ответ: 4,4.
Пример 2
Найдите среднее выборки значений случайной величины X, распределение которой по частотам представлено в таблице
X
|
3
|
4
|
5
|
12
|
20
|
M
|
2
|
3
|
6
|
4
|
5
|
Решение
.
Ответ: 9,8.
Определение 4
Мода (Мо) – это значение случайной величины, имеющее наибольшую частоту в рассматриваемой выборке.
В примере 1 модой является 5, так как эта отметка встречается наиболее часто. В отличии от среднего арифметического, которое можно вычислять для любого числового ряда, моды у ряда может вообще не быть. Например, пусть тот же ученик получил по русскому языку следующие отметки:
4; 2; 3; 5.
Каждая отметка встречается в этом ряду только один раз, и среди них нет числа, встречающегося чаще других. Значит, у этого ряда чисел нет моды. Иногда используют в этой связи другую терминологию: выборка, имеющая единственную моду, называется унимодальной, а выборка, у которой моды нет (или мод несколько) – полимодальной.
Особенностью моды является ещё и то, что её можно использовать не только в числовых рядах. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда окажется тот предмет, который будут называть чаще остальных.
Определение 5
Медиана выборки (Ме) – это значение из этой выборки (или полусумма двух значений), разделяющее упорядоченную выборку на две равные по количеству данных части.
Чтобы найти медиану выборки, нужно её сначала упорядочить – составить ранжированный ряд. Если ряд содержит нечётное число членов, то нужно взять число, которое находится ровно посередине. Если ряд содержит чётное число членов, то нужно взять два средних числа и найти их полусумму.
Пример 3
Найти среднее, моду и медиану выборки:
447; 444; 464; 432; 445; 432; 454; 458.
Решение
Найдём среднее арифметическое:
.
Чаще других чисел встречается 432. Поэтому .
Для нахождения медианы выборки построим ранжированный (упорядоченный) ряд: 432; 432; 444; 445; 447; 454; 458; 464.
Выборка содержит чётное число значений. Поэтому в качестве медианы возьмём полусумму двух средних значений
.
Ответ:
Упражнение 1
1. Распределение в генеральной совокупности значений случайной величины X отражено в таблице:
X
|
3
|
5
|
7
|
9
|
10
|
M
|
50
|
60
|
80
|
70
|
40
|
Какая из выборок является репрезентативной для заданной генеральной совокупности:
1)
X
|
3
|
5
|
7
|
9
|
10
|
M
|
10
|
12
|
16
|
7
|
8
|
2)
X
|
3
|
5
|
7
|
M
|
5
|
6
|
8
|
3)
X
|
3
|
5
|
7
|
9
|
10
|
M
|
10
|
12
|
16
|
14
|
8
|
4)
X
|
3
|
5
|
7
|
9
|
10
|
M
|
20
|
24
|
32
|
28
|
16
|
2. Найти моду, медиану и среднее выборки:
2; 4; 3; 5; 7; 3; 2; 6; 8; 3.
3. Найти моду, медиану и среднее выборки значений случайной величины X:
X
|
-2
|
0
|
4
|
5
|
7
|
M
|
4
|
5
|
7
|
3
|
6
|
* Во всех заданиях — частота значения.
Контрольные вопросы
- Что такое генеральная совокупность?
- Что такое среднее выборки?
- Что такое мода?
- Что такое медиана?
Упражнение 1
- 3 и 4;
- ;
- .