- Сбор и группировка статистических данных
- Наглядное представление статистической информации
- Знать определения генеральной и выборочной совокупностей, репрезентативной выборки, таблицы частот, таблицы относительных частот, интервальный ряд.
- Уметь составлять таблицы частот и относительных частот, определять статистические характеристики (среднее арифметическое, мода, размах, медиана ряда данных)
- Уметь представлять данные в виде интервального ряда, находить для заданного интервального ряда среднее значение
- Уметь представлять данные в виде диаграмм и гистограмм
Сбор и группировка статистических данных
Для изучения общественных, социальных, экономических и некоторых природных явлений проводят статистические исследования.
Когда сложно или невозможно провести сплошное исследование, его заменяют выборочным . При выборочном исследовании из всей исследуемой совокупности данных, которая называется генеральной совокупностью , выделяется выборочная совокупность (выборка) , которая и подвергается исследованию. При этом выборка должна быть представительной или репрезентативной , т.е. достаточной по объему и отражающей характерные особенности исследуемой генеральной совокупности.
Для обобщения и систематизации данных, полученных в ходе статистического исследования, их по какому-либо признаку разбивают на группы и результаты, характеризующие каждую группу, сводят в таблицы.
Пусть 50 восьмиклассников выполнили контрольную работу по алгебре, содержащую 5 заданий. Учитель составил таблицу, в которой каждому числу верно выполненных заданий соответствует количество учащихся, выполнивших столько заданий, т.е. частота появления этого числа в общем ряду данных.
Число выполненных заданий
|
1
|
2
|
3
|
4
|
5
|
Число учащихся (частота)
|
1
|
1
|
17
|
20
|
11
|
Такую таблицу называют таблицей частот .
Если подсчитать сумму частот, то она равна 50, т.е. общему количеству учащихся. Вообще, сумма частот равна общему числу данных в ряду.
После сбора и группировки данных переходят к их анализу, используя такие статистические характеристики, как среднее арифметическое, размах, мода, медиана. С ними мы знакомились ещё в курсе 7 класса. Вспомним определения основных статистических характеристик.
Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.
Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел.
Мода ряда чисел – это число, которое встречается в данном ряду чаще других.
Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.
Вернёмся к примеру. В данном случае среднее арифметическое – это отношение общего числа верно выполненных заданий на число учащихся, т.е. на 50. Получаем
.
Т.е. учащиеся в среднем выполняли примерно по 4 задания.
Наибольшее число выполненных заданий равно 5, наименьшее равно 1. Таким образом, размах рассматриваемого ряда равен .
Чаще всего встречаются работы, в которых верно выполнены четыре задания, т.е. мода ряда равна 4.
Медина ряда равна среднему арифметическому двадцать пятого и двадцать шестого члена. Выясним, в какой группе они находятся. Сумма частот первых трех групп равна . Тогда двадцать пятый и двадцать шестой члены располагаются в группе учащихся, выполнивших четыре задания, т.е. медиана ряда равна 4.
Часто в таблице для каждого данного указывают отношение частоты к общему числу данных в ряду. Это число, выраженное в процентах, называют относительной частотой , а таблицу — таблицей относительных частот .
Число выполненных заданий
|
1
|
2
|
3
|
4
|
5
|
Относительная частота, %
|
2
|
2
|
34
|
40
|
22
|
Сумма относительных частот в таблице 100%. Вообще. сумма относительных частот, полученных в результате любого исследования, равна 100%.
Если в ряду встречается большое число данных и одинаковые значения встречаются редко, то таблицы частот или относительных частот становятся ненаглядными и громоздкими. В этих случаях строят интервальный ряд. Для этого разность между наибольшим и наименьшим значениями делят на несколько равных частей и, округляя полученный результат, определяют длину интервала. Для каждого интервала указывают число данных, попадающих в этот интервал или выраженное в процентах отношение этого числа к общей численности данных. При этом граничное число обычно считают относящимся к последующему интервалу.
Пусть токари цеха затратили на обработку одной детали:
Время, мин
|
18-20
|
20-22
|
22-24
|
24-26
|
Число токарей
|
6
|
8
|
6
|
2
|
Для того, чтобы найти среднее время обработки детали составляют новую таблицу, в которой каждый интервал заменяют числом, которое является его серединой.
Время, мин
|
19
|
21
|
23
|
25
|
Число токарей
|
6
|
8
|
6
|
2
|
Для этого ряда найдем среднее арифметическое:
.
Упражнение 1
Подсчитывая число семян сорных растений в 15 одинаковых пакетах, получили такие данные:
3, 1, 0, 3, 2, 2, 1, 0, 1, 3, 2, 1, 0, 0, 2.
Представьте эти данные в виде таблицы частот.
Упражнение 2
В таблице показано, сколько деталей за смену обработали токари цеха:
Число обработанных деталей
|
16
|
17
|
18
|
19
|
20
|
Число токарей
|
9
|
11
|
10
|
12
|
8
|
Составьте таблицу относительных частот. Определите среднее арифметическое (округлите до ближайшего целого), размах, моду и медиану данного ряда данных.
Наглядное представление статистической информации
Статистическую информацию можно представлять различным образом.
Столбчатые диаграммы используют, когда хотят показать изменение величины в динамике.
Пусть 50 работников некоторого предприятия попросили оценить время, которое они в среднем тратят на проезд от дома до работы (с точностью до 10 минут).
Время проезда, мин
|
10
|
20
|
30
|
40
|
50
|
60
|
70
|
80
|
90
|
100
|
110
|
120
|
Число работников
|
3
|
6
|
8
|
7
|
10
|
8
|
0
|
2
|
3
|
2
|
0
|
1
|
![](/upload/KmtuQLihDM2O_1-41.png)
Столбчатая диаграмма представлена на рисунке 1. Ширина прямоугольников произвольная. Высота равна числу работников, затративших определенное время проезда.
Давайте разобьем ряд на четыре группы: 10 – 30 минут, 40 – 60 минут, 70 – 90 минут, 100 – 120 минут. И посчитаем для каждой группы относительную частоту. Получим следующую таблицу.
Время проезда, мин
|
10-30
|
40-60
|
70-90
|
100-120
|
Число работников
|
17
|
25
|
5
|
3
|
Процент работников
|
34
|
50
|
10
|
6
|
![](/upload/UyYJwnGO7vyc_1-42.png)
По этой таблице можно построить
круговую диаграмму
. Одному проценту будет соответствовать 360°:100=3,6°. Для каждой группы данных определим соответствующий центральный угол:
3,6°∙34 =122,4°, 3,6°∙50 = 180°,
3,6°∙10 = 36°, 3,6°∙6 = 21,6°.
Разбив круг на сектора получим круговую диаграмму, изображенную на рисунке 2.
Так же используют способ представления данных в виде ломаной, которую называют полигоном .
![](/upload/HDmcCYgFqYbE_1-43.png)
Для этого мы воспользуемся исходной таблицей данных. В координатной плоскости отметим точки, абсциссы которых это время проезда, а ординаты — число работников. Соединив точки, получим полигон (рис. 3). Так же вместо частот по оси ординат откладывают и относительные частоты.
Интервальные ряды данных изображают с помощью гистограмм . Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников, т.е. основания строго определены длиной интервала.
![](/upload/nZQYbgqZ8WMk_1-44.png)
Построим гистограмму для рассматриваемого ряда данных. Для этого воспользуемся таблицей частот нашего ряда данных.
Время проезда, мин
|
10-30
|
40-60
|
70-90
|
100-120
|
Число работников
|
17
|
25
|
5
|
3
|
Гистограмма состоит из четырех прямоугольников, сумма высот которых равна числу работников, т.е. равна 50 (рис. 4).
Упражнение 3
В фермерском хозяйстве площади, отведенные под зерновые, распределены следующим образом: под пшеницу — 50%, под овес — 17%, а остальное — под просо и гречиху, причем под просо вдвое больше, чем под гречиху. Постройте круговую диаграмму, характеризующую распределение площадей, отведенных под посевы зерновых в этом хозяйстве.
Упражнение 4
Имеются данные о распределении участников похода по возрасту:
Возраст, лет
|
16-22
|
22-28
|
28-34
|
34-40
|
Число участников
|
12
|
15
|
10
|
6
|
Пользуясь таблицей, постройте соответствующую гистограмму.
Контрольные вопросы
1. В каких случаях генеральная совокупность при исследовании заменяется выборочной? Каким условиям должна удовлетворять выборка?
2. Что называется гистограммой? Как изображается на гистограмме общий объем выборки?
Упражнение 1
Число семян
|
0
|
1
|
2
|
3
|
Число пакетов
|
4
|
4
|
4
|
3
|
Упражнение 2
Число обработанных деталей
|
16
|
17
|
18
|
19
|
20
|
Относительная частота, %
|
18
|
22
|
20
|
24
|
16
|
18; 4; 19; 18
Упражнение 3
![](/upload/kmzXMgVzF3d7_1-45.png)
![](/upload/xr8sMZOQdYAG_1-46.png)