- Сбор и группировка статистических данных
- Наглядное представление статистической информации
- Знать определения генеральной и выборочной совокупностей, репрезентативной выборки, таблицы частот, таблицы относительных частот, интервальный ряд.
- Уметь составлять таблицы частот и относительных частот, определять статистические характеристики (среднее арифметическое, мода, размах, медиана ряда данных)
- Уметь представлять данные в виде интервального ряда, находить для заданного интервального ряда среднее значение
- Уметь представлять данные в виде диаграмм и гистограмм
Сбор и группировка статистических данных
Для изучения общественных, социальных, экономических и некоторых природных явлений проводят статистические исследования.
Когда сложно или невозможно провести сплошное исследование, его заменяют выборочным. При выборочном исследовании из всей исследуемой совокупности данных, которая называется генеральной совокупностью, выделяется выборочная совокупность (выборка), которая и подвергается исследованию. При этом выборка должна быть представительной или репрезентативной, т.е. достаточной по объему и отражающей характерные особенности исследуемой генеральной совокупности.
Для обобщения и систематизации данных, полученных в ходе статистического исследования, их по какому-либо признаку разбивают на группы и результаты, характеризующие каждую группу, сводят в таблицы.
Пусть 50 восьмиклассников выполнили контрольную работу по алгебре, содержащую 5 заданий. Учитель составил таблицу, в которой каждому числу верно выполненных заданий соответствует количество учащихся, выполнивших столько заданий, т.е. частота появления этого числа в общем ряду данных.
Число выполненных заданий
|
1
|
2
|
3
|
4
|
5
|
Число учащихся (частота)
|
1
|
1
|
17
|
20
|
11
|
Такую таблицу называют таблицей частот.
Если подсчитать сумму частот, то она равна 50, т.е. общему количеству учащихся. Вообще, сумма частот равна общему числу данных в ряду.
После сбора и группировки данных переходят к их анализу, используя такие статистические характеристики, как среднее арифметическое, размах, мода, медиана. С ними мы знакомились ещё в курсе 7 класса. Вспомним определения основных статистических характеристик.
Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.
Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел.
Мода ряда чисел – это число, которое встречается в данном ряду чаще других.
Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.
Вернёмся к примеру. В данном случае среднее арифметическое – это отношение общего числа верно выполненных заданий на число учащихся, т.е. на 50. Получаем
.
Т.е. учащиеся в среднем выполняли примерно по 4 задания.
Наибольшее число выполненных заданий равно 5, наименьшее равно 1. Таким образом, размах рассматриваемого ряда равен .
Чаще всего встречаются работы, в которых верно выполнены четыре задания, т.е. мода ряда равна 4.
Медина ряда равна среднему арифметическому двадцать пятого и двадцать шестого члена. Выясним, в какой группе они находятся. Сумма частот первых трех групп равна . Тогда двадцать пятый и двадцать шестой члены располагаются в группе учащихся, выполнивших четыре задания, т.е. медиана ряда равна 4.
Часто в таблице для каждого данного указывают отношение частоты к общему числу данных в ряду. Это число, выраженное в процентах, называют относительной частотой, а таблицу — таблицей относительных частот.
Число выполненных заданий
|
1
|
2
|
3
|
4
|
5
|
Относительная частота, %
|
2
|
2
|
34
|
40
|
22
|
Сумма относительных частот в таблице 100%. Вообще. сумма относительных частот, полученных в результате любого исследования, равна 100%.
Если в ряду встречается большое число данных и одинаковые значения встречаются редко, то таблицы частот или относительных частот становятся ненаглядными и громоздкими. В этих случаях строят интервальный ряд. Для этого разность между наибольшим и наименьшим значениями делят на несколько равных частей и, округляя полученный результат, определяют длину интервала. Для каждого интервала указывают число данных, попадающих в этот интервал или выраженное в процентах отношение этого числа к общей численности данных. При этом граничное число обычно считают относящимся к последующему интервалу.
Пусть токари цеха затратили на обработку одной детали:
Время, мин
|
18-20
|
20-22
|
22-24
|
24-26
|
Число токарей
|
6
|
8
|
6
|
2
|
Для того, чтобы найти среднее время обработки детали составляют новую таблицу, в которой каждый интервал заменяют числом, которое является его серединой.
Время, мин
|
19
|
21
|
23
|
25
|
Число токарей
|
6
|
8
|
6
|
2
|
Для этого ряда найдем среднее арифметическое:
.
Упражнение 1
Подсчитывая число семян сорных растений в 15 одинаковых пакетах, получили такие данные:
3, 1, 0, 3, 2, 2, 1, 0, 1, 3, 2, 1, 0, 0, 2.
Представьте эти данные в виде таблицы частот.
Упражнение 2
В таблице показано, сколько деталей за смену обработали токари цеха:
Число обработанных деталей
|
16
|
17
|
18
|
19
|
20
|
Число токарей
|
9
|
11
|
10
|
12
|
8
|
Составьте таблицу относительных частот. Определите среднее арифметическое (округлите до ближайшего целого), размах, моду и медиану данного ряда данных.
Наглядное представление статистической информации
Статистическую информацию можно представлять различным образом.
Столбчатые диаграммы используют, когда хотят показать изменение величины в динамике.
Пусть 50 работников некоторого предприятия попросили оценить время, которое они в среднем тратят на проезд от дома до работы (с точностью до 10 минут).
Время проезда, мин
|
10
|
20
|
30
|
40
|
50
|
60
|
70
|
80
|
90
|
100
|
110
|
120
|
Число работников
|
3
|
6
|
8
|
7
|
10
|
8
|
0
|
2
|
3
|
2
|
0
|
1
|
Столбчатая диаграмма представлена на рисунке 1. Ширина прямоугольников произвольная. Высота равна числу работников, затративших определенное время проезда.
Давайте разобьем ряд на четыре группы: 10 – 30 минут, 40 – 60 минут, 70 – 90 минут, 100 – 120 минут. И посчитаем для каждой группы относительную частоту. Получим следующую таблицу.
Время проезда, мин
|
10-30
|
40-60
|
70-90
|
100-120
|
Число работников
|
17
|
25
|
5
|
3
|
Процент работников
|
34
|
50
|
10
|
6
|
По этой таблице можно построить круговую диаграмму. Одному проценту будет соответствовать 360°:100=3,6°. Для каждой группы данных определим соответствующий центральный угол:
3,6°∙34 =122,4°, 3,6°∙50 = 180°,
3,6°∙10 = 36°, 3,6°∙6 = 21,6°.
Разбив круг на сектора получим круговую диаграмму, изображенную на рисунке 2.
Так же используют способ представления данных в виде ломаной, которую называют полигоном.
Для этого мы воспользуемся исходной таблицей данных. В координатной плоскости отметим точки, абсциссы которых это время проезда, а ординаты — число работников. Соединив точки, получим полигон (рис. 3). Так же вместо частот по оси ординат откладывают и относительные частоты.
Интервальные ряды данных изображают с помощью гистограмм. Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников, т.е. основания строго определены длиной интервала.
Построим гистограмму для рассматриваемого ряда данных. Для этого воспользуемся таблицей частот нашего ряда данных.
Время проезда, мин
|
10-30
|
40-60
|
70-90
|
100-120
|
Число работников
|
17
|
25
|
5
|
3
|
Гистограмма состоит из четырех прямоугольников, сумма высот которых равна числу работников, т.е. равна 50 (рис. 4).
Упражнение 3
В фермерском хозяйстве площади, отведенные под зерновые, распределены следующим образом: под пшеницу — 50%, под овес — 17%, а остальное — под просо и гречиху, причем под просо вдвое больше, чем под гречиху. Постройте круговую диаграмму, характеризующую распределение площадей, отведенных под посевы зерновых в этом хозяйстве.
Упражнение 4
Имеются данные о распределении участников похода по возрасту:
Возраст, лет
|
16-22
|
22-28
|
28-34
|
34-40
|
Число участников
|
12
|
15
|
10
|
6
|
Пользуясь таблицей, постройте соответствующую гистограмму.
Контрольные вопросы
1. В каких случаях генеральная совокупность при исследовании заменяется выборочной? Каким условиям должна удовлетворять выборка?
2. Что называется гистограммой? Как изображается на гистограмме общий объем выборки?
Упражнение 1
Число семян
|
0
|
1
|
2
|
3
|
Число пакетов
|
4
|
4
|
4
|
3
|
Упражнение 2
Число обработанных деталей
|
16
|
17
|
18
|
19
|
20
|
Относительная частота, %
|
18
|
22
|
20
|
24
|
16
|
18; 4; 19; 18
Упражнение 3