Примеры решений задач: Группировка статистических данных
Признак в основе группировки
Задача по статистике
Построить группировку с определением количества групп и интервала. Определить какой признак лежит в основе группировки.
№ п/п |
Объем реализации в 1995г., млрд. руб. |
Балансовая прибыль в 1995г., млрд. руб |
Прибыль после налогообложения за 1995г., млрд. руб |
Кол-во работающих, тыс. чел |
1 |
1876,2 |
218,5 |
168,4 |
18,6 |
2 |
1827,8 |
290,7 |
204,1 |
9,1 |
3 |
1602,7 |
157,1 |
94,2 |
17,4 |
4 |
1563,8 |
91,7 |
11,9 |
6,4 |
5 |
1544,5 |
270,3 |
168,5 |
26,0 |
6 |
1470,5 |
142,1 |
73,9 |
6,4 |
7 |
1462,0 |
76,9 |
35,1 |
15,0 |
8 |
1392,7 |
138,7 |
2,4 |
15,7 |
9 |
1359,8 |
107,6 |
66,2 |
10,9 |
10 |
1350,9 |
262,2 |
150,2 |
7,6 |
11 |
1340,0 |
314,3 |
159,3 |
9,7 |
12 |
1290,7 |
190,0 |
99,6 |
20,6 |
13 |
1290,1 |
269,2 |
204,2 |
13,2 |
14 |
1285,4 |
131,2 |
77,1 |
6,3 |
15 |
1273,4 |
200,9 |
154,3 |
11,6 |
16 |
1270,7 |
300,9 |
300,9 |
5,6 |
17 |
1267,8 |
439,9 |
330,1 |
6,4 |
18 |
1266,4 |
243,7 |
115,1 |
11,5 |
19 |
1240,1 |
261,7 |
177,2 |
5,5 |
20 |
1228,9 |
136,1 |
74,6 |
17,5 |
21 |
1180,3 |
166,2 |
108,1 |
7,0 |
22 |
1164,5 |
133,3 |
85,4 |
10,7 |
23 |
1128,8 |
205,0 |
73,4 |
15,2 |
24 |
1098,0 |
136,2 |
91,3 |
11,3 |
25 |
1080,5 |
280,5 |
213,6 |
4,8 |
26 |
1080,2 |
319,2 |
253,2 |
6,5 |
27 |
1036,9 |
304,0 |
212,2 |
11,4 |
28 |
1033,4 |
118,2 |
97,0 |
7,5 |
29 |
1010,3 |
130,7 |
60,0 |
12,6 |
30 |
1007,3 |
148,0 |
99,5 |
5,3 |
31 |
1006,7 |
356,9 |
257,9 |
16,4 |
32 |
984,4 |
70,6 |
7,9 |
13,0 |
33 |
950,8 |
109,7 |
60,6 |
14,5 |
34 |
926,5 |
136,5 |
81,2 |
6,3 |
35 |
890,1 |
119,5 |
85,9 |
7,6 |
Для примера рассмотрим данные в последнем столбце.
1. Определим какой признак лежит в основе группировки (количественный, качественный, дискретный, непрерывный)
В данном примере – количественный непрерывный признак.
2. Подсчитаем число единиц совокупности – N. В данном примере получаем N = 35.
3. Определяем максимальное (Xmax) и минимальное (Xmin) значение в приведенных данных.
Получаем:
Xmax = 26;
Xmin = 4,8;
4. По формуле Стерджесса определяем число групп:
n = 1 + 3,322*lgN
Получаем n ≈ 6
Для определения числа групп при невозможности вычисления логорифма числа можно воспользоваться таблицей (для равномерного распределения и для групп с равными интервалами):
N |
15-24 |
25-44 |
45-89 |
90-179 |
180-359 |
360-719 |
n |
5 |
6 |
7 |
8 |
9 |
10 |
5. Рассчитаем интервал i по следующей формуле:
Получаем:
(тыс.чел.)
Единицу измерения интервала указывать обязательно.
Округляем интервал до i = 3,53. При несовпадении значения последней границы интервала последней группы с Xmax необходимо брать более точное значение интервала.
6. Рассчитаем интервал для каждой группы, с условием что интервал закрытый (имеет верхнюю и нижнюю границы). Для этого:
А) для 1-й группы нижней границей будет является Xmin
Б) Прибавляем к Xmin значение интервала:
Xmin + i = 4,8 + 3,53 = 8,33 – это верхняя граница интервала;
Тогда для 1-й группы получаем интервал:
4,8 - 8,33
В) Для 2-й группы верхней границей будет либо верхняя граница 1-й группы, либо верхняя граница с прибавлением к последней цифре 1, т.е. 8.34. Для удобства возьмем в качестве нижней границы значение 8,33.
Г) Для определения верхней границы интервала 2-й группы, прибавляем к значению нижней границы значение интервала:
8,33 + i = 8,33 + 3,53 = 11,86
Интервал для 2-й группы: 8,33 - 11,86
Д) Аналогично рассчитываем границы интервалов для оставшихся 4-х групп.
В итоге получаем:
Номер группы |
границы интервала |
1 |
4,8 - 8,33 |
2 |
8,33 - 11,86 |
3 |
11,86 - 15,39 |
4 |
15,39 - 18,92 |
5 |
18,92 - 22,45 |
6 |
22,45 - 25,98 |
Как видно из результатов верхняя граница интервала последней группы немного не совпала с максимальным значением Xmax. Все это зависит от точного подсчета числа групп и значения интервала i. Но для корректировки учтем что последнее значение должно совпадать с максимальным. Значение будет равно 26
Теперь можно составить необходимую группировку:
7) Из таблицы данных подсчитываем кол-во значений входящих в интервал 1-й и последующих групп, т.е:
для интервала 1-й группы получаем 14 предприятий, для 2-й – 8 и т.д.
Строим группировку:
Группы по численности рабочих (Xi) |
Кол-во предприятий (fi) |
4,8 - 8,33 |
14 |
8,33 - 11,86 |
8 |
11,86 - 15,39 |
6 |
15,39 - 18,92 |
5 |
18,92 - 22,45 |
1 |
22,45 - 25,98 (26) |
1 |
Похожие материалы |
Нахождение стоимости основных и оборотных средств
Анализ Высшего учебного заведения методом SWOT
Оценка эффективности инвестиций - находим NPV, IRR, окупаемость