Готовые решения задач - Корреляционно-регрессионный анализ
Построение эмпирических линий регрессии
Задача по статистике на корреляционно-регрессионный анализ
Было произведено выборочное обследование 50 предприятий с целью выяснения взаимосвязи между среднегодовой стоимостью основных производственных фондов (млн. руб.) и затратами на капитальный ремонт (в % от стоимости основных производственных фондов). Результаты представлены в таблице:
Затраты на капитальный ремонт (в % к стоимости основных производственных фондов) |
Среднегодовая стоимость основных производственных фондов, млн. руб. |
Итого |
|||||
(5;9) |
(9;13) |
(13;17) |
(17;21) |
(21;25) |
(25;29) |
||
(1;3) |
|
|
|
|
2 |
7 |
9 |
(3;5) |
|
|
|
4 |
4 |
3 |
11 |
(5;7) |
|
|
6 |
3 |
1 |
|
10 |
(7;9) |
|
1 |
2 |
1 |
|
|
4 |
(9;11) |
|
6 |
2 |
|
|
|
8 |
(11;13) |
2 |
1 |
|
|
|
|
3 |
(13;15) |
5 |
|
|
|
|
|
5 |
Итого |
7 |
8 |
10 |
8 |
7 |
10 |
50 |
Необходимо:
а) произвести все необходимые вычисления;
б) построить эмпирические линии регрессии и сделать первоначальные выводы о форме корреляционной связи;
в) определить величину коэффициента линейной корреляции (по определению и методом моментов) и сделать выводы о форме корреляционной зависимости;
г) найти значение корреляционного отношения и сделать выводы о тесноте корреляционной связи;
д) с вероятностью 0,95 проверить гипотезу о статистической значимости эмпирических данных;
е) установить вид уравнения регрессии y на x и x на y в предположении прямой (расчет коэффициентов произвести двумя способами), параболической и показательной регрессионной моделей;
ж) с помощью величины средней ошибки аппроксимации и индекса детерминации отобрать наиболее точную модель;
з) построить на одном чертеже эмпирические данные и линии регрессии;
и) произвести прогноз уровня затрат на капитальный ремонт, если стоимость основных производственных фондов равна 2,5 млн. руб., а также спрогнозировать величину основных производственных фондов, если затраты на капитальный ремонт составляют 0,52% от ОПФ.
Пример решения задачи
Переходим к решению задачи. Вначале запишем исходные данные в виде корреляционной таблицы:
Х Y |
(5;9) |
(9;13) |
(13;17) |
(17;21) |
(21;25) |
(25;29) |
|
|
7 |
11 |
15 |
19 |
23 |
27 |
|||
(1;3) |
2 |
|
|
|
|
2 |
7 |
9 |
(3;5) |
4 |
|
|
|
4 |
4 |
3 |
11 |
(5;7) |
6 |
|
|
6 |
3 |
1 |
|
10 |
(7;9) |
8 |
|
1 |
2 |
1 |
|
|
4 |
(9;11) |
10 |
|
6 |
2 |
|
|
|
8 |
(11;13) |
12 |
2 |
1 |
|
|
|
|
3 |
(13;15) |
14 |
5 |
|
|
|
|
|
5 |
|
7 |
8 |
10 |
8 |
7 |
10 |
50 |
Строим корреляционное поле данных (рисунок 1)
Рис. 1
В клетке, стоящей на пересечении строки и столбца указаны следующие данные.
y*nxy |
|
x*nxy |
|
nxy |
|
x*y*nxy |
|
ax*ay* nxy |
Производим все необходимые вычисления в ниже приведенной таблице.
X Y |
(5;9) |
(9;13) |
(13;17) |
(17;21) |
(21;25) |
(25;29) |
ny |
x*nxy |
|
||||||||||||||
7 |
11 |
15 |
19 |
23 |
27 |
||||||||||||||||||
-2 |
-1 |
0 |
1 |
2 |
3 |
||||||||||||||||||
(1;3) |
2 |
-1 |
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
46 |
14 |
|
189 |
9 |
235 |
26,11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
7 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
92 |
|
-4 |
378 |
|
-21 |
||||||
(3;5) |
4 |
0 |
|
|
|
|
|
|
|
|
|
16 |
|
76 |
16 |
|
92 |
12 |
|
81 |
11 |
249 |
22,64 |
|
|
|
|
|
|
|
|
|
|
4 |
|
|
4 |
|
|
3 |
|
||||||
|
|
|
|
|
|
|
|
|
304 |
|
0 |
368 |
|
0 |
324 |
|
0 |
||||||
(5;7) |
6 |
1 |
|
|
|
|
|
|
36 |
|
90 |
18 |
|
57 |
6 |
|
23 |
|
|
|
10 |
170 |
17 |
|
|
|
|
|
|
|
6 |
|
|
3 |
|
|
1 |
|
|
|
|
||||||
|
|
|
|
|
|
540 |
|
0 |
342 |
|
3 |
138 |
|
2 |
|
|
|
||||||
(7;9) |
8 |
2 |
|
|
|
8 |
|
11 |
16 |
|
30 |
8 |
|
19 |
|
|
|
|
|
|
4 |
60 |
15 |
|
|
|
|
1 |
|
|
2 |
|
|
1 |
|
|
|
|
|
|
|
||||||
|
|
|
88 |
|
-2 |
240 |
|
0 |
152 |
|
2 |
|
|
|
|
|
|
||||||
(9;11) |
10 |
3 |
|
|
|
60 |
|
66 |
20 |
|
30 |
|
|
|
|
|
|
|
|
|
8 |
96 |
12 |
|
|
|
|
6 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
660 |
|
-18 |
300 |
|
0 |
|
|
|
|
|
|
|
|
|
||||||
(11;13) |
12 |
4 |
24 |
|
14 |
12 |
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
3 |
25 |
8,333 |
|
2 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
168 |
|
-16 |
132 |
|
-4 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
(13;15) |
14 |
5 |
70 |
|
35 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
35 |
7 |
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
490 |
|
-50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
nx |
7 |
8 |
10 |
8 |
7 |
10 |
50 |
|
|
||||||||||||||
|
94 |
80 |
72 |
42 |
26 |
26
|
|
|
|
||||||||||||||
|
13,4286 |
10 |
7,2 |
5,25 |
3,7143 |
2,6 |
- |
|
|
||||||||||||||
|
658 |
880 |
1080 |
798 |
598 |
702 |
4716 |
|
|
||||||||||||||
|
-66 |
-24 |
0 |
5 |
-2 |
-21 |
-108 |
|
|
||||||||||||||
|
307,5657 |
81,92 |
1,6 |
19,22 |
66,6514 |
176,4 |
653,3571 |
|
|
||||||||||||||
|
7 |
11 |
15 |
19 |
23 |
27
|
|
|
|
||||||||||||||
nx |
7 |
8 |
10 |
8 |
7 |
10 |
50 |
|
|
||||||||||||||
|
49 |
88 |
150 |
152 |
161 |
270 |
870 |
|
|
||||||||||||||
|
343 |
968 |
2250 |
2888 |
3703 |
7290 |
17442 |
|
|
||||||||||||||
|
2401 |
10648 |
33750 |
54782 |
85169 |
196830 |
383670 |
|
|
||||||||||||||
|
16807 |
117128 |
506250 |
1042568 |
1958887 |
5314410 |
8956050 |
|
|
||||||||||||||
|
94 |
80 |
72 |
42 |
26 |
26 |
340 |
|
|
||||||||||||||
|
658 |
880 |
1080 |
798 |
598 |
702 |
4716 |
|
|
||||||||||||||
|
4606 |
9680 |
16200 |
15162 |
13754 |
18954 |
78356 |
|
|
||||||||||||||
|
2,5974 |
2,3026 |
1,9741 |
1,6582 |
1,3122 |
0,9555 |
- |
|
|
||||||||||||||
|
18,1817 |
18,4207 |
19,7408 |
13,2658 |
9,1853 |
9,5551 |
88,3494 |
|
|
||||||||||||||
|
127,2718 |
202,6275 |
296,1122 |
252,0507 |
211,2620 |
257,9881 |
1347,31 |
|
|
Тогда
у |
ny
|
|
|
|
|
|
|
|
|
|
|
|
2 |
9 |
26,1111 |
18 |
36 |
72 |
144 |
235 |
470 |
940 |
3,2624 |
29,3612 |
58,7225 |
4 |
11 |
22,6364 |
44 |
186 |
704 |
2816 |
249 |
996 |
3984 |
3,1196 |
34,3151 |
137,2605 |
6 |
10 |
17 |
60 |
360 |
2160 |
12960 |
170 |
1020 |
6120 |
2,8332 |
28,3321 |
169,9928 |
8 |
4 |
15 |
32 |
256 |
2048 |
16384 |
60 |
480 |
3840 |
2,7081 |
10,8322 |
86,6576 |
10 |
8 |
12 |
80 |
800 |
8000 |
80000 |
96 |
960 |
9600 |
2,4849 |
19,8793 |
198,7925 |
12 |
3 |
8,333 |
36 |
432 |
5184 |
62208 |
25 |
300 |
3600 |
2,1203 |
6,3608 |
76,3295 |
14 |
5 |
7 |
70 |
980 |
13720 |
192080 |
35 |
490 |
6860 |
1,9459 |
9,7296 |
136,2137 |
|
50
|
-
|
340
|
3040
|
31888
|
366592
|
870
|
4716
|
34944
|
-
|
138,8103
|
863,9692
|
Строим эмпирические линии (рисунок 11; на нем сплошной линией изображена эмпирическая линия регрессии у на х, а пунктирной – эмпирическая линия регрессии х на у) регрессии и делаем первоначальные выводы о форме корреляционной зависимости.
Рис. 2
Так как с ростом значения х значения у почти монотонно убывают, то скорее всего имеет место линейная обратная корреляционная зависимость.
Определим величину коэффициента линейной корреляции. Среднее значение признаков найдем согласно определению, а дисперсии рассчитаем по формуле разностей. Имеем:
;
;
;
;
;
;
;
.
Среднее значение произведения
.
Тогда числитель коэффициента линейной корреляции, рассчитанный первым способом, равен:
.
Найдем величину μ методом моментов. Используя соответствующие определения и расчетную таблицу, получаем:
.
Итак, коэффициент линейной корреляции равен:
,
что говорит о том, что рассматриваемая зависимость является линейной обратной.
Переходим к вычислению корреляционного отношения. Межгрупповая дисперсия равна
,
отсюда
;
.
Итак, корреляционное отношение равно
.
Найденное значение говорит о тесной корреляционной зависимости между рассматриваемыми признаками.
Проверим с вероятностью 0,95 гипотезу о статистической значимости эмпирических данных. Наблюдаемое значение критерия Стьюдента равно.
.
Критическое значение находим по таблицам, имеющимся в статистических справочниках для уровня значимости α = 1- 0,95=0,05 и числа степеней свободы ν = 50 – 2= 48:
.
Имеем:
17,0664>2,02,
следовательно гипотеза о статистической значимости эмпирических данных принимается с указанной вероятностью.
Находим параметры регрессионных моделей (см. таблицу 10). Результаты вычислений представим в таблицах:
Линейная корреляционная зависимость |
|||
Система нормальных уравнений |
у на х
|
Система
|
|
Решение системы |
, |
||
Уравнение |
|
||
х на у
|
Система
|
|
|
Решение системы |
, , |
||
Уравнение |
|
||
Упрощенный способ |
у на х |
ρ |
|
Уравнение
|
,
|
||
х на у |
ρ |
|
|
Уравнение
|
,
|
Следовательно:
Параболическая корреляционная зависимость |
||
у на х |
Система |
|
Решение системы |
, , |
|
Уравнение |
|
|
х на у |
Система |
|
Решение системы |
, , |
|
Уравнение |
|
|
Показательная корреляционная зависимость |
||
у на х |
Система |
|
Решение системы |
, , , |
|
Уравнение |
|
|
х на у |
Система
|
|
Решение системы |
, , , |
|
Уравнение |
|
По каждой из полученных моделей находим величину средней ошибки аппроксимации и индекса детерминации (расчеты приведены в таблице 1). Имеем: для линейной модели
, или 80,12%;
для параболической модели
, или 79,95%;
для показательной модели
, или 79,06%.
Видим, что одновременно минимум средней ошибки аппроксимации и максимум индекса детерминации соответствует линейной регрессионной модели. Следовательно, она признается наиболее точной.
Графики линейной зависимости приведены на рисунке 12, параболической – на рисунке 13, а показательной – на рисунке 14. На них сплошной чертой изображены линии регрессии у на х, а пунктирной – х на у.
Строим прогноз признаков. Имеем: при стоимости основных производственных фондов 2,5 млн. руб., затраты на капитальный ремонт составят
(%).
Если затраты на капитальный ремонт составляют 0,52% от ОПФ, то стоимость основных производственных фондов должна составлять
(млн. руб.)
Таблица 1
у |
Х |
|
|
Линейная модель
|
Параболическая модель
|
Показательная модель
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
2 |
23 |
-4,8 |
23,04 |
3,883 |
-1,8833 |
3,5469 |
0,9417 |
3,610 |
-1,6100 |
2,5922 |
0,8050 |
3,68 |
1,6887 |
2,8515 |
0,8443 |
27 |
-4,8 |
23,04 |
1,800 |
0,2000 |
0,0400 |
0,1000 |
2,655 |
-0,6556 |
0,4298 |
0,3278 |
2,65 |
0,6524 |
0,4256 |
0,3262 |
|
4 |
19 |
-2,8 |
7,84 |
5,966 |
-1,9667 |
3,8678 |
0,4917 |
5,158 |
-1,1586 |
1,3424 |
0,2897 |
5,12 |
1,1298 |
1,2764 |
0,2824 |
23 |
-2,8 |
7,84 |
3,883 |
0,1167 |
0,0136 |
0,0292 |
3,610 |
0,3900 |
0,1521 |
0,0975 |
3,68 |
-0,3113 |
0,0969 |
0,0778 |
|
27 |
-2,8 |
7,84 |
1,800 |
2,2000 |
4,8400 |
0,5500 |
2,655 |
1,3444 |
1,8074 |
0,3361 |
2,65 |
-1,3476 |
1,8161 |
0,3369 |
|
6 |
15 |
-0,8 |
0,64 |
8,050 |
-2,0500 |
4,2025 |
0,3417 |
7,301 |
-1,3014 |
1,6935 |
0,2169 |
7,13 |
1,1340 |
1,2859 |
0,1890 |
19 |
-0,8 |
0,64 |
5,966 |
0,0333 |
0,0011 |
0,0056 |
5,158 |
0,8414 |
0,7079 |
0,1402 |
5,12 |
-0,8702 |
0,7572 |
0,1450 |
|
23 |
-0,8 |
0,64 |
3,883 |
2,1167 |
4,4803 |
0,3528 |
3,610 |
2,3900 |
5,7120 |
0,3983 |
3,68 |
-2,3113 |
5,3423 |
0,3852 |
|
8 |
11 |
1,2 |
1,44 |
10,13 |
-2,1333 |
4,5511 |
0,2667 |
10,03 |
-2,0383 |
4,1545 |
0,2548 |
9,92 |
1,9212 |
3,6911 |
0,2402 |
15 |
1,2 |
1,44 |
8,050 |
-0,0500 |
0,0025 |
0,0062 |
7,301 |
0,6986 |
0,4881 |
0,0873 |
7,13 |
-0,6660 |
0,7500 |
0,1083 |
|
19 |
1,2 |
1,44 |
5,966 |
2,0333 |
4,1344 |
0,2542 |
5,158 |
2,8414 |
8,0735 |
0,3552 |
5,12 |
-2,8702 |
8,2381 |
0,3588 |
|
10 |
11 |
3,2 |
10,24 |
10,13 |
-0,1333 |
0,0178 |
0,0133 |
10,04 |
-0,0383 |
0,0015 |
0,0038 |
9,92 |
-0,0788 |
0,0062 |
0,0079 |
15 |
3,2 |
10,24 |
8,050 |
1,19500 |
3,8025 |
0,1960 |
7,301 |
2,6986 |
7,2827 |
0,2699 |
7,13 |
-2,8660 |
8,2140 |
0,2866 |
|
12 |
7 |
5,2 |
27,04 |
12,21 |
-0,2167 |
0,0469 |
0,0181 |
13,36 |
-1,3693 |
1,8751 |
0,1141 |
13,7 |
1,7974 |
3,2307 |
0,1498 |
11 |
5,2 |
27,04 |
10,13 |
1,8667 |
3,4844 |
0,1556 |
10,03 |
1,9617 |
3,8484 |
0,1635 |
9,92 |
-2,0788 |
4,3213 |
0,1732 |
|
14 |
7 |
7,2 |
51,84 |
12,21 |
1,7833 |
3,1803 |
0,1274 |
13,36 |
0,6307 |
0,3977 |
0,0450 |
13,7 |
0,2026 |
0,0410 |
0,0145 |
|
-
|
- |
202,24 |
- |
- |
40,212 |
3,8489 |
- |
- |
40,5588 |
3,9051 |
- |
- |
42,3445 |
3,9261 |
Рис. 3
Рис. 4
Похожие материалы |
Нахождение стоимости основных и оборотных средств
Анализ Высшего учебного заведения методом SWOT
Оценка эффективности инвестиций - находим NPV, IRR, окупаемость