Goodstudents.ru

 

 

 

 

 

Задачи по статистике с решениями и выводами Готовые решения задач - Корреляционно-регрессионный анализ
Готовые решения задач - Корреляционно-регрессионный анализ


Готовые решения задач - Корреляционно-регрессионный анализ

Построение эмпирических линий регрессии

Задача по статистике на корреляционно-регрессионный анализ

Было произведено выборочное обследование 50 предприятий с целью выяснения взаимосвязи между среднегодовой стоимостью основных производственных фондов (млн. руб.) и затратами на капитальный ремонт (в % от стоимости основных производственных фондов). Результаты представлены в таблице:

Затраты на капитальный ремонт (в % к стоимости основных производственных фондов)

Среднегодовая стоимость основных производственных фондов, млн. руб.

Итого

(5;9)

(9;13)

(13;17)

(17;21)

(21;25)

(25;29)

(1;3)

2

7

9

(3;5)

4

4

3

11

(5;7)

6

3

1

10

(7;9)

1

2

1

4

(9;11)

6

2

8

(11;13)

2

1

3

(13;15)

5

5

Итого

7

8

10

8

7

10

50

Необходимо:

а) произвести все необходимые вычисления;

б) построить эмпирические линии регрессии и сделать первоначальные выводы о форме корреляционной связи;

в) определить величину коэффициента линейной корреляции (по определению и методом моментов) и сделать выводы о форме корреляционной зависимости;

г) найти значение корреляционного отношения и сделать выводы о тесноте корреляционной связи;

д) с вероятностью 0,95 проверить гипотезу о статистической значимости эмпирических данных;

е) установить вид уравнения регрессии y на x и x на y в предположении прямой (расчет коэффициентов произвести двумя способами), параболической и показательной регрессионной моделей;

ж) с помощью величины средней ошибки аппроксимации и индекса детерминации отобрать наиболее точную модель;

з) построить на одном чертеже эмпирические данные и линии регрессии;

и) произвести прогноз уровня затрат на капитальный ремонт, если стоимость основных производственных фондов равна 2,5 млн. руб., а также спрогнозировать величину основных производственных фондов, если затраты на капитальный ремонт составляют 0,52% от ОПФ.

Пример решения задачи

Переходим к решению задачи. Вначале запишем исходные данные в виде корреляционной таблицы:

Х

Y

(5;9)

(9;13)

(13;17)

(17;21)

(21;25)

(25;29)

7

11

15

19

23

27

(1;3)

2

2

7

9

(3;5)

4

4

4

3

11

(5;7)

6

6

3

1

10

(7;9)

8

1

2

1

4

(9;11)

10

6

2

8

(11;13)

12

2

1

3

(13;15)

14

5

5


7


8


10


8


7


10


50


Строим корреляционное поле данных (рисунок 1)

Рис. 1

В клетке, стоящей на пересечении строки и столбца указаны следующие данные.

y*nxy

x*nxy

nxy

x*y*nxy

ax*ay* nxy

Производим все необходимые вычисления в ниже приведенной таблице.

X

Y

(5;9)

(9;13)

(13;17)

(17;21)

(21;25)

(25;29)

ny

x*nxy

7

11

15

19

23

27

-2

-1

0

1

2

3

(1;3)

2

-1

4

46

14

189

9

235

26,11

2

7

92

-4

378

-21

(3;5)

4

0

16

76

16

92

12

81

11

249

22,64

4

4

3

304

0

368

0

324

0

(5;7)

6

1

36

90

18

57

6

23

10

170

17

6

3

1

540

0

342

3

138

2

(7;9)

8

2

8

11

16

30

8

19

4

60

15

1

2

1

88

-2

240

0

152

2

(9;11)

10

3

60

66

20

30

8

96

12

6

2

660

-18

300

0

(11;13)

12

4

24

14

12

11

3

25

8,333

2

1

168

-16

132

-4

(13;15)

14

5

70

35

5

35

7

5

490

-50

nx

7

8

10

8

7

10

50

94

80

72

42

26

26

 


13,4286

10

7,2

5,25

3,7143

2,6

-

658

880

1080

798

598

702

4716

-66

-24

0

5

-2

-21

-108

307,5657

81,92

1,6

19,22

66,6514

176,4

653,3571

7

11

15

19

23

27

 


nx

7

8

10

8

7

10

50

49

88

150

152

161

270

870

343

968

2250

2888

3703

7290

17442

2401

10648

33750

54782

85169

196830

383670

16807

117128

506250

1042568

1958887

5314410

8956050

94

80

72

42

26

26

340

658

880

1080

798

598

702

4716

4606

9680

16200

15162

13754

18954

78356

2,5974

2,3026

1,9741

1,6582

1,3122

0,9555

-

18,1817

18,4207

19,7408

13,2658

9,1853

9,5551

88,3494

127,2718

202,6275

296,1122

252,0507

211,2620

257,9881

1347,31

 

Тогда

у


ny

 












2

9

26,1111

18

36

72

144

235

470

940

3,2624

29,3612

58,7225

4

11

22,6364

44

186

704

2816

249

996

3984

3,1196

34,3151

137,2605

6

10

17

60

360

2160

12960

170

1020

6120

2,8332

28,3321

169,9928

8

4

15

32

256

2048

16384

60

480

3840

2,7081

10,8322

86,6576

10

8

12

80

800

8000

80000

96

960

9600

2,4849

19,8793

198,7925

12

3

8,333

36

432

5184

62208

25

300

3600

2,1203

6,3608

76,3295

14

5

7

70

980

13720

192080

35

490

6860

1,9459

9,7296

136,2137

50

 


-

 


340

 


3040

 


31888

 


366592

 


870

 


4716

 


34944

 


-

 


138,8103

 


863,9692

 


 

Строим эмпирические линии (рисунок 11; на нем сплошной линией изображена эмпирическая линия регрессии у на х, а пунктирной – эмпирическая линия регрессии х на у) регрессии и делаем первоначальные выводы о форме корреляционной зависимости.

Рис. 2

Так как с ростом значения х значения у почти монотонно убывают, то скорее всего имеет место линейная обратная корреляционная зависимость.

Определим величину коэффициента линейной корреляции. Среднее значение признаков найдем согласно определению, а дисперсии рассчитаем по формуле разностей. Имеем:

;

;

 

;

 

;

;

;

 

;

 

.

 

Среднее значение произведения

.

 

Тогда числитель коэффициента линейной корреляции, рассчитанный первым способом, равен:

.

 

Найдем величину μ методом моментов. Используя соответствующие определения и расчетную таблицу, получаем:

.

 

Итак, коэффициент линейной корреляции равен:

,

 

что говорит о том, что рассматриваемая зависимость является линейной обратной.

Переходим к вычислению корреляционного отношения. Межгрупповая дисперсия равна

,

отсюда

;

.

 

Итак, корреляционное отношение равно

.

 

Найденное значение говорит о тесной корреляционной зависимости между рассматриваемыми признаками.

Проверим с вероятностью 0,95 гипотезу о статистической значимости эмпирических данных. Наблюдаемое значение критерия Стьюдента равно.

.

 

Критическое значение находим по таблицам, имеющимся в статистических справочниках для уровня значимости α = 1- 0,95=0,05 и числа степеней свободы ν = 50 – 2= 48:

.

 

Имеем:

17,0664>2,02,

следовательно гипотеза о статистической значимости эмпирических данных принимается с указанной вероятностью.

Находим параметры регрессионных моделей (см. таблицу 10). Результаты вычислений представим в таблицах:

Линейная корреляционная зависимость

Система нормальных уравнений

у на х

 

 

 

 

 


Система

 

 


Решение

системы

Уравнение

 


х на у

 

Система

 

 



Решение

системы

, ,

Уравнение

Упрощенный способ

у на х

 

ρ



Уравнение

 


,

х на у

 

ρ



Уравнение

 


,

Следовательно:

Параболическая корреляционная зависимость

у на х

Система

 

 

Решение

системы

, ,

Уравнение


х на у

Система

 


Решение

системы

,

Уравнение

Показательная корреляционная зависимость

у на х

Система


 


Решение

системы

, ,

,

 

Уравнение

х на у

 

Система

 


 

Решение

системы

, ,

,

Уравнение

По каждой из полученных моделей находим величину средней ошибки аппроксимации и индекса детерминации (расчеты приведены в таблице 1). Имеем: для линейной модели

, или 80,12%;

для параболической модели

, или 79,95%;

для показательной модели

, или 79,06%.

 

Видим, что одновременно минимум средней ошибки аппроксимации и максимум индекса детерминации соответствует линейной регрессионной модели. Следовательно, она признается наиболее точной.

Графики линейной зависимости приведены на рисунке 12, параболической – на рисунке 13, а показательной – на рисунке 14. На них сплошной чертой изображены линии регрессии у на х, а пунктирной – х на у.

Строим прогноз признаков. Имеем: при стоимости основных производственных фондов 2,5 млн. руб., затраты на капитальный ремонт составят

(%).

Если затраты на капитальный ремонт составляют 0,52% от ОПФ, то стоимость основных производственных фондов должна составлять

(млн. руб.)

Таблица 1

у

Х

Линейная модель

Параболическая модель

Показательная модель

2

23

-4,8

23,04

3,883

-1,8833

3,5469

0,9417

3,610

-1,6100

2,5922

0,8050

3,68

1,6887

2,8515

0,8443

27

-4,8

23,04

1,800

0,2000

0,0400

0,1000

2,655

-0,6556

0,4298

0,3278

2,65

0,6524

0,4256

0,3262

4

19

-2,8

7,84

5,966

-1,9667

3,8678

0,4917

5,158

-1,1586

1,3424

0,2897

5,12

1,1298

1,2764

0,2824

23

-2,8

7,84

3,883

0,1167

0,0136

0,0292

3,610

0,3900

0,1521

0,0975

3,68

-0,3113

0,0969

0,0778

27

-2,8

7,84

1,800

2,2000

4,8400

0,5500

2,655

1,3444

1,8074

0,3361

2,65

-1,3476

1,8161

0,3369

6

15

-0,8

0,64

8,050

-2,0500

4,2025

0,3417

7,301

-1,3014

1,6935

0,2169

7,13

1,1340

1,2859

0,1890

19

-0,8

0,64

5,966

0,0333

0,0011

0,0056

5,158

0,8414

0,7079

0,1402

5,12

-0,8702

0,7572

0,1450

23

-0,8

0,64

3,883

2,1167

4,4803

0,3528

3,610

2,3900

5,7120

0,3983

3,68

-2,3113

5,3423

0,3852

8

11

1,2

1,44

10,13

-2,1333

4,5511

0,2667

10,03

-2,0383

4,1545

0,2548

9,92

1,9212

3,6911

0,2402

15

1,2

1,44

8,050

-0,0500

0,0025

0,0062

7,301

0,6986

0,4881

0,0873

7,13

-0,6660

0,7500

0,1083

19

1,2

1,44

5,966

2,0333

4,1344

0,2542

5,158

2,8414

8,0735

0,3552

5,12

-2,8702

8,2381

0,3588

10

11

3,2

10,24

10,13

-0,1333

0,0178

0,0133

10,04

-0,0383

0,0015

0,0038

9,92

-0,0788

0,0062

0,0079

15

3,2

10,24

8,050

1,19500

3,8025

0,1960

7,301

2,6986

7,2827

0,2699

7,13

-2,8660

8,2140

0,2866

12

7

5,2

27,04

12,21

-0,2167

0,0469

0,0181

13,36

-1,3693

1,8751

0,1141

13,7

1,7974

3,2307

0,1498

11

5,2

27,04

10,13

1,8667

3,4844

0,1556

10,03

1,9617

3,8484

0,1635

9,92

-2,0788

4,3213

0,1732

14

7

7,2

51,84

12,21

1,7833

3,1803

0,1274

13,36

0,6307

0,3977

0,0450

13,7

0,2026

0,0410

0,0145

-

 


-

202,24

-

-

40,212

3,8489

-

-

40,5588

3,9051

-

-

42,3445

3,9261

 

Рис. 3

 

Рис. 4






 






Рейтинг@Mail.ru

Goodstudents Goodstudents



Все права на материалы сайта принадлежат авторам. Копирование (полное или частичное) любых материалов сайта возможно только при указании ссылки на источник (администратор сайта).