Goodstudents.ru

 

 

 

 

 

Лекции по статистике Практические задачи. Множественная регрессия
Практические задачи. Множественная регрессия

Практические задачи. Множественная регрессия

Рассмотрите следующие задачи:

1. Предположим, что Вы управляете регрессией Y от X (с отрезком, отсекаемым на координатной оси) и получаете разности наименьших квадратов: , где i = 1,2,..., N и и являются оценками наименьших квадратов отрезка, отсекаемого на координатной оси, и наклонных параметров соответственно. Затем, Вы вычисляете регрессию Y от X и (С отрезком, отсекаемым на координатной оси). То есть вы применяете метод наименьших квадратов к (*), где является новой ошибкой.

 

ЗАМЕЧАНИЕ: Вы должны ответить на следующие вопросы, основанные на интуиции, а не на математике.

a) Каково значение вашей оценки ?

b) Какое значение имеет R2 статистический параметр в этой регрессии? [Маркированный (*)]

2. Рассмотреть следующую регрессионную модель :


со следующими наблюдениями:

Y

X2

X3

X2Y

X3Y

X2X3

X22

X23

30

4

10

120

300

40

16

100

20

3

8

60

160

24

9

64

36

6

11

216

396

66

36

121

24

4

9

96

216

36

16

81

40

8

12

320

480

96

64

144

Суммируем 150

25

50

812

1552

262

141

510

 

a) Каковы нормальные уравнения для этой задачи?

b) Решить для оценок наименьших квадратов отрезка, отсекаемого на координатной оси, и наклонных параметров.

 

3. Рассмотреть следующие исходы регрессии:

Выведите оценки обычных наименьших квадратов параметров модели.

4. Предположим, что Вы оцениваете следующую модель для цен на недвижимость в заливе около города Сан-Франциско:

ЦенаДома = 5.2 - .725 ВозможныйНалог + .547 SQFT + .00073 Корпорация + .0638

(0.24)

(0.24)

(0.0005)

(0.02)

 

Возраста (Age) - .0043 Перемещение (Travel)

(0.002)

 

Где "ЦенаДома" представляет цену дома, измеренную в тысячах долларов,

"ВозможныйНалог" измеряет количество налогов на собственность, оплачиваемых домашним владельцем (измерены в долларах), "SQFT" измеряет квадратную площадь дома в футах, "Корпорация" представляет средний доход семейств в этой области (измеренный в долларах), "Возраст" представляет средний возраст дома(измеренный в годах), и "Перемещение" представляет расстояние перевозки до центра Сан-Франциско (измеренное в милях).

a) Являются ли оцененные коэффициенты наклонной кривой значительными в контексте этой модели? Дайте интерпретацию каждого из оцененных параметров.

b) Какие значения t-статистического для каждого из параметров наклонной кривой? Какие из коэффициентов являются существенными на уровне доверия 95 % ? Примите N=400.

c) Определите, какова была бы средняя цена дома, если налог на собственность составил бы $ 1,600, средняя площадь дома 2,250 футов , срединный доход семейства $ 80,000, средний возраст дома 10 лет, а расстояние от центра города Сан-Франциско 50 миль?

4. Рассмотреть следующую модель функции производства:,

Где Y - логарифм производимой продукции , X2 - логарифм трудовых затрат, X3 - логарифм вклада капитала, а нижний индекс i относится к i-той фирме. Предположим, что все допущения о классической модели регрессии реальны.

A) Объясните подробно, как Вы бы проверили на уровне 95 % доверия, что и против простых двух - хвостовой переменной ипотезы. Умейте объяснить полученные результаты.

B) Объясните, как Вы бы проверили нулевую гипотезу на то, что константа выставок фирм пропорционально увеличивается. То есть как бы Вы проверили, что против простых двух - хвостовой переменной гипотезы?

C) Предположим, что вместо испытания, так как константа пропорционально увеличивается, мы определяем . Как это изменяет вашу модель? То есть как модель может быть оценена теперь? Как это изменяет вашу оценку ?

6. Этот вопрос основан на " Примере цен на дома", который мы изучали в классе. Рассмотрите ценовую регрессию цен на дома:

ЦЕНА =129.062 + .1548 SQFT - 21.588 СПАЛЬНИ - 12.193 ВАНН,

Где цена измерена в тысячах долларов. Какова средняя стоимость дома с жилой площадью 2500 квадратных футов, 4 спальнями и 3 ванными комнатами? Это значение кажется разумным?

7. Вопрос также основан на примере цен на дома.

 

Рассмотрим следующие исходы четырех вариаций модели регрессии:

Переменная

Модель А

Модель B

Модель C

Модель D

Константа

52.351

121.179

129.062

317.493

(1.404)

(1.511)

(1.462)

(13.423)

SQFT

0.13875

0.14831

0.1548

(7.407)

(6.993)

(4.847)

СПАЛЬНИ (КУПЕ СПАЛЬ-

НОГО ВАГОНА)

-23.911

-21.588

(-0.970)

(-0.799)

ВАННЫ (РАСТВОРЫ)

-12.193

(-0.282)

RSS

18,274

16,833

16,700

101,815

R2

0.821

0.835

0.836

0.000

0.806

0.805

0.787

0.000


Из Fm, N-k

54.861

27.767

16.989

180.198

d.f

12

11

10

13

 

a) Модель D является самой ограниченной из всех моделей, которая регрессирует ЦЕНУ только против постоянного члена. Сравните Модель C (неограниченная модель) с Моделью D (ограниченная модель) и проверим F-значение, указанное в таблице для модели B.

b) Сравните Модель B (неограниченная модель) с Моделью C (ограниченная модель) и проверить F-значение, указанное в таблице для модели B.

c) Проверить гипотезу на то, что: "коэффициенты по СПАЛЬНЯМ и ВАННЫМ КОМНАТАМ совместно равны нулю " в уровне значимости 95 %.

d) Объяснить, почему значения или R-возведенное в квадрат и отрегулированное R-возведенное в квадрат статистические равны нулю для Модели D.

8. Рассмотреть неограниченную регрессионную модель:

.

A) Вывести ограниченные модели для испытаний

и (Два отдельных испытания).

B) Предположим, что это известно, что . Выведите модель, которая позволила бы Вам получить оценки для параметров регрессии и .

9. Таблица указанная ниже представляет оцененные коэффициенты и связанную статистику для ряда переменных моделей на размере бедности. Таблица представляет данные переписи 1980 для 58 округов Калифорнии, связывающих коэффициент бедности (процент семейств с доходом ниже прожиточного минимума) к нескольким из его детерминантов: URB = процент городского населения , FAMSIZE = среднее количество членов в семье, EDUC1 = процент (доля) населения в возрасте 25 лет и старше, имеющее за спиной только 8 лет образования, EDUC2 = процент совокупности в возрасте 25 лет и старше, окончившее среднюю школу, EDUC3 = процент совокупности в возрасте 25 лет и старше, имеющее за спиной четыре года обучения в колледже, UNEMP = уровень безработицы среди людей в возрасте 16 лет и старше, MEDING = срединный доход семьи в тысячах долларов.

 

Переменная

Модель А

Модель B

Модель C

Модель D

Константа

27.955

27.851

25.924

27.646

(1.83)

(3.21)

(9.07)

(10.28)

URB

0.0238

0.0238

0.0235

(2.09)

(2.19)

(2.20)

(1.93)

FAMSIZE

-0.4576

-0.4667

-21.588

(-0.20)

(-0.24)

(-0.799)

EDUC1

-0.0018

(-0.01)

EDUC2

-0.1632

-0.1617

-0.1517

-0.1594

(-0.82)

(-2.58)

(-3.29)

(-3.43)

EDUC3

0.1458

0.1453

0.1425

0.1298

(0.72)

(2.23)

(2.25)

(2.03)

UNEMP

0.1112

0.1113

0.1118

(0.55)

(1.58)

(1.61)

MEDINC

-0.5392

-0.5393

-0.5496

-0.5364

(-4.00)

(-4.06)

(-4.42)

(-4.26)

Из Fm, N-k

11.795

14.036

17.144

20.183

RSS

133.952

133.953

134.098

140.755

 

a) Для Моделей B, C, D проверьте полное значение модели, то есть интерпретируйте F статистический коэффициент для каждой модели (используйте уровень доверия 95 % ).

b) Проверьте гипотезу на то, что коэффициенты по FAMSIZE и EDUC1 вместе равняются нулю при уровне значимости 99 %.

c) Проверьте гипотезу, что коэффициенты по FAMSIZE, EDUC1 и UNEMP вместе равны нулю при уровне значимости 99 %.

d) Для каждой модели примените t-критерий для каждого из коэффициентов регрессии, чтобы проверить значимость коэффициентов при уровне значимости 95 %.




 






Goodstudents Goodstudents



Все права на материалы сайта принадлежат авторам. Копирование (полное или частичное) любых материалов сайта возможно только при указании ссылки на источник (администратор сайта).