Goodstudents.ru

 

 

 

 

 

Лекции по статистике Корреляционно-регрессионный анализ - Теоретические основы расчетов в статистике
Корреляционно-регрессионный анализ - Теоретические основы расчетов в статистике

Корреляционно-регрессионный анализ - Теоретические основы расчетов в статистике

Корреляционная зависимость

Корреляционно-регрессионный анализ - формулы

1. Эмпирические данные выборки объема n принято записывать в виде таблицы, в которой Y – результативный признак со значениями Y1, Y2,...Yn , а , ,…, - факторные признаки со значениями , i=1,2,…, n , j=1,2,…k:

Y

X1

X2

Xk

1

y1

X11

X12

x1k

2

y2

X21

X22

x2k

n

yn

xn1

xn2

xnk

2. Отбор факторных признаков, пока модель не построена, производится несколькими способами. Все они основаны на расчете межфакторных коэффициентов корреляции

 

и парных коэффициентов корреляции

.

 

Из формул следует, что они находятся точно так же, как и коэффициенты линейной корреляции (пример по корреляционно-регрессионныму анализу мы рассматривали здесь) и обладают аналогичными свойствами.

Способ 1. Этот способ основан на проверке гипотезы о значимости коэффициента линейной корреляции с помощью t – критерия Стьюдента.

Правило проверки гипотезы. Если наблюдаемое значение критерия больше критического,

,

то это с вероятностью γ (уровнем значимости α = 1- γ) говорит о значимости межфакторного коэффициента корреляции , а следовательно о значимости факторного признака (он отбирается в модель). При этом

,

 

а критическое значение определяется по статистическим таблицам:

, α = 1- γ, ν = n – 2.

Способ 2. Основываясь на свойстве корреляционного отношения, , можно предположить, что чем выше величина межфакторного коэффициента корреляции, тем теснее будет связь между данным факторным и результативным признаком. Таким образом, в модель включаются те из факторных признаков, которым соответствуют наибольшие значения .

Способ 3. Между факторными признаками не должно наблюдаться ни корреляционной, ни тем более функциональной зависимости (в противном случае признаки лишь дублируют друга). Данное условие называется принципом отсутствия автокорреляции. Считается, что между признаками и автокорреляция отсутствует, если межфакторный коэффициент корреляции

.

Если для факторных признаков это условие нарушается, то один из них необходимо исключить из рассмотрения.

3. Форму и тесноту корреляционной зависимости можно с помощью множественного коэффициента корреляции . В частности, если число факторных признаков равно двум, то

.

 

Проверкой правильности произведенных расчетов является требование:

.

Если , то связь между признаками линейная. Если же , то связь является линейной и тесной.

4. Проверка статистическое значимости эмпирических данных, а следовательно принципиальная возможность построения регрессионной модели, производится с помощью F – критерия Фишера.

Правило проверки гипотезы. Если наблюдаемое значение критерия больше критического,

,

то это с доверительной вероятностью γ (уровнем значимости α=1- γ) говорит о статистической значимости эмпирических данных. При этом наблюдаемое значение критерия равно

,

 

 

а критическое значение критерия определяется по таблицам справочников в зависимости от уровня значимости α=1- γ и числа степеней свободы и ,

.

 

5. Общий индекс детерминации позволяет определить суммарное влияние факторных признаков на результативный. Он равен:

.

 

6. После того, как установлена форма корреляционной зависимости, подтверждена гипотеза о статистической значимости эмпирических данных, приступают к построению многофакторной модели регрессии. Например, если модель – линейная, число факторных признаков равно двум, то ее уравнение имеет вид:

.

Параметры модели находятся методом наименьших квадратов путем решения системы нормальных уравнений. Например, в линейном случае для k=2, система имеет вид:


Существует другой, упрощенный способ нахождения параметров , и :

,

,

.

 

7. Оценка точности регрессионной модели производится также, как и в случае парной регрессии – с помощью средней ошибки аппроксимации

8. С помощью дельта – коэффициента можно ответить на вопрос: в какой мере факторный признак Xi влияет на результативный. Он рассчитывается по формуле:

.

 

Проверить правильность произведенных расчетов позволяет следующее равенство:

.

9. Величина среднего коэффициента эластичности отвечает на вопрос: на сколько процентов изменится результативный признак, если данный факторный признак Xi изменить на 1%? Он равен:

.

10. С помощью значений дельта – коэффициента и среднего коэффициента эластичности можно исключить из модели самый незначимый признак. Им признается тот, у которого одновременно

, .




 






Goodstudents Goodstudents



Все права на материалы сайта принадлежат авторам. Копирование (полное или частичное) любых материалов сайта возможно только при указании ссылки на источник (администратор сайта).