5. Заново вычисляем частные коэффициенты корреляции откликов с факторами, не входящими в состав регрессии:
_Xi- |
X2 |
X3 |
rjy-1,4 |
0,36 |
0,32 |
Таким образом следующим элементом для включения в состав уравнения будет Х2.
6. Строим новое МНК уравнение регрессии:
Y(x1,x2,x4,bo,b1,b4)=bo+b1x1+b2x2+b4x4=
= 71,65+ 1,45×1+ 0,42×2- 0,24×4 .
2
Доля объясненной вариации R %=98,2% возросла по сравнению со значением предыдущего шага 97,2%. ^
F-критерий значимости моделиF=166,8>Fo,9(3,9)=2,81.Полученная регрессия значима. F-критерий для включения:
ху. F = 154 > Fo,9(1,9) = 3,36
Х2: F = 5,02 >Fo,9 (1,9) = 3,36
= 229,5 >F (2,10) = 4,10 -регрес-
0,9
х1: F =146,5> F0,9(1,10) = 4,96 ;
Y (xi,X2, хз,Ьо,Ь,Ь2,Ьз)= bo+ bx+ bj xj+ Ьз хз=
= 48,2 +1,69xi + 0,66×2+ 0,25хз.
2
мо-= з,з6 ;хз:
При этом R %=98,2%. F-критерий значимости
дели F =166,з > ^0,9(з,9)= 2,81. х1: F =68,7> ^0,9(1,9)=з,зб; Х2: F =250,5> F0,9 (1,9)
F =1,83<Fo 9 (1,9) = з,з6 и переменнуюхзследует исключить из регрессии.
Таким образом, в качестве «наилучшего» уравнения следует выбрать
Y (х1, X2,b0,b 1 ,Ь2)= Ь0+ Ь1Х1 +Ь2 Х2=52,58+1,47х1+0,66х2.
Доверительные интервалы для коэффициентов регрессии определяются как
bj
±s
res
ft
1-a / 2
(N-p-Ц (X
T
V
-1 -1 ^
x)„
0,5
b j± °(b j)t1-a 2(N-p-1),
где sres(p)= RSS (b)/(N -p -1). В результате b1 : 1,47+/-0,22 a(b1)=0,12; b2: 0,66+/-0,09
c(b1)=0,05.
На основании изложенного можно сделать следующие выводы. Наилучшие результаты при выборе структуры модели дает проверка всех возможных регрессий. Однако она и наиболее трудоемка. Метод исключения лучше, чем метод включения. Шаговый регрессионный анализ объединяет достоинства методов включения и исключения. Особенно он эффективен в комбинации с анализом остатков и является одним из наиболее эффективных методов определения оптимальной структуры модели.
