Лабораторная работа 4. Линейный корреляционный и регрессионный анализ.
Цель работы – определить, является ли статистическая зависимость между признаком и организованным фактором тесной и, если является, то построить эмпирическую формулу, связывающую признак с фактором, и оценить показатели ее качества.
Ход выполнения работы.
1. Внесите исходные данные на Лист.
2. Рассчитайте коэффициент корреляции по приведенным формулам:
где
;
, .
Примите решение относительно тесноты статистической связи между х и у.
3. Рассчитайте коэффициенты a и b линии регрессии вида Y=a+bX по методу наименьших квадратов по формулам:
Þ
4. Вычислите величины, характеризующие качество линии регрессии:
- значимость (критерий Фишера):
Здесь - значение у, рассчитанное по уравнению регрессии;
- стандартная ошибка линии регрессии – с. к.о. экспериментальных данных от линии регрессии:
;
- стандартная ошибка коэффициента регрессии:
.
5. Постройте линию регрессии, используя «Мастер диаграмм».
5.1. Постройте точечную диаграмму зависимости у от х. На диаграмме отразите только точки (без соединяющих линий).
5.2. Укажите на точку диаграммы и нажмите правую кнопку мыши. В контекстном меню выберите «Добавить линию тренда».
5.3. В окне диалога «Линия тренда» на вкладке «Тип» выберите «Линейная», на вкладке «Параметры» укажите маркеры в позициях «показывать уравнение на диаграмме» и «поместить на диаграмму величину достоверности аппроксимации». Нажмите ОК. На диаграмме получите уравнение регрессии и величину коэффициента корреляции во 2-й степени.
6. . Выполните расчет параметров линии регрессии с помощью надстройки Анализ данных.
5.1. Откройте меню «Сервис» ® «Анализ данных».
5.2. В окне диалога «Анализ данных» выберите «Регрессия».
2.3. В окне «Регрессия» в строки «входной интервал х» и «входной интервал у» введите соответствующие диапазоны анализируемых ячеек (содержащие переменные t и Р). В поле «уровень надежности» установите 0,95 (доверительная вероятность). В параметрах вывода отметьте «новый рабочий лист». Выполните расчет, нажав кнопку ОК.
2.4. Изучите результаты расчета, сравните их с расчетом, выполненным на Листе.
Результаты регрессионного анализа:
Ячейка |
Результат |
В4 |
коэффициент корреляции |
А11:F14 |
результаты дисперсионного анализа: SS-регрессия - сумма квадратов отклонений Yi от среднего арифметического SS-остаток - сумма квадратов отклонений Yi от Yi расчетного MS=SS/df (df – степени свободы) F=MS-регрессия/MS-остаток – критерий Фишера Значимость F – вероятность, что уравнение не подходит для описания экспериментальных данных |
А16:F18 |
коэффициенты линии регрессии и их параметры: коэффициент У-пересечение – величина свободного члена а коэффициент Пременная Х – величина коэффициента b |
1 |
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
2 |
Линейный корреляционный и регрессионный анализ |
|||||||||
3 |
||||||||||
4 |
n |
t |
p |
t*p |
(t-tcp)^2 |
(P-Pcp)^2 |
dt=t-tср |
dP=Р-Рср |
dt*dP |
|
5 |
1 |
20,3 |
142,2 |
2886,66 |
0,6724 |
50,6944 |
-0,82 |
-7,12 |
5,8384 |
|
6 |
2 |
21,5 |
150,3 |
3231,45 |
0,1444 |
0,9604 |
0,38 |
0,98 |
0,3724 |
|
7 |
3 |
19,6 |
137,7 |
2698,92 |
2,3104 |
135,0244 |
-1,52 |
-11,62 |
17,6624 |
|
8 |
4 |
23,7 |
165,8 |
3929,46 |
6,6564 |
271,5904 |
2,58 |
16,48 |
42,5184 |
|
9 |
5 |
20,5 |
150,6 |
3087,3 |
0,3844 |
1,6384 |
-0,62 |
1,28 |
-0,7936 |
|
10 |
||||||||||
11 |
Ковариация |
|||||||||
12 |
13,1196 |
|||||||||
22 |
||||||||||
23 |
Сумма |
Сумма |
||||||||
24 |
105,6 |
746,6 |
15833,79 |
10,168 |
459,908 |
|||||
25 |
Среднее арифм.(cp) |
Дисперсия |
Корреляция |
|||||||
26 |
21,12 |
149,32 |
2,0336 |
91,9816 |
R= |
0,95926224 |
||||
27 |
R^2= |
0,92018404 |
||||||||
28 |
t^2 |
p^2 |
Уравнение регрессии: Y=a+bX |
Pрасч |
(p-Pрасч)^2 |
|||||
29 |
412,09 |
20220,84 |
b= |
6,451416 |
144,03 |
3,348309703 |
||||
30 |
462,25 |
22590,09 |
a= |
13,06609 |
151,772 |
2,165424553 |
||||
31 |
384,16 |
18961,29 |
139,514 |
3,290042261 |
||||||
32 |
561,69 |
27489,64 |
165,965 |
0,027110879 |
||||||
33 |
420,25 |
22680,36 |
145,32 |
27,87711221 |
||||||
34 |
Сумма |
Сумма |
||||||||
35 |
2240,44 |
111942,2 |
36,70799961 |
|||||||
36 |
||||||||||
37 |
Оценка значимости |
Станд. ошибка коэф. регр.(b) |
||||||||
38 |
Общая дисперсия |
Sy |
114,977 |
1,096988218 |
||||||
39 |
Остаточная дисп. |
Syост |
12,236 |
|||||||
40 |
Критерий Фишера |
F |
9,396617 |
|||||||
41 |
Рис.7.