Линейный корреляционный и регрессионный анализ
Лабораторная работа 4. Линейный корреляционный и регрессионный анализ.
Цель работы – определить, является ли статистическая зависимость между признаком и организованным фактором тесной и, если является, то построить эмпирическую формулу, связывающую признак с фактором, и оценить показатели ее качества.
Ход выполнения работы.
1. Внесите исходные данные на Лист.
2. Рассчитайте коэффициент корреляции по приведенным формулам:
где
;
,
.
Примите решение относительно тесноты статистической связи между х и у.
3. Рассчитайте коэффициенты a и b линии регрессии вида Y=a+bX по методу наименьших квадратов по формулам:
Þ 
4. Вычислите величины, характеризующие качество линии регрессии:
- значимость (критерий Фишера):

Здесь
- значение у, рассчитанное по уравнению регрессии;
- стандартная ошибка линии регрессии – с. к.о. экспериментальных данных от линии регрессии:
;
- стандартная ошибка коэффициента регрессии:
.
5. Постройте линию регрессии, используя «Мастер диаграмм».
5.1. Постройте точечную диаграмму зависимости у от х. На диаграмме отразите только точки (без соединяющих линий).
5.2. Укажите на точку диаграммы и нажмите правую кнопку мыши. В контекстном меню выберите «Добавить линию тренда».
5.3. В окне диалога «Линия тренда» на вкладке «Тип» выберите «Линейная», на вкладке «Параметры» укажите маркеры в позициях «показывать уравнение на диаграмме» и «поместить на диаграмму величину достоверности аппроксимации». Нажмите ОК. На диаграмме получите уравнение регрессии и величину коэффициента корреляции во 2-й степени.
6. . Выполните расчет параметров линии регрессии с помощью надстройки Анализ данных.
5.1. Откройте меню «Сервис» ® «Анализ данных».
5.2. В окне диалога «Анализ данных» выберите «Регрессия».
2.3. В окне «Регрессия» в строки «входной интервал х» и «входной интервал у» введите соответствующие диапазоны анализируемых ячеек (содержащие переменные t и Р). В поле «уровень надежности» установите 0,95 (доверительная вероятность). В параметрах вывода отметьте «новый рабочий лист». Выполните расчет, нажав кнопку ОК.
2.4. Изучите результаты расчета, сравните их с расчетом, выполненным на Листе.
Результаты регрессионного анализа:
Ячейка
|
Результат
|
В4
|
коэффициент корреляции
|
А11:F14
|
результаты дисперсионного анализа:
SS-регрессия - сумма квадратов отклонений Yi от среднего арифметического
SS-остаток - сумма квадратов отклонений Yi от Yi расчетного
MS=SS/df (df – степени свободы)
F=MS-регрессия/MS-остаток – критерий Фишера
Значимость F – вероятность, что уравнение не подходит для описания экспериментальных данных
|
А16:F18
|
коэффициенты линии регрессии и их параметры:
коэффициент У-пересечение – величина свободного члена а
коэффициент Пременная Х – величина коэффициента b
|
1
|
A
|
B
|
C
|
D
|
E
|
F
|
G
|
H
|
I
|
J
|
2
|
|
Линейный корреляционный и регрессионный анализ
|
|
|
|
|
3
|
|
|
|
|
|
|
|
|
|
|
4
|
n
|
t
|
p
|
t*p
|
(t-tcp)^2
|
(P-Pcp)^2
|
|
dt=t-tср
|
dP=Р-Рср
|
dt*dP
|
5
|
1
|
20,3
|
142,2
|
2886,66
|
0,6724
|
50,6944
|
|
-0,82
|
-7,12
|
5,8384
|
6
|
2
|
21,5
|
150,3
|
3231,45
|
0,1444
|
0,9604
|
|
0,38
|
0,98
|
0,3724
|
7
|
3
|
19,6
|
137,7
|
2698,92
|
2,3104
|
135,0244
|
|
-1,52
|
-11,62
|
17,6624
|
8
|
4
|
23,7
|
165,8
|
3929,46
|
6,6564
|
271,5904
|
|
2,58
|
16,48
|
42,5184
|
9
|
5
|
20,5
|
150,6
|
3087,3
|
0,3844
|
1,6384
|
|
-0,62
|
1,28
|
-0,7936
|
10
|
|
|
|
|
|
|
|
|
|
|
11
|
|
|
|
|
|
|
|
|
|
Ковариация
|
12
|
|
|
|
|
|
|
|
|
|
13,1196
|
22
|
|
|
|
|
|
|
|
|
|
|
23
|
|
Сумма
|
|
|
Сумма
|
|
|
|
|
|
24
|
|
105,6
|
746,6
|
15833,79
|
10,168
|
459,908
|
|
|
|
|
25
|
|
Среднее арифм.(cp)
|
|
Дисперсия
|
|
|
Корреляция
|
|
26
|
|
21,12
|
149,32
|
|
2,0336
|
91,9816
|
|
|
R=
|
0,95926224
|
27
|
|
|
|
|
|
|
|
|
R^2=
|
0,92018404
|
28
|
|
t^2
|
p^2
|
Уравнение регрессии: Y=a+bX
|
|
Pрасч
|
(p-Pрасч)^2
|
|
29
|
|
412,09
|
20220,84
|
b=
|
6,451416
|
|
|
144,03
|
3,348309703
|
|
30
|
|
462,25
|
22590,09
|
a=
|
13,06609
|
|
|
151,772
|
2,165424553
|
|
31
|
|
384,16
|
18961,29
|
|
|
|
|
139,514
|
3,290042261
|
|
32
|
|
561,69
|
27489,64
|
|
|
|
|
165,965
|
0,027110879
|
|
33
|
|
420,25
|
22680,36
|
|
|
|
|
145,32
|
27,87711221
|
|
34
|
|
Сумма
|
|
|
|
|
|
|
Сумма
|
|
35
|
|
2240,44
|
111942,2
|
|
|
|
|
|
36,70799961
|
|
36
|
|
|
|
|
|
|
|
|
|
|
37
|
|
Оценка значимости
|
|
|
|
|
Станд. ошибка коэф. регр.(b)
|
38
|
|
Общая дисперсия
|
Sy
|
114,977
|
|
|
|
1,096988218
|
|
39
|
|
Остаточная дисп.
|
Syост
|
12,236
|
|
|
|
|
|
40
|
|
Критерий Фишера
|
F
|
9,396617
|
|
|
|
|
|
41
|
|
|
|
|
|
|
|
|
|
|
 |
Рис.7.
Линейный корреляционный и регрессионный анализ - 4.0 out of
5
based on
1 vote
Добавить комментарий