Статистический анализ и оценка результатов эксперимента
Статистический анализ как однофакторных, так и многофакторных экспериментов в целом основан на одних и тех же принципах и включает в себя следующие этапы: проверка однородности дисперсий, значимости коэффициентов и адекватности полученной модели. Алгоритм статистического анализа однофакторных экспериментов рассмотрен в примере 4.6.
Статистический анализ результатов многофакторных экспериментов включает в себя те же этапы. Следует отметить, что формулы расчета статистических показателей для ротатабельного и ортогонального планирования второго порядка несколько различаются, поскольку в случае ортогонального планирования не выполняется требование однородности дисперсий. Алгоритм статистической обработки результатов ротатабельного и ортогонального планирования второго порядка подробно обсуждается в работе [19].
Ниже приводится алгоритм статистической обработки результатов однофакторных и многофакторных экспериментов при построении моделей первого порядка.
1. Рассчитывают среднее значение из числа n параллельных для каждого опыта.
(3.21)
2. Рассчитывают дисперсии вопроизводимости для каждого опыта.
(3.22)
3. Рассчитывают дисперсию воспроизводимости эксперимента как среднее арифметическое дисперсий всех опытов:
(3.23)
где N – число различных опытов (число элементов в матрице планирования);
n – число повторных опытов, N(n-1) - число степеней свободы
Формула (3.22) справедлива, если соблюдается равенство числа повторных опытов во всех экспериментальных точках матрицы планирования. На практике в разных точках бывает выполнено разное число опытов. В этом случае для оценки дисперсии воспроизводимости пользуются средневзвешенным значением.
(3.24)
Где Sj2– оценка дисперсии j-го опыта, fj– число степеней свободы в j-ом опыте; это число рассчитывают как f= n-1 (число параллельных опытов минус 1).
4. Проводят проверку на однородность дисперсий.
Однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бы все остальные. При одинаковом числе параллельных опытов однородность дисперсии можно оценить по критерию Кохрена, либо по F-критерию Фишера (см. Приложения 6,7).
Критерий Кохрена G рассчитывается как отношение максимальной дисперсии к суммарной, а критерий Фишера F – как отношение максимальной к минимальной:
(3.25) (3.26)
Полученные величины G и/или F сравнивается с табличными значениями. Гипотеза об однородности подтверждается, если G<Gтабл, или F< Fтабл. Если F> Fтабл, G>Gтабл, то дисперсии значимо отличаются друг от друга и тогда они неоднородны.
5. Осуществляют проверку на статистическую значимость полученных коэффициентов регрессии.
В результате проверки устанавливается статистическая значимость или незначимость отличия от нуля оценок параметров регрессии. Это проверка осуществляется отдельно для каждого параметра модели. Для оценки значимости коэффициентов регрессии можно воспользоваться следующим правилом: если абсолютная величина коэффициента регрессии больше доверительного интервала, то коэффициент считается значимым.
(3.27)
(3.28)
где t(f) – значение критерия Стьюдента, определяемое по числу степеней свободы f= N-n-1 и доверительной вероятности P; Sai – средние квадратические отклонения (СКО) ошибок коэффициентов регрессии.
Для простой линейной регрессии y=a0+a1x величины Sai вычисляют по формулам:
(3.29)
Однако из-за громоздкости вычислений чаще пользуются упрощенной процедурой проверки по t-критерию.
Зная дисперсию воспроизводимости, рассчитывают дисперсию коэффициентов уравнения регрессии S2 и затем среднеквадратичное отклонение S:
(3.30) (3.31) (3.32)
Затем рассчитывают фактическое значение критерия t по формуле:
(3.33)
Вычисленное значение сравнивается с табличным и если t > t(f) , то коэффициент значим. В противном случае соответствующую переменную можно исключить из модели и все расчеты повторить снова.
2. Проверка на адекватность проводится по критерию Фишера.
Подставляя значения аргументов в проверяемую модель, рассчитывают значения Yрасч и затем по ним - дисперсию адекватности или остаточную дисперсию:
(3.34)
N – число экспериментов, n -число параллельных опытов, d - число коэф-тов в уравнении.
Определяют экспериментальное значение критерия Фишера:
(3.35)
По таблице определяют теоретическое значение этого же критерия F(α;f1;f2), где f1= N-d, f2=n–1; если Fэксп≤F(α;f1;f2), то уравнение регрессии адекватно, в противном случае – нет. В некоторых работах для расчета степеней свободы применяются несколько иные варианты формул:
(3.36); f1=N-d-1; f2= N(n-1) (3.37)
3. Если уравнение адкватно, переходят к построению графиков и решению задач оптимизации. На этом этапе осуществляется также обратный переход от кодированных значений к натуральным. Для приведения к натуральному виду в полученное уравнение надо подставить значение xi из формулы преобразования (3.15).
Современная электронно-вычислительная техника позволяет не производить все эти расчеты вручную, а пользоваться готовыми программами статистической обработки данных (EXCEL, MathCAD, MathLAB, STATISTICA и др.). Эти программы позволяют сразу получить коэффициент корреляции, уравнение регрессии, рассчитать статистические параметры модели, представить результаты в виде графиков и диаграмм. В последние годы также развиваются он-лайн сервисы, где достаточно ввести исходные величины, чтобы получить уравнение регрессии, коэффициент корреляции, составить план многофакторного эксперимента и т. д.