Фрагмент для ознакомления
2
где и – распределения x2 с k1 и k2 степенями свободы.
F -распределение имеет асимметричную функцию плотности распределения и зависит от двух параметров – k1 и k2.
Графики этого распределения показаны на рис. 1. Построить такие распределения в SPSS достаточно просто, если воспользоваться функцией . Здесь x – случайная величина, k1 и k2 – числа степеней свободы.
Рисунок 1 - Плотность распределения Фишера – Снедекора для различных значений параметров [2]
Решим задачу.
ЗАДАНИЕ. В течение шести лет использовались четыре различных технологии по выращиванию сельскохозяйственной культуры. Необходимо установить влияние различных технологий на урожайность культуры по данным таблиц. Задачу просчитать вручную и на ПЭВМ.
Год Технология(фактор А)
А1 А2 А3 А4
1 0,9 1 1,3 1,8
2 0,8 0,7 1,5 1,9
3 1 1,3 1,6 1,1
4 1,3 1 1,4 1,4
5 1,4 1,3 1,2 1,3
6 0,8 1,3 1,1 1,9
Решение.
Получим решение вручную.
Составляем расчетную таблицу для дисперсионного анализа.
i А1 А2 А3 А4 Сумма
1 0,9 0,81 1 1 1,3 1,69 1,8 3,24
2 0,8 0,64 0,7 0,49 1,5 2,25 1,9 3,61
3 1 1 1,3 1,69 1,6 2,56 1,1 1,21
4 1,3 1,69 1 1 1,4 1,96 1,4 1,96
5 1,4 1,96 1,3 1,69 1,2 1,44 1,3 1,69
6 0,8 0,64 1,3 1,69 1,1 1,21 1,9 3,61
6,2 6,: 8,1 9,4 30,3
6,74 7,56 11,11 15,32 40,73
38,44 43,56 65,61 88,36 235,97
Найдем общую и факторную суммы квадратов отклонений, учитывая, что число уровней фактора p = 4, число испытаний на каждом уровне q = 6.
Получаем:
Найдем остаточную сумму квадратов отклонений:
Найдем дисперсии:
Сравним факторную и остаточную дисперсию с помощью критерия Фишера-Снедекора. Найдем наблюдаемое значение критерия:
По числу степеней свободы , и по уровню значимости α = 0,05 = 5% находим критическую точку Fкрит = 3,098. Так как , следует отвергнуть нулевую гипотезу, влияние фактора (технологии) на урожайность значимо [3].
Решим задачу с помощью Excel.
Задаем таблицу данных.
Год А1 А2 А3 А4
1 0,9 1 1,3 1,8
2 0,8 0,7 1,5 1,9
3 1 1,3 1,6 1,1
4 1,3 1 1,4 1,4
5 1,4 1,3 1,2 1,3
6 0,8 1,3 1,1 1,9
Запускаем надстройку Анализ данных, выбираем пункт Однофакторный дисперсионный анализ.
Задаем параметры анализа: данные и уровень значимости.
Получаем на выходе результаты:
В таблице представлены средние значения и дисперсия для каждой из четырех выборок, наблюдаемая величина критерия F, критическое значение F и значимость F-статистики (вероятность). Также приведены факторная и остаточная сумма квадратов отклонений, числа степеней свободы для каждой из дисперсий и т.д. Все данные совпадают с полученными в результате ручных расчетов в предыдущем пункте.
Так как значение вероятности P = 0,00087 меньше заданного уровня 0,05, можно сделать вывод, что влияние фактора значимо.
Рассмотрим еще один пример.
Изделие железнодорожного транспорта в целях проведения испытаний на надежность эксплуатируется q раз, i=1.q на p уровнях времени работы Tj, j=1,..., p. В каждом испытании подсчитывают числа отказов nij. На уровне значимости α = 0,05 изучать воздействие времени работы изделия на количество появления отказов методом однофакторного дисперсионного анализа при q=4, p=4. Итоги испытаний nij показаны в приведенных ниже таблицах.
Решение.
Процедура однофакторного дисперсионного анализа. Найдем групповые средние по формуле:
N П1 П2 П3 П4
1 145 210 195 155
2 140 200 190 150
3 150 190 240 180
4 190 195 210 175
x 156.25 198.75 208.75 165
Обозначим р - число уровней фактора (р=4). Количество измерений на каждом уровне является одинаковым и равняется q=4.
В последней строке показаны групповые средние для каждого уровня фактора.
Общая средняя может быть получена как среднее арифметическое групповых средних:
Показать больше