7.2.8 Дисперсионный анализ
Ошибка воспроизводимости экспериментов, которая оценивается с помощью дисперсии, может быть следствием не одной, а нескольких причин или операций. Так, например, при исследовании на обогатимость дисперсия результатов может складироваться из ряда компонентов: химического анализа, отбора проб и обогатительного эксперимента.
Если известна величина компонентов дисперсии, совершенствуют соответствующие операции, чтобы наиболее эффективно снизить ошибку эксперимента.При полупромышленных и промышленных испытаниях вопрос о влиянии полноты усреднения и однородности проб приобретает первостепенное значение. Важность раздельной оценки дисперсий, связанных с вариацией сортности полезного ископаемого, точностью поддержания режима обогащения и ошибкой анализа, определяется необходимостью подбора такого режима обогащения, который наряду с высокими средними показателями обеспечивает стабильность результатов при изменении качества полезного ископаемого.
Решение подобных задач составляет предмет дисперсионного анализа. С помощью дисперсионного анализа определяются дисперсии, обусловленные действием каждого фактора в отдельности и их взаимодействием, и оценивается статистическая значимость этих величин с учётом ошибки воспроизводимости.
Дисперсионный анализ можно выполнять только при следующих условиях:
- серии измерений можно рассматривать как случайные выборки из генеральных совокупностей, которые подчинены нормальному распределению;
- дисперсии, обусловленные ошибками воспроизводимости, для всех серий измерений однородны. Если такой уверенности нет, необходимо проверить однородность дисперсий с использованием критериев Кохрена или Фишера.
Однофакторный дисперсионный анализ
Если наблюдается действие одного фактора (простой случай), задачу можно сформулировать следующим образом: пусть наблюдают т независимых нормально распределённых величин х1, х2, ..., хт, и при этом предполагают, что все они имеют одно и тоже среднее квадратическое отклонение S.
Над каждым переменным выполняется n наблюдений (табл. 7.6).Таблица 7.6 - Результаты наблюдений
№ испытания, і | № прибора (уровень фактора), j | |||
1 | 2 | 3 | т | |
1 2 … п | х11 х21 … хn1 | х12 х22 … хn2 | … … … … | х1m х2m … хnm |
Групповая средняя, | … |
В задаче необходимо на уровне значимости α проверить нулевую гипотезу о равенстве групповых средних при допущении, что групповые генеральные дисперсии хотя и неизвестны, но одинаковы.
Для решения этой задачи вводятся:
- общая сумма квадратов отклонений наблюдаемых значений признака от общей средней:
; (7.23)
- факторная сумма квадратов отклонений групповых средних от общей средней (характеризует рассеяние между группами):
; (7.24)
- остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней (характеризует рассеяние в середине группы):
. (7.25)
Для вычисления общей и факторной сумм более удобны такие формулы:
, (7.26)
, (7.27)
где - сумма квадратов наблюдаемых значений признака на уровне mj; - сумма наблюдаемых значений признака на уровне mj.
Если наблюдаемые значения признака являются сравнительно большими числами, то для упрощения вычислений вычитают из каждого значения одно и тоже число С, которое примерно равно общей средней. Если уменьшенные значения , то
, (7.28)
, (7.29)
где - сумма квадратов уменьшенных значений признака на уровне mj; - сумма уменьшенных значений признака на уровне mj.
Факторную и остаточную сумму делят на соответствующее число степеней свободы и находят факторную и остаточную дисперсии:
, (7.30)
. (7.31)
После этого сравнивают факторную и остаточную дисперсии по критерию Фишера:
. (7.32)
Если - различие групповых средних незначимо.
Если - различие групповых средних значимо.
Если факторная дисперсия окажется меньше остаточной, то отсюда следует справедливость нулевой гипотезы о равенстве групповых средних, поэтому дальнейшие вычисления (сравнение дисперсий с помощью критерия F) лишние.
Пример 7.7. При совместном анализе точности группы измерительных приборов (потенциометров) решается вопрос: можно ли считать их систематические ошибки одинаковыми. Число потенциометров - т (т = 3) и каждый из них измеряет рН одной и той же пульпы п раз (n = 4).
Результаты исследований приведены в табл. 7.7.Таблица 7.7 - Результаты исследований
Число измерений, п | Число уровней фактора (число потенциометров), т | ||
1 | 2 | 3 | |
1 2 3 4 | 13,5 13,2 13,1 13,0 | 13,0 12,4 12,6 12,0 | 12,1 12,2 13,4 13,1 |
Σ | 58,2 | 50,0 | 50,8 |
Среднее | 13,2 | 12,5 | 12,7 |
Для упрощения вычислений вычитаем из каждого наблюдаемого значения общую среднюю и переходим к уменьшенным величинам, например, у11 = х11 – 12,8 = 13,5 – 12,8 = 0,7 и т.д.
Составляем расчётную таблицу (табл. 7.8) и с использованием итогового столбца вычисляем общую, факторную и остаточную суммы квадратов отклонений при числе уровней фактора т = 3 и числе измерений на каждом уровне п = 4.
Таблица 7.8 - Расчётная таблица
№ опыта | Уровни фактора | Итоговый столбец | |||||
т1 | т2 | т3 | |||||
1 2 3 4 | 0,7 0,4 0,3 0,3 | 0,49 0,16 0,09 0,04 | 0,2 - 0,4 - 0,2 - 0,8 | 0,04 0,16 0,04 0,64 | - 0,7 - 0,6 0,6 0,3 | 0,49 0,36 0,36 0,09 | |
Qj | 0,78 | 0,88 | 1,30 | ΣQj=2,96 | |||
Tj | 1,6 | - 1,2 | - 0,4 | ΣTj=0 | |||
Tj2 | 2,56 | 1,44 | 1,69 | ΣTj2=5,69 |
Выполняем расчёт следующих параметров:
*Общая сумма квадратов отклонений:
* Факторная сумма квадратов отклонений:
* Остаточная сумма квадратов отклонений:
.
* Факторная дисперсия:
* Остаточная дисперсия:
Сравнение факторной и остаточной дисперсии с помощью критерия Фишера:
.
По таблице значений критерия Фишера (приложение 2) при числе степеней свободы числителя f1 = 2, а знаменателя f2 = 9 находим F (0,95; 2; 9) = 4,26.
Так как , то нет оснований отвергать нулевую гипотезу и, соответственно, различие между групповыми средними незначимо. То есть, все группы наблюдений извлечены из одной генеральной совокупности.
Двухфакторный дисперсионный анализ
При увеличении числа факторов, влияющих на результаты исследования, процедура дисперсионного анализа принципиально не меняется, однако расчеты усложняются.
Задача двухфакторного дисперсионного анализа (двухступенчатой классификации, кросс-классификации) связана с экспериментом, в котором одновременно действуют два фактора А и В, которые варьируют в к и т уровнях, соответственно.
Оценку воспроизводимости результатов исследований с помощью двухфакторного дисперсионного анализа рассмотрим на примере.
Пример 7.8. Исследовались три реагентных режима флотационного процесса (фактор А) для четырёх проб полезного ископаемого (фактор В). На каждой пробе при различных режимах было проведено по два опыта. Необходимо оценить влияние этих факторов на изменение извлечение полезного компонента в концентрат. Результаты исследований приведены в расчётной табл. 7.9.
Таблица 7.9 - Результаты опробования и расчёта
№ режима (фактор А) | № пробы полезного ископаемого (фактор В) | ХА | ХВ | |||
1 | 2 | 3 | 4 | |||
1 | 2 2 | 3 4 | 2 3 | 4 2 | ||
Х11 = 4 | Х12 = 7 | Х13 = 5 | Х14 = 6 | 22 | 484 | |
2 | 1 2 | 0 - 1 | 1 1 | - 1 - 1 | ||
Х21 = 3 | Х22 = - 1 | Х23 = 2 | Х24 = - 2 | 2 | 4 | |
3 | 3 2 | 6 5 | - 2 1 | 1 2 | ||
Х31 = 5 | Х32 = 7 | Х33 = - 1 | Х14 = 3 | 18 | 324 | |
ХВ | 12 | 17 | 6 | 7 | 42 | 1764 |
ХВ2 | 144 | 289 | 36 | 49 | 518 | 300/160 |
Расчёт проводится по формулам, приведенным в табл.
7.10.Таблица 7.10 - Расчётные формулы
Рассеивание | Сумма квадратов | Число степеней свободы | Дисперсия |
Между столбцами А | |||
Между строчками В | |||
Взаимодействие факторов АВ | |||
Воспроизво-димость | |||
Сумма |
ХА - сумма всех значений сроки А; ХВ - сумма всех значений столбца В; Х - сумма всех значений таблицы; п - число значений в каждой клетке.
С использованием формул табл. 7.10 выполняем расчёт следующих параметров:
* Средние арифметические:
;
;
;
;
.
* Сумма квадратов, характеризующая рассеяние отдельных наблюдений под влиянием:
- фактора А:
;
- фактора В:
;
- случайных погрешностей:
;
- взаимодействия факторов:
*Число степеней свободы:
*Средневзвешенные выборочные дисперсии:
* Оценка значимости факторов А, В и АВ по величине рассчитанного критерия Фишера:
.
Сравниваем расчётные и табличные значения критерия Фишера и делаем выводы о значимости исследуемых факторов на флотационный процесс.
Результаты дисперсионного анализа приведены в табл. 7.11.
Таблица 7.11 - Результаты дисперсионного анализа
Расхождение | S2 | f | Fp | F99 | |
По реагентным режимам (А) По качеству проб руды (В) По взаимодействию (АВ) Случайное Полное | 28,00 12,83 36,50 10,00 87,33 | 2 3 6 12 | 14,00 4,28 6,10 0,83 | 16,87 3,55 7,35 | 6,93 5,95 4,82 |
Сравнение расчётных значений критерия Фишера (Fp) и табличного (F99) показывает, что влияние фактора А и взаимодействия факторов АВ значимо (Fp> F99), фактора В - незначимо (Fp