7.2.2 Статистические критерии различия
В ходе исследований, особенно промышленных, накапливается значительный объем экспериментального материала в виде показателей обогащения, характеристик полезного ископаемого и т.д., которые соответствуют одинаковым или различным технологическим режимам, конструкциям аппаратов и типам полезных ископаемых.
При этом возникают следующие вопросы:- однородны ли показатели обогащения, полученные при различных режимах или конструкциях аппаратов, или эти выборки относятся к различным статистическим совокупностям;
- одинаково ли стабильны результаты, полученные при различных режимах, или в каком-то случае показатели менее стабильны и разброс данных больший;
- относится ли та или иная проба полезного ископаемого или результат к данной статистической совокупности;
- соответствует ли данное эмпирическое распределение тому или иному теоретическому распределению;
- адекватна ли выбранная математическая модель экспериментальным данным.
Эти вопросы решаются проверкой статистической гипотезы о принадлежности всех полученных данных к одной генеральной совокупности. Общий подход заключается в проверке нулевой гипотезы Н0 об отсутствии реального различия между экспериментальными результатами, разброс которых объясняется случайными факторами, обусловливающими ошибку воспроизводимости [3, 5, 11-14].
Нулевой гипотезой (Н0) называется выдвинутая гипотеза, отклонения от которой считаются случайными, противоположная ей гипотеза (Н1) - альтернативной или конкурирующей.
Критерий проверки гипотезы позволяет выявить по результатам опытов, верна или неверна данная гипотеза. Критерий составляется на основе статистики Qn = Qn (x1, x2, ..., xn), распределение которой известно (нормальное, t, F или χ2). Критерий разделяет множество возможных значений статистики на область принятия гипотезы и область её неприятия (критическую).
В случае попадания статистики в область неприятия гипотезы Н0 она отвергается. Возможны такие случаи:- гипотеза Н0 верна и принимается в соответствии с критерием;
- гипотеза Н0 неверна и отвергается в соответствии с критерием;
- гипотеза Н0 верна, но её отвергают в соответствии с критерием (ошибка первого рода);
- гипотеза Н0 неверна, но её принимают (ошибка второго рода).
Справедливость нулевой гипотезы проверяется расчётом вероятности того, что из-за случайности выборки различия могут достичь фактически наблюдаемой величины; если эта вероятность окажется очень маленькой, то нулевая гипотеза отвергается (т.е. маловероятно, что различия вызывается случайными величинами, а не реальными расхождениями). Вероятность Р, которую принимают за основу при статистической гипотезе, определяет уровень значимости.
По результатам, полученным для двух выборок, рассчитывают значение некоторой контрольной величины λ и определяют область Λ, внутри которой следует ожидать λ с определённой вероятностью Р. Если контрольная величина λ лежит вне области Λ, то выбранная гипотеза отвергается, различие между полученными величинами считается статистически значимым. Если контрольная величина λ лежит в области Λ, то выбранная гипотеза принимается. Вопрос отбросить или принять статистическую гипотезу решают на основе выборочных измерений, поэтому следует оценить возможность ошибки. Если, например, с вероятностью Р отвергают гипотезу о то, что два средних значения х1 и х2 принадлежат к одной и той же генеральной совокупности, то из этого можно сделать вывод о различии этих значений. Вероятность того, что оба средних значения относятся одной и той же генеральной совокупности, будет α = 1 - Р.
Обычно задают вероятность ошибки первого рода α, которую называют уровнем значимости, ошибка второго рода определяется вероятностью 1 - β, где β - вероятность того, что ошибка не будет допущена. Это - мощность критерия. Уровень значимости α принимают равным 0,05; 0,1; 0,01 или 0,005. Выбор доверительной вероятности Р определяется конкретными задачами исследования. При этом следует учитывать, что с уменьшением α возрастает вероятность ошибки второго рода.
При принятии или отбрасывании гипотезы используют три правила:
- проверяемая гипотеза отбрасывается, если ошибка первого рода может появиться в менее чем 100α = 1% всех случаев, то есть Р ≥ 0,99. Тогда рассмотренная разница является значимой;
- проверяемая гипотеза принимается, если ошибка первого рода может появиться в более чем 100α = 5% всех случаев, то есть Р ≤ 0,95. Тогда рассмотренная разница является незначимой;
- отвергаемую гипотезу следует дополнительно обсудить, если число возможных ошибок первого рода лежит в интервале между 5 и 1% (0,95