Содержание
Несоответствие - это значение в наборе данных, которое далеко от других значений. Расхождения могут быть вызваны экспериментальными ошибками или ошибками измерений. В первых случаях может быть желательно выявить выбросы и удалить их из других данных перед выполнением статистического анализа, чтобы не повлиять на результаты, поскольку они не точно представляют совокупность выборки. Самый простой способ определить расхождения - это метод квартилей.
Шаг 1
Перечислите данные в порядке возрастания. Рассмотрим набор данных {4, 5, 2, 3, 15, 3, 3, 5}. Упорядоченный пример набора данных: {2, 3, 3, 3, 4, 5, 5, 15}.
Шаг 2
Найдите медиану. Это центральное число, которое отделяет большую половину от второстепенной. Если имеется четное количество данных, следует рассчитать среднее из двух. Например: в процитированном наборе данных средние точки - 3 и 4, поэтому медиана составляет (3 + 4) / 2 = 3,5.
Шаг 3
Найдите верхний квартиль, Q2, точку данных, которая делит группу между 75% наименьших и 25% наибольших. Если набор данных четный, усредните две точки вокруг квартиля. В предыдущем примере: (5 + 5) / 2 = 5.
Шаг 4
Найдите самый низкий квартиль, Q1, точку данных, которая отделяет самые маленькие 25% от самых больших 75%. Если набор данных четный, усредните две точки вокруг квартиля. В примере: (3 + 3) / 2 = 3.
Шаг 5
Вычтите нижний квартиль из верхнего квартиля, чтобы получить межквартильный размах, IQ. В примере: Q2 - Q1 = 5 - 3 = 2.
Шаг 6
Умножьте межквартильный размах на 1,5. Добавьте к результату верхний квартиль и вычтите нижний квартиль. Любая точка данных за пределами этих значений - небольшое расхождение. Для приведенного примера: 1,5 x 2 = 3. 3 - 3 = 0 и 5 +3 = 8. Таким образом, любое значение меньше 0 или больше 8 будет небольшим несоответствием. Это означает, что 15 считается незначительным несоответствием.
Шаг 7
Умножьте межквартильный размах на 3. Добавьте к верхнему квартилю и вычтите нижний квартиль. Любая точка данных за пределами этих значений является крайним несоответствием. В данном примере 3 x 2 = 6. 3-6 = -3 и 5 + 6 = 11. Таким образом, любое значение меньше -3 или больше 11 является крайним несоответствием. Это означает, что 15 квалифицируется как крайнее несоответствие.