Formuła wartości odstających

Formuła wartości odstających zapewnia narzędzie graficzne do obliczania danych, które znajdują się poza danym zestawem rozkładu, który może znajdować się po stronie wewnętrznej lub zewnętrznej w zależności od zmiennych.

Co to jest formuła wartości odstających?

Wartość odstająca to punkt danych dla danej próbki lub danej obserwacji lub w rozkładzie, który nie mieści się w ogólnym wzorze. Powszechnie stosowana reguła, która mówi, że punkt danych będzie uważany za wartość odstającą, jeśli ma więcej niż 1,5 IQR poniżej pierwszego kwartylu lub powyżej trzeciego kwartylu.

Mówiąc inaczej, niskie wartości odstające powinny leżeć poniżej Q1-1,5 IQR, a wysokie wartości odstające powinny leżeć w Q3 + 1,5 IQR

Należy obliczyć medianę, kwartyle, w tym IQR, Q1 i Q3.

Formuła wartości odstających jest przedstawiona w następujący sposób:

Wzór na Q1 = ¼ (n + 1) -ty człon Wzór na Q3 = ¾ (n + 1) -ty człon Wzór na Q2 = Q3 - Q1

Obliczanie wartości odstających krok po kroku

Aby obliczyć wartość odstającą, należy wykonać poniższe kroki.

  • Krok 1: Najpierw oblicz kwartyle, tj. Q1, Q2 i międzykwartyl
  • Krok 2: Teraz oblicz wartość Q2 * 1,5
  • Krok 3: Teraz odejmij wartość Q1 od wartości obliczonej w kroku 2
  • Krok 4: Tutaj Dodaj Q3 z wartością obliczoną w kroku 2
  • Krok 5: Utwórz zakres wartości obliczonych w Kroku 3 i Kroku 4
  • Krok 6: Ułóż dane w porządku rosnącym
  • Krok 7: Sprawdź, czy istnieją wartości, które znajdują się poniżej lub powyżej zakresu utworzonego w kroku 5

Przykład

Rozważ zbiór danych o następujących liczbach: 10, 2, 4, 7, 8, 5, 11, 3, 12. Musisz obliczyć wszystkie wartości odstające.

Rozwiązanie:

Najpierw musimy uporządkować dane w porządku rosnącym, aby znaleźć medianę, która będzie dla nas Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Ponieważ liczba obserwacji jest nieparzysta, czyli 9, mediana leżałaby na piątej pozycji, czyli 7 i tak samo będzie Q2 w tym przykładzie.

Dlatego obliczenie Q1 wygląda następująco -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 będzie - 

Q1 = 2,5 kadencji

Oznacza to, że Q1 jest średnią z drugiej i trzeciej pozycji obserwacji, która wynosi tutaj 3 i 4, a średnia z tych samych wynosi (3 + 4) / 2 = 3,5

Dlatego obliczenie Q3 wygląda następująco -

Q3 = ¾ (9 + 1)

= ¾ (10)

III kwartał będzie - 

Q3 = 7,5 termin

Oznacza to, że Q3 jest średnią z 7 i 8 pozycji obserwacji, która wynosi tutaj 10 i 11, a średnia z tych samych wynosi (10 + 11) / 2 = 10,5

Teraz niskie wartości odstające powinny leżeć poniżej Q1-1,5IQR, a wysokie wartości odstające powinny leżeć poniżej Q3 + 1,5IQR

Zatem wartości to 3,5 - (1,5 * 7) = -7, a wyższy zakres to 10,5 + (1,5 * 7) = 110,25.

Ponieważ nie ma obserwacji, które leżą powyżej lub poniżej 110,25 i -7, nie mamy żadnych wartości odstających w tej próbce.

Przykład formuły wartości odstających w programie Excel (z szablonem programu Excel)

Możesz pobrać ten szablon Excel dla formuł odstających - Szablon programu Excel z formułami odstającymi

Kreatywne zajęcia coachingowe rozważają nagradzanie uczniów, którzy znajdują się w najlepszych 25%. Chcą jednak uniknąć wszelkich wartości odstających. Dane dotyczą 25 uczniów. Użyj równania wartości odstającej, aby określić, czy istnieje wartość odstająca?

Rozwiązanie:

Poniżej podano dane do obliczenia wartości odstającej

Liczba obserwacji wynosi tutaj 25, a naszym pierwszym krokiem byłoby przekonwertowanie powyższych surowych danych w porządku rosnącym.

Mediana wyniesie -

Mediana = ½ (n + 1)

= ½ = ½ (26)

= 13. kadencja

Q2 lub mediana to 68,00

To jest 50% populacji.

Q1 będzie -

Q1 = ¼ (n + 1). Termin

= ¼ (25 + 1)

= ¼ (26)

= 6,5-ty termin, co odpowiada 7-memu terminowi

Q1 to 56,00, czyli najniższe 25%

III kwartał będzie -

Wreszcie, Q3 = ¾ (n + 1)

= ¾ (26)

= 19,50 termin

Tutaj należy wziąć średnią, która składa się z 19 i 20 członów, które są 77 i 77, a średnia z tych samych wynosi (77 + 77) / 2 = 77,00

 Trzeci kwartał to 77, czyli najlepsze 25%

Niski zasięg

Teraz niskie wartości odstające powinny leżeć poniżej Q1-1,5IQR, a wysokie wartości odstające powinny leżeć poniżej Q3 + 1,5IQR

Wysoka ranga -

Zatem wartości to 56 - (1,5 * 68) = -46, a wyższy zakres to 77 + (1,5 * 68) = 179.

Nie ma wartości odstających.

Trafność i zastosowania

Formuła wartości odstających jest bardzo ważna, ponieważ mogą istnieć dane, które zostałyby wypaczone przez taką wartość. Weźmy na przykład obserwacje 2, 4, 6, 101 i teraz, jeśli ktoś przyjmie średnią z tych wartości, będzie to 28,25, ale 75% obserwacji znajduje się poniżej 7, a zatem byłaby to błędna decyzja dotycząca obserwacji tej próbki.

Można tu zauważyć, że 101 wyraźnie wydaje się zarysować i jeśli to zostanie usunięte, wówczas średnia wyniosłaby 4, co mówi o wartościach lub obserwacjach, że mieszczą się one w przedziale 4. Dlatego bardzo ważne jest, aby przeprowadzić te obliczenia, aby uniknąć wszelkie niewłaściwe wykorzystanie wiodących informacji dotyczących danych. Są one szeroko stosowane przez statystyków na całym świecie podczas prowadzenia jakichkolwiek badań.