Test Chi Square w programie Excel

Test chi-kwadrat w programie Excel

Test Chi-kwadrat w programie Excel jest najczęściej stosowanym testem nieparametrycznym używanym do porównywania dwóch lub więcej zmiennych dla losowo wybranych danych. Jest to rodzaj testu, który służy do ustalenia związku między dwiema lub więcej zmiennymi, jest używany w statystykach, które są również znane jako wartość P Chi-kwadrat, w programie Excel nie mamy wbudowanej funkcji, ale możemy użyć wzory do wykonania testu chi-kwadrat w programie Excel przy użyciu wzoru matematycznego dla testu chi-kwadrat.

Rodzaje

  1. Test chi-kwadrat dla dobroci dopasowania
  2. Test Chi-kwadrat niezależności dwóch zmiennych.

# 1 - Test chi-kwadrat pod kątem dopasowania

Służy do postrzegania bliskości próbki, która pasuje do populacji. Symbolem testu Chi-kwadrat jest (2). Jest to suma wszystkich ( Obserwowana liczba - Oczekiwana liczba) 2 / Oczekiwana liczba.

  • gdzie k-1 stopni swobody lub DF.
  • Gdzie Oi to obserwowana częstotliwość, k to kategorie, a Ei to oczekiwana częstotliwość.

Uwaga: - Dobroć dopasowania modelu statystycznego odnosi się do zrozumienia, jak dobrze dane próbki pasują do zbioru obserwacji.

Używa

  • Zdolność kredytowa kredytobiorców na podstawie ich grup wiekowych i kredytów osobistych
  • Związek pomiędzy wynikami handlowców a otrzymanymi szkoleniami
  • Zwrot z pojedynczych akcji i akcji z sektora, takiego jak farmaceutyczny czy bankowy
  • Kategoria widzów i wpływ kampanii telewizyjnej.

# 2 - Test Chi-kwadrat niezależności dwóch zmiennych

Służy do sprawdzania, czy zmienne są względem siebie niezależne, czy nie. Ze (r-1) (c-1) stopniami swobody

Gdzie Oi to obserwowana częstotliwość, r to liczba wierszy, c to liczba kolumn, a Ei to oczekiwana częstotliwość

Uwaga: - Dwie zmienne losowe nazywane są niezależnymi, jeśli na rozkład prawdopodobieństwa jednej zmiennej nie ma wpływu druga.

Używa

Test niezależności jest odpowiedni w następujących sytuacjach:

  • Jest jedna zmienna kategorialna.
  • Istnieją dwie zmienne kategorialne i będziesz musiał określić związek między nimi.
  • Istnieją tabele krzyżowe i należy znaleźć relację między dwiema zmiennymi kategorialnymi.
  • Istnieją zmienne niewymierne (na przykład odpowiedzi na pytania typu, czy pracownicy w różnych grupach wiekowych wybierają różne rodzaje planów zdrowotnych?)

Jak wykonać test Chi-kwadrat w programie Excel? (z przykładem)

Możesz pobrać ten szablon programu Excel Test Chi Square tutaj - Szablon programu Excel Test Chi Square

Kierownik restauracji chce znaleźć zależność między satysfakcją klientów a pensjami osób oczekujących na stoliki. W tym celu postawimy hipotezę, aby przetestować Chi-kwadrat

  • Bierze losową próbę 100 klientów i pyta, czy usługa była doskonała, dobra czy zła.
  • Następnie klasyfikuje pensje osób oczekujących na niskie, średnie i wysokie.
  • Załóżmy, że poziom istotności wynosi 0,05. Tutaj H0 i H1 oznaczają niezależność i zależność jakości obsługi od wynagrodzeń kelnerów.
  • H 0 - jakość usług nie jest uzależniona od zarobków osób oczekujących na stoliki.
  • H 1 - jakość usług uzależniona jest od wynagrodzeń osób oczekujących na stoliki
  • Jej ustalenia przedstawiono w poniższej tabeli:

W tym mamy 9 punktów danych, mamy 3 grupy, z których każda otrzymała inny komunikat o wynagrodzeniu, a wynik podano poniżej.

Teraz policzymy sumę wszystkich wierszy i kolumn. Zrobimy to za pomocą wzoru, czyli SUMA. Aby zsumować ocenę doskonałą w kolumnie sum, napisaliśmy = SUMA (B4: D4), a następnie naciśnij klawisz Enter.

To da nam 26 . Zrobimy to samo ze wszystkimi wierszami i kolumnami.

Aby obliczyć stopień swobody (DF) , używamy (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Istnieją 3 kategorie usług i 3 kategorie wynagrodzenia
  • Mamy 27 respondentów ze średnią pensją (dolny rząd, środek)
  • Mamy 51 respondentów z dobrą obsługą (ostatnia kolumna, środkowa)

Teraz musimy obliczyć oczekiwane częstotliwości: -

Oczekiwane częstotliwości można obliczyć za pomocą wzoru: -

  • Aby obliczyć ocenę doskonałą , pomnożymy sumę wartości niskiej przez sumę ocen doskonałą podzieloną przez N.

Załóżmy, że musimy obliczyć dla pierwszego wiersza i pierwszej kolumny (= B7 * E4 / B9 ) . Daje to oczekiwaną liczbę klientów, którzy głosowali na Doskonała obsługa za pensje osób oczekujących na tak niskie, jak 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Podobnie dla wszystkich musimy zrobić to samo i wzór jest zastosowany na poniższym diagramie.

Otrzymujemy tabelę oczekiwanej częstotliwości, jak podano poniżej: -

Uwaga: - Załóżmy, że poziom istotności wynosi 0,05. Tutaj H0 i H1 oznaczają niezależność i zależność jakości obsługi od wynagrodzeń kelnerów.

Po obliczeniu oczekiwanej częstotliwości obliczymy punkty danych chi-kwadrat przy użyciu wzoru

Punkty Chi-kwadrat = (obserwowane - oczekiwane) ^ 2 / oczekiwane

Aby obliczyć pierwszy punkt, piszemy = (B4-B14) ^ 2 / B14. 

Skopiujemy i wkleimy formułę do innych komórek, aby automatycznie wypełnić wartość.

Następnie obliczymy wartość chi (wartość obliczona) , dodając wszystkie wartości podane powyżej tabeli

Otrzymaliśmy wartość Chi jako 18,65823 .

Aby obliczyć wartość krytyczną dla tego, używamy tabeli wartości krytycznych chi-kwadrat, w której możemy użyć wzoru podanego poniżej.

Ta formuła zawiera 2 parametry CHISQ.INV.RT (prawdopodobieństwo, stopień swobody).

Prawdopodobieństwo wynosi 0,05, jest to znacząca wartość, która pomoże nam określić, czy zaakceptować hipotezę zerową (H 0 ), czy nie.

Krytyczna wartość chi-kwadrat wynosi 9,487729037.

Teraz znajdziemy wartość chi-kwadrat lub (wartość P) = CHITEST (zakres_aktualny, zakres_ oczekiwany)

Zakres od = CHITEST (B4: D6, B14: D16) .

Jak widzieliśmy, wartość testu chi lub wartości P wynosi = 0,00091723.

Jak widzieliśmy, obliczyliśmy wszystkie wartości. Wartości chi-kwadrat (wartość obliczona) są istotne tylko wtedy, gdy ich wartość jest taka sama lub większa niż wartość krytyczna 9,48, tj. Wartość krytyczna (wartość tabelaryczna) musi być wyższa niż 18,65, aby zaakceptować hipotezę zerową (H 0 ) .

Ale tutaj Wartość obliczona > Wartość tabelaryczna

X2 (obliczone)> X2 (tabelaryczne)

18,65> 9,48

W takim przypadku odrzucimy hipotezę zerową (H 0 ), a alternatywna (H 1 ) zostanie zaakceptowana.

  • Możemy również użyć wartości P, aby przewidzieć to samo, tj. Jeśli wartość P <= α (wartość istotna 0,05), hipoteza zerowa zostanie odrzucona
  • Jeśli wartość P> α , nie odrzucaj  hipotezy zerowej .

Tutaj wartość p (0,0009172) < α (0,05), odrzuć H 0 , zaakceptuj H 1

Z powyższego przykładu wnioskujemy, że jakość usług zależy od pensji osób oczekujących.

Rzeczy do zapamiętania

  • Uwzględnia kwadrat standardowej zmiennej normalnej.
  • Ocenia, czy częstotliwości obserwowane w różnych kategoriach różnią się znacznie od częstotliwości oczekiwanych przy określonym zestawie założeń.
  • Określa, jak dobrze przyjęty rozkład pasuje do danych.
  • Używa tabel awaryjnych (w badaniach rynku tabele te nazywane są kartami krzyżowymi).
  • Obsługuje pomiary poziomu nominalnego.