Współczynnik korelacji Pearsona

Definicja współczynnika korelacji Pearsona

Współczynnik korelacji Pearsona, znany również jako test statystyczny R Pearsona, mierzy siłę między różnymi zmiennymi i ich zależności. Ilekroć przeprowadzany jest test statystyczny między dwiema zmiennymi, zawsze dobrym pomysłem jest, aby osoba przeprowadzająca analizę obliczyła wartość współczynnika korelacji, aby wiedzieć, jak silna jest zależność między dwiema zmiennymi.

Współczynnik korelacji Pearsona zwraca wartość z przedziału od -1 do 1. Interpretacja współczynnika korelacji jest następująca:

  • Jeśli współczynnik korelacji wynosi -1, oznacza to silną negatywną zależność. Wskazuje na doskonały negatywny związek między zmiennymi.
  • Jeśli współczynnik korelacji wynosi 0, oznacza to brak związku.
  • Jeśli współczynnik korelacji wynosi 1, oznacza to silną pozytywną zależność. Oznacza to doskonały pozytywny związek między zmiennymi.

Wyższa wartość bezwzględna współczynnika korelacji wskazuje na silniejszy związek między zmiennymi. Zatem współczynnik korelacji 0,78 wskazuje na silniejszą dodatnią korelację w porównaniu z wartością, powiedzmy 0,36. Podobnie, współczynnik korelacji wynoszący -0,87 wskazuje na silniejszą korelację ujemną w porównaniu ze współczynnikiem korelacji wynoszącym powiedzmy -0,40.

Innymi słowy, jeśli wartość znajduje się w dodatnim zakresie, to pokazuje, że związek między zmiennymi jest dodatnio skorelowany, a obie wartości razem maleją lub zwiększają. Z drugiej strony, jeśli wartość jest w zakresie ujemnym, to pokazuje, że związek między zmiennymi jest skorelowany ujemnie i obie wartości będą zmierzać w przeciwnym kierunku.

Wzór na współczynnik korelacji Pearsona

Wzór na współczynnik korelacji Pearsona jest następujący:

Gdzie,

  • r = współczynnik Pearsona
  • n = liczba par w magazynie
  • ∑xy = suma produktów par akcji
  • ∑x = suma x wyników
  • ∑y = suma wyników y
  • ∑x2 = suma kwadratów x wyników
  • ∑y2 = suma kwadratów y wyników

Wyjaśnienie

Krok 1: Znajdź liczbę par zmiennych, które są oznaczone przez n. Załóżmy, że x składa się z 3 zmiennych - 6, 8, 10. Załóżmy, że y składa się z odpowiadających im 3 zmiennych 12, 10, 20.

Krok 2: Wypisz zmienne w dwóch kolumnach.

Krok 3: Znajdź iloczyn x i y w trzeciej kolumnie.

Krok 4: Znajdź sumę wartości wszystkich zmiennych x i wszystkich zmiennych y. Zapisz wyniki na dole pierwszej i drugiej kolumny. Napisz sumę x * y w trzeciej kolumnie.

Krok 5: Znajdź x2 i y2 w czwartej i piątej kolumnie oraz ich sumę na dole kolumn.

Krok 6: Wprowadź wartości znalezione powyżej do wzoru i rozwiąż go.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Przykład współczynnika korelacji Pearsona R.

Możesz pobrać ten szablon programu Excel dotyczący współczynnika korelacji Pearsona tutaj - Szablon programu Excel dotyczący współczynnika korelacji Pearsona

Przykład 1

W tym przykładzie z pomocą następujących szczegółów w tabeli 6 osób w różnym wieku i różnych wagach podanych poniżej do obliczenia wartości współczynnika R Pearsona

Rozwiązanie:

W celu obliczenia współczynnika korelacji Pearsona najpierw obliczymy następujące wartości:

Tutaj całkowita liczba osób wynosi 6, więc n = 6

Teraz obliczenia Pearsona R są następujące:

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622–82618) / (√ [43680–40804] * [170190–167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Zatem wartość współczynnika korelacji Pearsona wynosi 0,35

Przykład nr 2

Istnieją 2 akcje - A i B. Ich ceny akcji w poszczególnych dniach kształtują się następująco:

Znajdź współczynnik korelacji Pearsona na podstawie powyższych danych.

Rozwiązanie:

Najpierw obliczymy następujące wartości.

Obliczenie współczynnika Pearsona jest następujące:

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Dlatego współczynnik korelacji Pearsona między dwoma akcjami wynosi -0,9088.

Zalety

  • Pomaga wiedzieć, jak silna jest zależność między dwiema zmiennymi. Nie tylko obecność lub brak korelacji między dwiema zmiennymi jest wskazywana za pomocą współczynnika korelacji Pearsona, ale także określa dokładny zakres, w jakim te zmienne są skorelowane.
  • Przy pomocy tej metody można ustalić kierunek korelacji, czyli czy korelacja między dwiema zmiennymi jest ujemna czy dodatnia.

Niedogodności

  • Współczynnik korelacji Pearsona R nie jest wystarczający do określenia różnicy między zmiennymi zależnymi a zmiennymi niezależnymi, ponieważ współczynnik korelacji między zmiennymi jest symetryczny. Na przykład, jeśli ktoś próbuje poznać korelację między wysokim stresem a ciśnieniem krwi, można znaleźć wysoką wartość korelacji, która pokazuje, że wysoki stres powoduje ciśnienie krwi. Teraz, jeśli zmienna zostanie zmieniona, wynik w tym przypadku będzie również taki sam, co pokazuje, że stres jest spowodowany ciśnieniem krwi, które nie ma sensu. Dlatego badacz powinien być świadomy danych, które wykorzystuje do przeprowadzenia analizy.
  • Za pomocą tej metody nie można uzyskać informacji o nachyleniu prostej, ponieważ określa ona jedynie, czy istnieje jakakolwiek zależność między dwiema zmiennymi, czy nie.
  • Jest prawdopodobne, że współczynnik korelacji Pearsona może zostać błędnie zinterpretowany, zwłaszcza w przypadku danych jednorodnych.
  • W porównaniu z innymi metodami obliczeń, uzyskanie wyników przy tej metodzie zajmuje dużo czasu.

Ważne punkty

  • Wartości mogą wahać się od wartości +1 do wartości -1, gdzie +1 wskazuje na idealną pozytywną zależność między rozważanymi zmiennymi, -1 wskazuje na doskonały związek ujemny między rozważanymi zmiennymi, a wartość 0 wskazuje, że brak związku istnieje między rozważanymi zmiennymi.
  • Jest niezależna od jednostki miary zmiennych. Na przykład, jeśli jednostką miary jednej zmiennej są lata, a drugiej - kilogramy, to nawet wtedy wartość tego współczynnika się nie zmienia.
  • Współczynnik korelacji między zmiennymi jest symetryczny, co oznacza, że ​​wartość współczynnika korelacji między Y a X lub X i Y pozostanie taka sama.

Wniosek

Współczynnik korelacji Pearsona to typ współczynnika korelacji, który reprezentuje związek między dwiema zmiennymi mierzonymi w tym samym przedziale lub w tej samej skali współczynnika. Mierzy siłę związku między dwiema zmiennymi ciągłymi.

Nie tylko stwierdza obecność lub brak korelacji między dwiema zmiennymi, ale także określa dokładny zakres, w jakim te zmienne są skorelowane. Jest niezależna od jednostki miary zmiennych, w przypadku których wartości współczynnika korelacji mogą zawierać się w zakresie od wartości +1 do wartości -1. Jednak nie wystarczy wskazać różnicę między zmiennymi zależnymi a zmiennymi niezależnymi.