Wzór R do kwadratu

Co to jest R do kwadratu (R2) w regresji?

R-kwadrat (R2) jest ważną miarą statystyczną, która jest modelem regresji, który reprezentuje proporcję różnicy lub wariancji w kategoriach statystycznych dla zmiennej zależnej, którą można wyjaśnić za pomocą zmiennej lub zmiennych niezależnych. Krótko mówiąc, określa, jak dobrze dane będą pasować do modelu regresji.

Wzór R do kwadratu

Aby obliczyć R do kwadratu, musisz określić współczynnik korelacji, a następnie obliczyć wynik do kwadratu.

Wzór R do kwadratu = r2

Gdzie r współczynnik korelacji można obliczyć w następujący sposób:

Gdzie,

  • r = współczynnik korelacji
  • n = liczba w danym zbiorze danych
  • x = pierwsza zmienna w kontekście
  • y = druga zmienna

Wyjaśnienie

Jeżeli istnieje jakakolwiek zależność lub korelacja, która może być liniowa lub nieliniowa między tymi dwiema zmiennymi, wówczas należy wskazać, czy nastąpiła zmiana wartości zmiennej niezależnej, wówczas druga zmienna zależna prawdopodobnie zmieni wartość, powiedzmy liniowo lub nie liniowo.

Część wzoru stanowiąca licznik przeprowadza test, czy poruszają się razem i usuwa ich indywidualne ruchy oraz względną siłę obu poruszających się razem, a część będąca mianownikiem skaluje licznik, biorąc pierwiastek kwadratowy z iloczynu różnic zmienne z ich kwadratów zmiennych. A kiedy podniesiesz ten wynik do kwadratu, otrzymamy R do kwadratu, które jest niczym innym jak współczynnikiem determinacji.

Przykłady

Możesz pobrać ten szablon programu Excel z formułą R-kwadrat - szablon programu Excel z formułą R-kwadrat

Przykład 1

Rozważ następujące dwie zmienne x i y, musisz obliczyć R kwadrat w regresji.

Rozwiązanie:

Korzystając z powyższego wzoru, musimy najpierw obliczyć współczynnik korelacji.

W powyższej tabeli mamy wszystkie wartości z n = 4.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ [(4 * 21 274,94) - (326,89) 2] * [(4 * 31 901,89) - (326,89) 2]

r = 17501,06 / 17,512,88

Współczynnik korelacji będzie:

r = 0,99932480

Tak więc obliczenia będą następujące:

r2 = (0,99932480) 2

Formuła R do kwadratu w regresji

r2 = 0,998650052

Przykład nr 2

Indie kraj rozwijający się chce przeprowadzić niezależną analizę, czy zmiany cen ropy naftowej wpłynęły na jej wartość w rupiach. Poniżej przedstawiono historię wyceny ropy naftowej Brent i wyceny w rupiach, zarówno w stosunku do dolarów, które przeważały średnio w tych latach w przeliczeniu na poniżej.

RBI, centralny bank Indii, zwrócił się do Państwa z prośbą o przedstawienie prezentacji na ten temat podczas następnego spotkania. Określić, czy zmiany cen ropy wpływają na zmiany kursu rupii za dolara?

Rozwiązanie:

Korzystając z powyższego wzoru na korelację, możemy najpierw obliczyć współczynnik korelacji. Traktując średnią cenę ropy naftowej jako jedną zmienną, powiedzmy x, a rupię za dolara jako inną zmienną jako y.

W powyższej tabeli mamy wszystkie wartości z n = 6.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (6 * 23592,83) - (356,70 * 398,59) / √ [(6 * 22829,36) - (356,70) 2] * [(6 * 26529,38) - (398,59) 2]

r = -620,06 / 1715,95

Współczynnik korelacji będzie:

r = -0,3614

Tak więc obliczenia będą następujące:

r2 = (-0,3614) 2

Formuła R do kwadratu w regresji

r2 = 0,1306

Analiza: Wydaje się, że istnieje niewielka zależność między zmianami cen ropy naftowej a zmianami ceny rupii indyjskiej. Wraz ze wzrostem ceny ropy naftowej wpływają również zmiany w rupii indyjskiej. Ale ponieważ R do kwadratu wynosi tylko 13%, to zmiany ceny ropy naftowej w bardzo mniejszym stopniu wyjaśniają zmiany w rupii indyjskiej, a rupia indyjska podlega również zmianom innych zmiennych, które należy uwzględnić.

Przykład nr 3

Laboratorium XYZ prowadzi badania nad wzrostem i wagą i chce wiedzieć, czy istnieje jakikolwiek związek między tymi zmiennymi. Po zebraniu próby 5000 osób z każdej kategorii i ustaleniu średniej wagi i średniego wzrostu w tej grupie.

Poniżej znajdują się szczegóły, które zebrali.

Musisz obliczyć R do kwadratu i stwierdzić, czy ten model wyjaśnia, że ​​odchylenia wysokości wpływają na odchylenia masy.

Rozwiązanie:

Korzystając z powyższego wzoru na korelację, możemy najpierw obliczyć współczynnik korelacji. Traktując wzrost jako jedną zmienną, mówimy x, a wagę jako inną zmienną jako y.

W powyższej tabeli mamy wszystkie wartości z n = 6.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (7 * 74058,67) - (1031 * 496,44) / √ [(7 * 153595 - (1031) 2] * [(7 * 35793,59) - (496,44) 2]

r = 6 581,05 / 7 075,77

Współczynnik korelacji będzie:

Współczynnik korelacji (r) = 0,930

Tak więc obliczenia będą następujące:

r2 = 0,865

Analiza: Korelacja jest dodatnia i wydaje się, że istnieje pewien związek między wzrostem a wagą, ponieważ wzrost zwiększa się, waga osoby również wydaje się zwiększać. Podczas gdy R2 sugeruje, że 86% zmian w wysokości przypisuje się zmianom masy ciała, a 14% jest niewyjaśnionych.

Trafność i zastosowania

Trafność R do kwadratu w regresji to zdolność do znalezienia prawdopodobieństwa wystąpienia przyszłych zdarzeń w ramach danych przewidywanych wyników lub wyników. Jeśli do modelu zostanie dodanych więcej próbek, współczynnik pokaże prawdopodobieństwo lub prawdopodobieństwo pojawienia się nowego punktu lub nowego zbioru danych na linii. Nawet jeśli obie zmienne mają silny związek, ustalenie nie dowodzi przyczynowości.

Niektóre obszary, w których najczęściej używa się R do kwadratu, służą do śledzenia wyników funduszy powierniczych, śledzenia ryzyka w funduszach hedgingowych, w celu określenia, jak dobrze akcje poruszają się na rynku, gdzie R2 sugerowałby, ile ruchów na giełdzie można wyjaśnić przez ruchy na rynku.