Regresja a ANOVA

Różnica między regresją a ANOVA

Regresja i ANOVA są modelami statystycznymi, które są używane do przewidywania ciągłego wyniku, ale w przypadku regresji, ciągły wynik jest przewidywany na podstawie jednej lub więcej niż jednej ciągłej zmiennej predykcyjnej, podczas gdy w przypadku ANOVA ciągły wynik jest przewidywane na podstawie jednej lub więcej predyktorów jakościowych.

Regresja to statystyczna metoda ustalania relacji między zbiorami zmiennych w celu prognozowania zmiennej zależnej za pomocą zmiennych niezależnych, z drugiej strony ANOVA jest narzędziem statystycznym stosowanym na niepowiązanych grupach w celu ustalenia, czy mają wspólny środek.

Co to jest regresja?

Regresja jest bardzo skuteczną metodą statystyczną do ustalenia związku między zbiorami zmiennych. Zmienne, dla których przeprowadzana jest analiza regresji, to zmienna zależna i co najmniej jedna zmienna niezależna. Jest to metoda pozwalająca zrozumieć wpływ jednej lub więcej niż jednej zmiennej niezależnej na zmienną zależną.

  • Załóżmy na przykład, że firma produkująca farby używa jednego z pochodnych surowego rozpuszczalnika i monomerów jako surowca, możemy przeprowadzić analizę regresji między ceną tego surowca a ceną ropy Brent.
  • W tym przykładzie cena surowca jest zmienną zależną, a cena cen Brent jest zmienną niezależną.
  • Ponieważ ceny rozpuszczalników i monomerów rosną i maleją wraz ze wzrostem i spadkiem cen Brent, zmienną zależną jest cena surowca.
  • Podobnie w przypadku każdej decyzji biznesowej mającej na celu weryfikację hipotezy, że określone działanie doprowadzi do wzrostu rentowności dywizji, można zweryfikować na podstawie wyniku regresji między zmiennymi zależnymi i niezależnymi.

Co to jest Anova?

ANOVA to krótka forma analizy wariancji. ANOVA to narzędzie statystyczne, które jest zwykle używane do zmiennych losowych. Obejmuje grupę niezwiązaną bezpośrednio ze sobą, aby dowiedzieć się, czy istnieją jakieś wspólne środki.

  • Prostym przykładem, aby zrozumieć ten punkt, jest przeprowadzenie ANOVA dla serii ocen uczniów z różnych uczelni, aby spróbować dowiedzieć się, czy jeden uczeń z jednej szkoły jest lepszy od drugiego.
  • Innym przykładem może być sytuacja, gdy dwa odrębne zespoły badawcze badają różne produkty, które nie są ze sobą powiązane. ANOVA pomoże stwierdzić, który z nich zapewnia lepsze wyniki. Trzy popularne techniki ANOVA to efekt losowy, efekt stały i efekt mieszany.

Infografiki regresji a ANOVA

Kluczowe różnice między regresją a ANOVA

  • Regresja jest stosowana do zmiennych, które są w większości stałe lub niezależne z natury, a ANOVA jest stosowana do zmiennych losowych.
  • Regresja jest używana głównie w dwóch formach: regresja liniowa i regresja wielokrotna, chociaż w teorii występują również inne formy regresji, te typy są najczęściej używane w praktyce, z drugiej strony istnieją trzy popularne typy ANOVA, są one losowe efekt, efekt stały i efekt mieszany.
  • Regresja jest używana głównie w celu oszacowania lub przewidywania zmiennej zależnej za pomocą jednej lub wielu zmiennych niezależnych, a ANOVA służy do znalezienia wspólnej średniej między zmiennymi z różnych grup.
  • W przypadku regresji liczba składnika błędu wynosi jeden, ale w przypadku ANOVA liczba składnika błędu jest większa niż jeden.

Tabela porównawcza

PodstawaRegresjaANOVA
DefinicjaRegresja jest bardzo skuteczną metodą statystyczną do ustalenia związku między zbiorami zmiennych.ANOVA to krótka forma analizy wariancji. Stosuje się go do niepowiązanych grup, aby dowiedzieć się, czy mają wspólny środek
Charakter zmiennejRegresja jest stosowana do zmiennych niezależnych lub zmiennych stałych.ANOVA jest stosowana do zmiennych, które mają charakter losowy
RodzajeRegresja jest używana głównie w dwóch formach: regresji liniowej i regresji wielokrotnej, późniejsza, gdy liczba zmiennych niezależnych jest większa niż jedna.Trzy popularne typy ANOVA to efekt losowy, efekt stały i efekt mieszany.
PrzykładyFirma produkująca farby używa rozpuszczalników i monomerów jako surowca, który jest pochodną ropy naftowej; możemy przeprowadzić analizę regresji między ceną tego surowca a ceną ropy Brent.Jeśli dwa oddzielne zespoły badawcze badają różne produkty, które nie są ze sobą powiązane. ANOVA pomoże stwierdzić, który z nich zapewnia lepsze wyniki.
Używane zmienneRegresję stosuje się do dwóch zbiorów zmiennych, z których jeden jest zmienną zależną, a drugi zmienną niezależną. Liczba niezależnych zmiennych w regresji może wynosić co najmniej jedną.ANOVA jest stosowana do zmiennych z różnych, które niekoniecznie są ze sobą powiązane.
Korzystanie z testuRegresja jest stosowana głównie przez praktyków lub ekspertów branżowych do dokonywania szacunków lub prognoz dla zmiennej zależnej.ANOVA służy do znalezienia wspólnej średniej między zmiennymi z różnych grup.
BłędyPrzewidywania dokonane na podstawie analizy regresji nie zawsze są pożądane, ponieważ składnik błędu w regresji jest również znany jako rezydualny. W przypadku regresji liczba składnika błędu wynosi jeden.Liczba błędów w przypadku ANOVA, w przeciwieństwie do regresji, jest większa niż jeden.

Wniosek

Zarówno regresje, jak i ANOVA są potężnymi narzędziami statystycznymi, które są stosowane do wielu zmiennych. Regresja służy do prognozowania zmiennej zależnej za pomocą zmiennych niezależnych, które mają pewne relacje. Pomocne jest potwierdzenie hipotezy, czy postawiona hipoteza jest poprawna, czy nie.

Regresja jest stosowana do zmiennych, które mają charakter stały lub niezależny i można ją przeprowadzić przy użyciu jednej zmiennej niezależnej lub wielu zmiennych niezależnych. ANOVA służy do znajdowania wspólnych zmiennych z różnych grup, które nie są ze sobą powiązane. Nie jest używany do przewidywania lub szacowania, ale do zrozumienia relacji między zbiorem zmiennych.