Formuła normalizacji

Co to jest formuła normalizacji?

W statystyce termin „normalizacja” odnosi się do zmniejszenia zbioru danych w taki sposób, że znormalizowane dane mieszczą się w zakresie od 0 do 1. Takie techniki normalizacji pomagają w porównywaniu odpowiednich znormalizowanych wartości z dwóch lub więcej różnych zestawów danych w sposób że eliminuje skutki zmienności skali zbiorów danych, tj. zbiór danych o dużych wartościach można łatwo porównać ze zbiorem danych o mniejszych wartościach.

Równanie normalizacji wyprowadza się początkowo odejmując wartość minimalną od zmiennej, która ma być normalizowana, następnie wartość minimalną odejmuje się od wartości maksymalnej, a następnie poprzedni wynik jest dzielony przez drugą.

Matematycznie równanie normalizacji jest reprezentowane jako:

x znormalizowane = ( x - x minimum ) / ( x maksimum - x minimum )

Wyjaśnienie wzoru normalizacji

Równanie obliczania normalizacji można wyprowadzić, wykonując następujące proste cztery kroki:

Krok 1: Najpierw zidentyfikuj minimalną i maksymalną wartość w zbiorze danych i oznacz je x minimum i x maksimum .

Krok 2: Następnie oblicz zakres zestawu danych, odejmując wartość minimalną od wartości maksymalnej.

Zakres = x maksimum - x minimum

Krok 3: Następnie określ, o ile bardziej wartość ma być znormalizowana zmienna od wartości minimalnej, odejmując wartość minimalną od zmiennej, tj. X - x minimum .

Krok 4: Ostatecznie wzór na obliczenie normalizacji zmiennej x uzyskuje się przez podzielenie wyrażenia z kroku 3 przez wyrażenie z kroku 2, jak pokazano powyżej.

Przykłady formuły normalizacji (z szablonem Excel)

Zobaczmy kilka prostych i zaawansowanych przykładów równań normalizacji, aby lepiej to zrozumieć.

Wzór normalizacji - przykład nr 1

Określić znormalizowaną wartość 11,69, tj. W skali (0,1), jeśli dane mają najniższą i najwyższą wartość odpowiednio 3,65 i 22,78.

Z powyższego zebraliśmy następujące informacje.

Dlatego obliczenie wartości normalizacji 11,69 jest następujące:

  • x (znormalizowany) = (11,69 - 3,65) / (22,78 - 3,65)

Wartość normalizacji 11,69 wynosi -

  • x (znormalizowany) = 0,42

Wartość 11,69 w podanym zestawie danych można przeliczyć w skali (0,1) na 0,42.

Wzór normalizacji - przykład nr 2

Weźmy inny przykład zbioru danych, który reprezentuje oceny z testów zdobytych przez 20 uczniów podczas ostatniego testu z przedmiotów ścisłych. Przedstaw wyniki testów wszystkich uczniów w przedziale od 0 do 1 za pomocą technik normalizacyjnych. Wyniki testów (na 100) są następujące:

Zgodnie z podanym wynikiem testu,

Najwyższą ocenę z testu wystawia student 11 tj. X maksimum = 95, oraz

Najniższą ocenę z testu wystawia student 6 tj. X minimum = 37

Zatem obliczenie znormalizowanego wyniku ucznia 1 jest następujące:

  • Znormalizowany wynik ucznia 1 = (78-37) / (95-37)

Znormalizowany wynik ucznia 1

  • Znormalizowany wynik ucznia 1 = 0,71

Podobnie wykonaliśmy obliczenie normalizacji wyniku dla wszystkich 20 uczniów w następujący sposób:

  • Wynik ucznia 2 = (65–37) / (95–37) = 0,48
  • Wynik ucznia 3 = (56 - 37) / (95 - 37) = 0,33
  • Wynik ucznia 4 = (87 - 37) / (95 - 37) = 0,86
  • Wynik ucznia 5 = (91 - 37) / (95 - 37) = 0,93
  • Wynik ucznia 6 = (37 - 37) / (95 - 37) = 0,00
  • Wynik ucznia 7 = (49 - 37) / (95 - 37) = 0,21
  • Wynik ucznia 8 = (77 - 37) / (95 - 37) = 0,69
  • Wynik ucznia 9 = (62 - 37) / (95 - 37) = 0,43
  • Wynik ucznia 10 = (59 - 37) / (95 - 37) = 0,38
  • Wynik ucznia 11 = (95 - 37) / (95 - 37) = 1,00
  • Wynik ucznia 12 = (63–37) / (95–37) = 0,45
  • Wynik ucznia 13 = (42 - 37) / (95 - 37) = 0,09
  • Wynik ucznia 14 = (55 - 37) / (95 - 37) = 0,31
  • Wynik ucznia 15 = (72 - 37) / (95 - 37) = 0,60
  • Wynik ucznia 16 = (68 - 37) / (95 - 37) = 0,53
  • Wynik ucznia 17 = (81 - 37) / (95 - 37) = 0,76
  • Wynik ucznia 18 = (39 - 37) / (95 - 37) = 0,03
  • Wynik ucznia 19 = (45 - 37) / (95 - 37) = 0,14
  • Wynik ucznia 20 = (49 - 37) / (95 - 37) = 0,21

Teraz narysujmy wykres znormalizowanego wyniku uczniów.

Kalkulator formuły normalizacyjnej

Możesz użyć tego kalkulatora formuły normalizacji.

X
Minimum X
Maksymalnie X
X znormalizowany
 

X znormalizowany =
X - minimum X
=
X maksimum -X minimum
0 - 0
=0
0 - 0

Trafność i zastosowanie

Pojęcie normalizacji jest bardzo ważne, ponieważ jest często używane w różnych dziedzinach, takich jak ratingi, w których technika normalizacji służy do dostosowania wartości mierzonych w różnych skalach do teoretycznie wspólnej skali (od 0 do 1). Pojęcie normalizacji można również wykorzystać do bardziej wyrafinowanych i skomplikowanych dostosowań, takich jak doprowadzenie całego zestawu rozkładu prawdopodobieństwa dostosowanych wartości do wyrównania lub normalizacji kwantylowej, w której kwantyle różnych miar są wyrównane.

Znajduje również zastosowanie w ocenach edukacyjnych (jak pokazano powyżej), aby dopasować wyniki uczniów do rozkładu normalnego. Jednak technika ta nie radzi sobie zbyt dobrze z wartościami odstającymi, co jest jednym z jej głównych ograniczeń.

Możesz pobrać ten szablon programu Excel Formuła normalizacji stąd - Szablon programu Excel Formuła normalizacji