Co to jest formuła normalizacji?
W statystyce termin „normalizacja” odnosi się do zmniejszenia zbioru danych w taki sposób, że znormalizowane dane mieszczą się w zakresie od 0 do 1. Takie techniki normalizacji pomagają w porównywaniu odpowiednich znormalizowanych wartości z dwóch lub więcej różnych zestawów danych w sposób że eliminuje skutki zmienności skali zbiorów danych, tj. zbiór danych o dużych wartościach można łatwo porównać ze zbiorem danych o mniejszych wartościach.
Równanie normalizacji wyprowadza się początkowo odejmując wartość minimalną od zmiennej, która ma być normalizowana, następnie wartość minimalną odejmuje się od wartości maksymalnej, a następnie poprzedni wynik jest dzielony przez drugą.
Matematycznie równanie normalizacji jest reprezentowane jako:
x znormalizowane = ( x - x minimum ) / ( x maksimum - x minimum )Wyjaśnienie wzoru normalizacji
Równanie obliczania normalizacji można wyprowadzić, wykonując następujące proste cztery kroki:
Krok 1: Najpierw zidentyfikuj minimalną i maksymalną wartość w zbiorze danych i oznacz je x minimum i x maksimum .
Krok 2: Następnie oblicz zakres zestawu danych, odejmując wartość minimalną od wartości maksymalnej.
Zakres = x maksimum - x minimum
Krok 3: Następnie określ, o ile bardziej wartość ma być znormalizowana zmienna od wartości minimalnej, odejmując wartość minimalną od zmiennej, tj. X - x minimum .
Krok 4: Ostatecznie wzór na obliczenie normalizacji zmiennej x uzyskuje się przez podzielenie wyrażenia z kroku 3 przez wyrażenie z kroku 2, jak pokazano powyżej.
Przykłady formuły normalizacji (z szablonem Excel)
Zobaczmy kilka prostych i zaawansowanych przykładów równań normalizacji, aby lepiej to zrozumieć.
Wzór normalizacji - przykład nr 1
Określić znormalizowaną wartość 11,69, tj. W skali (0,1), jeśli dane mają najniższą i najwyższą wartość odpowiednio 3,65 i 22,78.
Z powyższego zebraliśmy następujące informacje.
Dlatego obliczenie wartości normalizacji 11,69 jest następujące:
- x (znormalizowany) = (11,69 - 3,65) / (22,78 - 3,65)
Wartość normalizacji 11,69 wynosi -
- x (znormalizowany) = 0,42
Wartość 11,69 w podanym zestawie danych można przeliczyć w skali (0,1) na 0,42.
Wzór normalizacji - przykład nr 2
Weźmy inny przykład zbioru danych, który reprezentuje oceny z testów zdobytych przez 20 uczniów podczas ostatniego testu z przedmiotów ścisłych. Przedstaw wyniki testów wszystkich uczniów w przedziale od 0 do 1 za pomocą technik normalizacyjnych. Wyniki testów (na 100) są następujące:
Zgodnie z podanym wynikiem testu,
Najwyższą ocenę z testu wystawia student 11 tj. X maksimum = 95, oraz
Najniższą ocenę z testu wystawia student 6 tj. X minimum = 37
Zatem obliczenie znormalizowanego wyniku ucznia 1 jest następujące:
- Znormalizowany wynik ucznia 1 = (78-37) / (95-37)
Znormalizowany wynik ucznia 1
- Znormalizowany wynik ucznia 1 = 0,71
Podobnie wykonaliśmy obliczenie normalizacji wyniku dla wszystkich 20 uczniów w następujący sposób:
- Wynik ucznia 2 = (65–37) / (95–37) = 0,48
- Wynik ucznia 3 = (56 - 37) / (95 - 37) = 0,33
- Wynik ucznia 4 = (87 - 37) / (95 - 37) = 0,86
- Wynik ucznia 5 = (91 - 37) / (95 - 37) = 0,93
- Wynik ucznia 6 = (37 - 37) / (95 - 37) = 0,00
- Wynik ucznia 7 = (49 - 37) / (95 - 37) = 0,21
- Wynik ucznia 8 = (77 - 37) / (95 - 37) = 0,69
- Wynik ucznia 9 = (62 - 37) / (95 - 37) = 0,43
- Wynik ucznia 10 = (59 - 37) / (95 - 37) = 0,38
- Wynik ucznia 11 = (95 - 37) / (95 - 37) = 1,00
- Wynik ucznia 12 = (63–37) / (95–37) = 0,45
- Wynik ucznia 13 = (42 - 37) / (95 - 37) = 0,09
- Wynik ucznia 14 = (55 - 37) / (95 - 37) = 0,31
- Wynik ucznia 15 = (72 - 37) / (95 - 37) = 0,60
- Wynik ucznia 16 = (68 - 37) / (95 - 37) = 0,53
- Wynik ucznia 17 = (81 - 37) / (95 - 37) = 0,76
- Wynik ucznia 18 = (39 - 37) / (95 - 37) = 0,03
- Wynik ucznia 19 = (45 - 37) / (95 - 37) = 0,14
- Wynik ucznia 20 = (49 - 37) / (95 - 37) = 0,21
Teraz narysujmy wykres znormalizowanego wyniku uczniów.
Kalkulator formuły normalizacyjnej
Możesz użyć tego kalkulatora formuły normalizacji.
X | |
Minimum X | |
Maksymalnie X | |
X znormalizowany | |
X znormalizowany = |
|
|
Trafność i zastosowanie
Pojęcie normalizacji jest bardzo ważne, ponieważ jest często używane w różnych dziedzinach, takich jak ratingi, w których technika normalizacji służy do dostosowania wartości mierzonych w różnych skalach do teoretycznie wspólnej skali (od 0 do 1). Pojęcie normalizacji można również wykorzystać do bardziej wyrafinowanych i skomplikowanych dostosowań, takich jak doprowadzenie całego zestawu rozkładu prawdopodobieństwa dostosowanych wartości do wyrównania lub normalizacji kwantylowej, w której kwantyle różnych miar są wyrównane.
Znajduje również zastosowanie w ocenach edukacyjnych (jak pokazano powyżej), aby dopasować wyniki uczniów do rozkładu normalnego. Jednak technika ta nie radzi sobie zbyt dobrze z wartościami odstającymi, co jest jednym z jej głównych ograniczeń.
Możesz pobrać ten szablon programu Excel Formuła normalizacji stąd - Szablon programu Excel Formuła normalizacji