Gemiddelde versus mediaan - Verschillen tussen methoden die worden gebruikt in statistieken

Verschil tussen gemiddelde en mediaan

Gemiddelde en Mediaan zijn twee veelgebruikte termen in de wiskunde, gemiddelde is als gemiddelde van een bepaald getal en het somt de getallen op en deelt ze door het aantal getallen, wat ons het gemiddelde geeft, terwijl mediaan anderzijds het middelste getal uit het geheel retourneert dataset en als de dataset gelijk is, voegt de mediaan de twee middelste getallen toe en deelt deze door 2, waardoor we de mediaan krijgen.

Ze zijn de maat voor de centrale tendens en worden vaak gebruikt bij het meten van grote gegevenssets waar analyses moeten worden gemaakt en resultaten moeten worden geïnterpreteerd. Gemiddelde, mediaan en modus zijn drie gemiddelden die aangeven hoe verspreid de gegevens zijn van het gemiddelde of het gemiddelde. Deze methoden worden op grote schaal in de statistieken gebruikt, terwijl de gemiddelde waarde van de gegevens de meest gebruikte methode van de drie is.

Wat is gemiddeld?

Gemiddelde is een simpele som van het aantal waarnemingen in een array, die wordt gedeeld door het aantal waarnemingen. Als we het bijvoorbeeld hebben over de gemiddelde lengte of de gemiddelde lengte van een groep bestaande uit 5 personen. De gemiddelde lengte wordt berekend door de lengte van 5 personen op te tellen gedeeld door het aantal personen, dwz 5.

Formule

Gemiddelde formule = (som van alle waarnemingen / aantal waarnemingen)

Wat is de mediaan?

Mediaan, aan de andere kant, is het middelste getal in de reeks van de gegevensarray, die de hogere reeks gegevens van de lagere scheidt. De gegevens moeten eerst in oplopende volgorde worden gerangschikt om de mediaan van de gegevens te berekenen. Als de dataset een kardinaliteit heeft, moet het gemiddelde van de middelste twee getallen in de dataset worden genomen. Deze twee methoden worden echter vaak door elkaar gebruikt.

Formule

Mediaan formule = (n + 1) / 2

wanneer n een oneven getal is

Mediaan = ((n / 2) + ((n / 2) +1)) / 2

wanneer n een even getal is

Gemiddelde versus mediane infographics

Laten we eens kijken naar de belangrijkste verschillen tussen gemiddelde versus mediaan.

Gemiddelde versus mediaan belangrijkste verschillen

  • Mean is eenvoudig te gebruiken en toe te passen en kan worden toegepast op elke gegevensarray, even of oneven. Mediaan daarentegen is enigszins complex in het gebruik en de gegevensset moet eerst in oplopende of aflopende volgorde worden gerangschikt voordat de berekening wordt uitgevoerd.
  • Het gemiddelde wordt normaal gebruikt voor normale distributies, terwijl de mediaan wordt gebruikt voor de dataset van scheve distributies.
  • Het gemiddelde is eenvoudig, maar het is niet robuust geworden, het kan uitschieters in de distributies bevatten en kan de gebruiker soms niet de juiste resultaten geven voor interpretatie. Aan de andere kant is de mediaanmethode robuust en beter geschikt om te gebruiken omdat deze wordt gebruikt voor scheve distributies om de centrale neiging van de datuminstelling af te leiden en de gebruiker veel nauwkeurige resultaten zal geven in vergelijking met gemiddelde
  • Er is maar één gemiddelde formule, namelijk de som van alle waarnemingen gedeeld door het aantal waarnemingen. Terwijl de mediaan twee formules heeft, een van de oneven waarbij alleen de middelste getallen uit de dataset de mediaan worden. Maar als we een even gegevensset hebben, wordt het midden van de twee waarden gekozen en gedeeld door 2, wat ons dan de mediaan van de even gegevensset geeft.

Gemiddelde versus mediane vergelijkende tabel

Gemeen Mediaan
Het gemiddelde wordt berekend door alle waarden in de gegevensmatrix bij elkaar op te tellen, die vervolgens wordt gedeeld door het aantal waarnemingen. Mediaan is de exacte middelste waarde van de dataset. Het kan worden berekend door de dataset in oplopende volgorde te rangschikken en vervolgens de middelste waarde uit de dataset te zoeken of eruit te halen.
Het wordt op grotere schaal gebruikt in de industrie vanwege een gemakkelijke berekening van het gemiddelde, en het geeft ons een snel aantal. Het wordt niet vaak gebruikt in de industrie, maar het is vollediger en nauwkeuriger dan gemiddeld, wat slechts een simpele som van getallen is.
Het wordt over het algemeen gebruikt voor gegevensverzamelingen die normaal scheef staan, dwz normale distributie. Het is vooral handig om de dataset te beschrijven met een aanzienlijke scheefheid in de gegevens of wanneer de gegevens een lange staart hebben. Het wordt op grote schaal gebruikt waar de outliners een aanzienlijk gewicht in de gegevens hebben, aangezien dit geen goede berekeningsmethode is.
Het is geen robuust hulpmiddel voor een berekening om de centrale tendens af te leiden. Het is een veel robuust hulpmiddel omdat het het gewicht in de gegevens bepaalt, wat over het algemeen een hoog gewicht is bij de langere staarten.
Het is erg gevoelig voor uitschieters. Het wordt veel minder beïnvloed door de uitschieters.
Het is eenvoudig te gebruiken Het is complex van aard.
Het kan niet worden berekend voor categorische gegevens, omdat de waarden niet kunnen worden opgeteld. Het kan niet worden geïdentificeerd voor gecategoriseerde nominale gegevens, omdat het niet logisch kan worden geordend.

Conclusie

Afgezien van het gemiddelde en de mediaan, is er nog een methode die vaak wordt gebruikt voor het meten van de centrale tendens, namelijk de modus. Een modus is een waarde die het vaakst voorkomt in de gegevensverzameling; de modus heeft het voordeel ten opzichte van het gemiddelde en de mediaan dat deze kan worden gevonden voor zowel numerieke als gecategoriseerde datasets.

Ondanks het bestaan ​​van modus en mediaan, de superioriteit van betere resultaten en analyse ten opzichte van het gemiddelde, is het gemiddelde nog steeds de meest geschikte maat voor centrale tendens, vooral als de dataset een normale verdeling is en de gegevens normaal gesproken scheef zijn.

Als goede analist moet de centrale tendens worden gemeten met alle drie de gegevensmethoden, en moet de variantie in de analyse worden overwogen en zorgvuldig worden geanalyseerd om betere en nauwkeurigere resultaten in de gegevensverzameling te produceren.

Interessante artikelen...