De uitbijterformule biedt een grafisch hulpmiddel om de gegevens te berekenen die zich buiten de gegeven set van distributie bevinden, die binnen of buiten kan zijn, afhankelijk van de variabelen.
Wat is de uitbijterformule?
Een uitbijter is het gegevenspunt van het gegeven monster of de gegeven waarneming of in een verdeling die buiten het algemene patroon moet liggen. Een veelgebruikte regel die zegt dat een datapunt als een uitbijter wordt beschouwd als het meer dan 1,5 IQR onder het eerste kwartiel of boven het derde kwartiel heeft.
Anders gezegd, lage uitschieters zullen onder Q1-1.5 IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen
Men moet mediaan, kwartielen berekenen, inclusief IQR, Q1 en Q3.
De uitbijterformule wordt als volgt weergegeven,
De formule voor Q1 = ¼ (n + 1) de term De formule voor Q3 = ¾ (n + 1) de term De formule voor Q2 = Q3 - Q1

Stapsgewijze berekening van de uitbijter
De onderstaande stappen moeten worden gevolgd om de uitbijter te berekenen.
- Stap 1: Bereken eerst de kwartielen, dwz Q1, Q2 en interkwartiel
- Stap 2: Bereken nu de waarde Q2 * 1.5
- Stap 3: Trek nu de Q1-waarde af van de waarde die in stap 2 is berekend
- Stap 4: Voeg hier Q3 toe met de waarde berekend in stap2
- Stap 5: Creëer het bereik van de waarden die zijn berekend in Stap 3 en Stap 4
- Stap 6: Rangschik de gegevens in oplopende volgorde
- Stap 7: Controleer of er waarden zijn die onder of hoger liggen dan het bereik dat in stap 5 is gemaakt.
Voorbeeld
Beschouw een gegevensset van de volgende getallen: 10, 2, 4, 7, 8, 5, 11, 3, 12. U moet alle uitschieters berekenen.
Oplossing:
Eerst moeten we de gegevens in oplopende volgorde rangschikken om de mediaan te vinden, wat voor ons Q2 zal zijn.
2, 3, 4, 5, 7, 8, 10, 11, 12

Omdat nu het aantal waarnemingen oneven is, dat deze 9-, zou de mediaan liggen op een 5 ste positie, die is 7, en hetzelfde zal Q2 voor dit voorbeeld zijn.
Daarom is de berekening van Q1 als volgt -
Q1 = ¼ (9 + 1)
= ¼ (10)
Q1 zal zijn -

Q1 = 2,5 termijn
Dit betekent dat Q1 het gemiddelde is van de 2 e en 3 e positie van de waarnemingen, wat hier 3 & 4 is, en een gemiddelde daarvan is (3 + 4) / 2 = 3,5
Daarom is de berekening van Q3 als volgt -

Q3 = ¾ (9 + 1)
= ¾ (10)
Q3 zal zijn -

Q3 = 7,5 termijn
Dit betekent dat Q3 is het gemiddelde van de 7 e en 8 ste positie van de waarnemingen, die 10 en 11 hier, en gemiddeld Hetzelfde (10 + 11) / 2 = 10,5
Nu zullen lage uitschieters onder Q1-1.5IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen
De waarden zijn dus 3,5 - (1,5 * 7) = -7 en het hogere bereik is 10,5 + (1,5 * 7) = 110,25.
Aangezien er geen waarnemingen zijn die hoger of lager liggen dan 110,25 en -7, hebben we geen uitschieters in deze steekproef.
Voorbeeld van uitschieterformule in Excel (met Excel-sjabloon)
Creatieve coachingklassen overwegen om studenten die in de top 25% zitten te belonen. Ze willen echter uitschieters vermijden. De gegevens zijn voor de 25 studenten. Gebruik de uitbijtervergelijking om te bepalen of er een uitbijter is?
Oplossing:
Hieronder vindt u gegevens om de uitbijter te berekenen.

Het aantal waarnemingen hier is 25, en onze eerste stap zou zijn om de bovenstaande ruwe gegevens in oplopende volgorde om te zetten.
Mediaan zal zijn -

De mediaanwaarde = ½ (n + 1)
= ½ = ½ (26)
= 13 th termijn
De Q2 of mediaan is 68,00
Dat is 50% van de bevolking.
Q1 zal zijn -

Q1 = ¼ (n + 1) de term
= ¼ (25 + 1)
= ¼ (26)
= 6,5 ste term, wat gelijk is aan 7 de term
De Q1 is 56,00, dat is de onderste 25%
Q3 zal zijn -

Ten slotte, Q3 = ¾ (n + 1) de term
= ¾ (26)
= 19,50 term
Hier gemiddeld moet worden genomen, hetgeen van 19 ste en 20 ste voorwaarden die zijn 77 en 77 en de gemiddelde daarvan is (77 + 77) / 2 = 77,00
De Q3 is 77, wat de top 25% is
Laag bereik
Nu zullen lage uitschieters onder Q1-1.5IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen

Hoog bereik -

De waarden zijn dus 56 - (1,5 * 68) = -46 en het hogere bereik is 77 + (1,5 * 68) = 179.
Er zijn geen uitschieters.
Relevantie en toepassingen
De formule voor uitschieters is erg belangrijk om te weten, omdat er gegevens kunnen zijn die door een dergelijke waarde zouden worden vertekend. Neem een voorbeeld van waarnemingen 2, 4, 6, 101, en als iemand nu een gemiddelde van deze waarden neemt, zal het 28,25 zijn, maar 75% van de waarnemingen ligt onder de 7, en daarom zou men een onjuiste beslissing zijn met betrekking tot waarnemingen van dit monster.
Hier valt op dat 101 duidelijk lijkt te schetsen, en als dit wordt verwijderd, dan zou het gemiddelde 4 zijn, wat over de waarden of waarnemingen zegt dat ze binnen het bereik van 4 liggen. Daarom is het erg belangrijk om dit uit te voeren berekening om misbruik van leidende informatie van de gegevens te voorkomen. Deze worden veel gebruikt door statistici over de hele wereld wanneer ze onderzoek doen.