Empirische regel - definitie, formule, hoe te gebruiken in statistieken?

Wat is de empirische regel in de statistiek?

Empirical Rule in Statistics stelt dat bijna alle (95%) van de waarnemingen in een normale verdeling binnen 3 standaarddeviaties van het gemiddelde liggen. Dit is een zeer belangrijke regel en helpt bij het voorspellen.

Formule

De formule toont het voorspelde percentage waarnemingen dat binnen elke standaarddeviatie van het gemiddelde zal liggen.

De regel zegt dat:

  • 68% van de waarnemingen zal binnen +/- 1 standaarddeviatie van het gemiddelde liggen
  • 95% van de waarnemingen zal binnen +/- 2 standaarddeviaties van het gemiddelde liggen
  • 7% van de waarnemingen zal binnen +/- 3 standaarddeviaties van het gemiddelde liggen

Hoe te gebruiken?

Dit wordt gebruikt in de voorspellingstrend van een dataset. Als de dataset uitgebreid is en het een uitdaging wordt om de hele populatie te bestuderen, dan kan Empirical Rule op de steekproef worden toegepast om een ​​schatting te krijgen van hoe de data in de populatie zullen reageren als je wordt gevraagd om het gemiddelde salaris van alle de accountants in de VS. Dan is dat een moeilijke taak, aangezien de populatie enorm is. In dat geval kun je dus bijvoorbeeld 90 waarnemingen willekeurig uit de hele populatie selecteren.

Dus nu heb je 90 salarissen. U moet de gemiddelde en standaarddeviatie van de waarnemingen vinden. Als de waarneming een normale verdeling volgt, kan deze worden toegepast en kan een schatting worden gemaakt van het salaris van alle accountants in de VS.

Stel dat het gemiddelde salaris van de steekproef uitkomt op $ 90.000. En de standaarddeviatie is $ 5.000. Dus van de gehele populatie trekt 68% van de accountants een salaris tussen +/- 1 standaardafwijkingen van het gemiddelde. Omdat het gemiddelde $ 90.000 is en de standaarddeviatie $ 5.000. Dus 68% van alle accountants in de VS wordt betaald in het bereik van $ 90.000 +/- (1 * $ 5.000). Dat is tussen $ 85.000 en $ 95.000

Als we wat meer spreiden, wordt 95% van alle accountants in de VS betaald in het bereik van gemiddelde +/- 2 standaarddeviaties. $ 90.000 +/- (2 * 5000). Het bereik is dus $ 80.000 tot $ 100.000.

In een breder bereik trekt 99,7% van alle accountants salarissen die variëren van gemiddelde +/- 3 standaarddeviaties. Dat is 90.000 +/- (3 * 5000). Het bereik is $ 75.000 tot $ 105.000

Je kunt duidelijk zien dat zonder de hele populatie te bestuderen, er een schatting zou kunnen worden gemaakt met betrekking tot de populatie. Als iemand van plan is om als accountant in de VS te werken, kan hij gemakkelijk verwachten dat zijn salaris zal variëren van $ 75.000 tot $ 105.000

Dit soort schattingen helpt het werk te vergemakkelijken en voorspellingen te doen over de toekomst.

Voorbeelden van empirische regels

Meneer X probeert het gemiddelde aantal jaren te vinden dat een persoon na zijn pensionering overleeft, gezien de pensioenleeftijd 60 jaar is. Als de gemiddelde overlevingsjaren van 50 willekeurige waarnemingen 20 jaar zijn en SD 3, zoek dan uit hoe waarschijnlijk persoon krijgt meer dan 23 jaar pensioen

Oplossing

De empirische regel stelt dat 68% van de waarnemingen binnen 1 standaarddeviatie van het gemiddelde zal liggen. Hier is het gemiddelde van de waarnemingen 20.

68% van de waarnemingen zal binnen 20 +/- 1 (standaarddeviatie) liggen, dat is 20 +/- 3. Het bereik is dus 17 tot 23.

Er is een kans van 68% dat de minimumjaren die iemand overleeft na pensionering tussen de 17 en 23 ligt. Nu is het percentage dat buiten deze bandbreedte ligt (100 - 68) = 32%. 32 is gelijk verdeeld over beide zijden, wat een kans van 16% betekent dat de minimumjaren onder de 17 komen en een kans van 16% dat de minimumjaren groter zijn dan 23.

De kans dat de persoon meer dan 23 jaar pensioen krijgt, is dus 16%.

Empirische regel versus de stelling van Chebyshev

Empirical Rule wordt toegepast op datasets die een normale verdeling volgen, dat wil zeggen klokvormig. In een normale verdeling hebben beide zijden van de verdeling elk een kans van 50%.

Als de dataset niet normaal verdeeld is, is er een andere benadering of regel die van toepassing is op alle soorten datasets, namelijk de stelling van Chebyshev. Er staan ​​drie dingen in:

  • Ten minste 3/4 ste van alle waarnemingen wordt binnen 2Standard afwijkingen van het gemiddelde liggen. Het is een sterke benadering. Het betekent als er 100, verschaffen 3/4 ste van de observaties die 75 waarnemingen binnen +/- 2 standaard deviaties van het gemiddelde liggen.
  • Ten minste 8/9 ste van alle waarnemingen binnen 3Standard afwijkingen van het gemiddelde zal liggen.
  • Minstens 1 - 1 / k 2 van alle waarnemingen liggen binnen K standaarddeviaties van het gemiddelde. Hier wordt K een geheel getal genoemd.

Wanneer te gebruiken?

Data is als goud in de moderne wereld. Er zijn enorme hoeveelheden gegevens die uit verschillende bronnen komen en worden gebruikt voor verschillende benaderingen of voorspellingen. Als een dataset een normale verdeling volgt, vertoont deze een klokvormige curve; dan kan Empirical Rule worden gebruikt. Het wordt toegepast op waarnemingen om een ​​benadering voor de populatie te creëren.

Zodra wordt gezien dat de waarnemingen een normale distributiestructuur vertonen, wordt de empirische regel gevolgd om verschillende waarschijnlijkheden van de waarnemingen te vinden. De regel is buitengewoon handig voor veel statistische voorspellingen.

Conclusie

Empirical Rule is een statistisch concept dat helpt bij het weergeven van de waarschijnlijkheid van waarnemingen en is erg handig bij het vinden van een benadering van een enorme populatie. Er moet altijd worden opgemerkt dat dit benaderingen zijn. Er zijn altijd kansen op uitschieters die niet in de verdeling vallen. De bevindingen zijn dus niet nauwkeurig en er moeten voorzorgsmaatregelen worden genomen wanneer u handelt volgens de prognose.

Interessante artikelen...