Centrale limietstelling (definitie, formule) - Berekeningen en voorbeelden

Definitie van centrale limietstelling

De centrale limietstelling stelt dat de willekeurige steekproeven van een willekeurige populatievariabele met een willekeurige verdeling een normale kansverdeling zullen benaderen naarmate de omvang van de steekproef toeneemt en het veronderstelt dat als de omvang van de steekproef in de populatie groter is dan 30, het gemiddelde van de steekproef waarvan het gemiddelde van alle waarnemingen voor de steekproef bijna gelijk zal zijn aan het gemiddelde van de populatie.

Formule centrale limietstelling

We hebben al besproken dat wanneer de steekproefomvang groter is dan 30, de verdeling de vorm aanneemt van een normale verdeling. Om de normale verdeling van een variabele te bepalen, is het belangrijk om het gemiddelde en de variantie te kennen. Een normale verdeling kan worden vermeld als

X ~ N (µ, α)

Waar

  • N = aantal waarnemingen
  • µ = gemiddelde van de waarnemingen
  • α = standaarddeviatie

In de meeste gevallen onthullen de waarnemingen niet veel in hun ruwe vorm. Het is dus essentieel om de waarnemingen te standaardiseren om dat te kunnen vergelijken. Het wordt gedaan met behulp van de z-score. Voor een waarneming moet de Z-score worden berekend. De formule om de z-score te berekenen is

Z = (X- µ) / α / √n

Waar

  • Z = Z-score van de waarnemingen
  • µ = gemiddelde van de waarnemingen
  • α = standaarddeviatie
  • n = steekproefomvang

Uitleg

De centrale limietstelling stelt dat de willekeurige steekproeven van een willekeurige populatievariabele met een willekeurige verdeling een normale kansverdeling zullen benaderen naarmate de omvang van de steekproef toeneemt. De centrale limietstelling gaat ervan uit dat als de omvang van de steekproef in de populatie groter is dan 30, het gemiddelde van de steekproef, het gemiddelde van alle waarnemingen voor de steekproef, bijna gelijk zal zijn aan het gemiddelde van de populatie. Ook zal de standaarddeviatie van de steekproef wanneer de omvang van de steekproef groter is dan 30 gelijk zijn aan de standaarddeviatie van de populatie. Aangezien de steekproef willekeurig uit de hele populatie wordt gekozen en de omvang van de steekproef meer dan 30 is, helpt het bij het testen van hypothesen en het construeren van het betrouwbaarheidsinterval voor de hypothesetest.

Voorbeelden van centrale limietstellingformule (met Excel-sjabloon)

Voorbeeld 1

Laten we het concept van een normale verdeling begrijpen met behulp van een voorbeeld. Het gemiddelde rendement van een beleggingsfonds is 12% en de standaarddeviatie van het gemiddelde rendement voor de belegging in beleggingsfondsen is 18%. Als we aannemen dat de verdeling van het rendement normaal is verdeeld, laten we dan de verdeling interpreteren voor het rendement in de investering van het beleggingsfonds.

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 95% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 1,96 (18) = 47%
  • Onderste bereik = 12 - 1,96 (18) = -23%

Het resultaat geeft aan dat in 95% van de gevallen het rendement van het beleggingsfonds tussen 47% en -23% zal liggen. In dit voorbeeld zal de steekproefomvang, die de terugkeer is van een willekeurige steekproef van meer dan 30 waarnemingen van terugkeer, ons het resultaat opleveren voor het populatierendement van het onderlinge fonds, aangezien de steekproefverdeling normaal verdeeld zal zijn.

Voorbeeld 2

Laten we verdergaan met hetzelfde voorbeeld en bepalen wat het resultaat zal zijn bij een betrouwbaarheidsinterval van 90%

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 90% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 1,65 (18) = 42%
  • Onderste bereik = 12 - 1,65 (18) = -18%

Het resultaat geeft aan dat het rendement van het beleggingsfonds in 90% van de gevallen tussen 42% en -18% ligt.

Voorbeeld # 3

Laten we verdergaan met hetzelfde voorbeeld en bepalen wat het resultaat zal zijn bij een betrouwbaarheidsinterval van 99%

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 90% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 2,58 (18) = 58%
  • Onderste bereik = 12 - 2,58 (18) = -34%

Het resultaat geeft aan dat het rendement van het beleggingsfonds in 99% van de gevallen tussen 58% en -34% ligt.

Relevantie en gebruik

De centrale limietstelling is buitengewoon gunstig omdat het de onderzoeker in staat stelt het gemiddelde en de standaarddeviatie van de hele populatie te voorspellen met behulp van de steekproef. Aangezien de steekproef willekeurig wordt gekozen uit de gehele populatie en de omvang van de steekproef meer dan 30 is, zal elke willekeurige steekproefomvang uit de populatie bijna normaal worden verdeeld, wat zal helpen bij het testen van hypothesen en het construeren van het betrouwbaarheidsinterval voor de hypothesetesten. Op basis van de centrale limietstelling kan de onderzoeker elke willekeurige steekproef uit de hele populatie kiezen, en wanneer de omvang van de steekproef groter is dan 30,dan kan het de populatie voorspellen met behulp van de steekproef, aangezien de steekproef een normale verdeling zal volgen en ook omdat het gemiddelde en de standaarddeviatie van de steekproef hetzelfde zullen zijn als het gemiddelde en de standaarddeviatie van de populatie.

Interessante artikelen...