Hypergeometrische distributie (definitie, formule) - Hoe te berekenen?

Definitie van hypergeometrische distributie

In de statistieken en de kansrekening is hypergeometrische verdeling in feite een aparte kansverdeling die de kans op k successen definieert (dwz enkele willekeurige trekkingen voor het getrokken object met een bepaald kenmerk) in n aantal trekkingen, zonder enige vervanging, van een gegeven populatiegrootte N die nauwkeurig K objecten met dat kenmerk omvat, waar de trekking kan slagen of kan mislukken.

De formule voor de kans op een hypergeometrische verdeling wordt afgeleid uit een aantal items in de populatie, aantal items in de steekproef, aantal successen in de populatie, aantal successen in de steekproef en enkele combinaties. Wiskundig gezien wordt de kans weergegeven als,

P = K C k * (N - K) C (n - k) / N C n

waar,

  • N = aantal items in de populatie
  • n = aantal items in de steekproef
  • K = aantal successen in de populatie
  • k = aantal successen in de steekproef

De gemiddelde en standaarddeviatie van een hypergeometrische verdeling wordt uitgedrukt als,

Gemiddelde = n * K / N Standaarddeviatie = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Uitleg

Stap 1: Bepaal eerst het totale aantal items in de populatie, dat wordt aangeduid met N. Het aantal speelkaarten in een kaartspel is bijvoorbeeld 52.

Stap 2: Bepaal vervolgens het aantal items in de steekproef, aangeduid met n, bijvoorbeeld het aantal kaarten dat uit de stapel is getrokken.

Stap 3: Bepaal vervolgens de gevallen die als successen in de populatie worden beschouwd, en het wordt aangeduid met K. Bijvoorbeeld het aantal harten in de totale stapel, dat 13 is.

Stap 4: Bepaal vervolgens de gevallen die worden beschouwd als successen in de getrokken steekproef, en deze wordt aangegeven met k. Bijv. Het aantal harten in de kaarten getrokken uit de stapel.

Stap 5: Tenslotte wordt de formule voor de kans op een hypergeometrische verdeling afgeleid uit een aantal items in de populatie (stap 1), aantal items in de steekproef (stap 2), aantal successen in de populatie (stap 3) en het aantal successen in de steekproef (stap 4) zoals hieronder getoond.

P = K C k * (N - K) C (n - k) / N C n

Voorbeelden van hypergeometrische distributie (met Excel-sjabloon)

Voorbeeld 1

Laten we het voorbeeld nemen van een gewoon spel met speelkaarten waarbij 6 kaarten willekeurig worden getrokken zonder vervanging. Bepaal de waarschijnlijkheid dat u precies 4 rode reeksenkaarten trekt, dat wil zeggen diamanten of harten.

  • Gegeven, N = 52 (aangezien er 52 kaarten in een gewoon speelstapel zitten)
  • n = 6 (aantal kaarten dat willekeurig uit de stapel wordt getrokken)
  • K = 26 (aangezien er elk 13 rode kaarten zijn in ruiten en hartenreeks)
  • k = 4 (aantal rode kaarten dat als succesvol moet worden beschouwd in de getrokken steekproef)

Oplossing:

Daarom kan de kans om precies 4 rode suites-kaarten te trekken in de getrokken 6 kaarten worden berekend met behulp van de bovenstaande formule als,

Waarschijnlijkheid = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

De kans zal zijn -

Waarschijnlijkheid = 0,2387 ~ 23,87%

Daarom is er een kans van 23,87% dat u precies 4 rode kaarten trekt terwijl u 6 willekeurige kaarten uit een gewoon kaartspel trekt.

Voorbeeld 2

Laten we nog een voorbeeld nemen van een portemonnee die 5 biljetten van $ 100 en 7 biljetten van $ 1 bevat. Als 4 biljetten willekeurig worden gekozen, bepaal dan de kans om precies 3 biljetten van $ 100 te kiezen.

  • Gegeven, N = 12 (aantal rekeningen van $ 100 + aantal rekeningen van $ 1)
  • n = 4 (willekeurig gekozen aantal rekeningen)
  • K = 5 (aangezien er 5 biljetten van $ 100 zijn)
  • k = 3 (aantal rekeningen van $ 100 dat als een succes moet worden beschouwd in de gekozen steekproef)

Oplossing:

Daarom kan de kans om precies 3 biljetten van $ 100 te kiezen in de willekeurig gekozen 4 biljetten worden berekend met behulp van de bovenstaande formule als,

Waarschijnlijkheid = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

De kans zal zijn -

Waarschijnlijkheid = 0,1414 ~ 14,14%

Daarom is er een kans van 14,14% dat u precies 3 biljetten van $ 100 kiest terwijl u 4 willekeurige biljetten trekt.

Relevantie en toepassingen

Het concept van hypergeometrische verdeling is belangrijk omdat het een nauwkeurige manier biedt om de waarschijnlijkheden te bepalen wanneer het aantal proeven niet erg groot is en er steekproeven worden genomen uit een eindige populatie zonder vervanging. In feite is de hypergeometrische verdeling analoog aan de binominale verdeling, die wordt gebruikt wanneer het aantal proeven aanzienlijk groot is. Hypergeometrische distributie wordt echter voornamelijk gebruikt voor bemonstering zonder vervanging.

Interessante artikelen...