Steekproefdistributie - Definitie, typen en voorbeelden

Wat is een steekproefverdeling?

Een steekproefverdeling kan worden gedefinieerd als een kansverdeling met behulp van statistieken door eerst een bepaalde populatie te kiezen en vervolgens gebruik te maken van willekeurige steekproeven die uit de populatie worden getrokken, dwz het richt zich in feite op de spreiding van de frequenties die verband houden met de verspreiding van verschillende uitkomsten. of resultaten die eventueel kunnen plaatsvinden voor de specifieke gekozen populatie.

Uitleg

  • Veel onderzoekers, academici, marktstrategen, enz. Kiezen voor de verdeling van steekproeven in plaats van de hele populatie te kiezen. Dit maakt de dataset eenvoudig en ook beheersbaar. Stel, om het gemakkelijker te maken, een marketeer wil een analyse maken van het aantal jongeren dat fietst tussen twee regio's binnen de leeftijdsgrens 13-18.
  • Voor dit doel houdt hij geen rekening met de volledige bevolking die aanwezig is in de twee regio's tussen 13-18 jaar, wat praktisch niet mogelijk is, en zelfs als het wordt gedaan, het te tijdrovend is en de dataset niet beheersbaar is. . In plaats daarvan neemt de marketeer een sample set van elk 200 uit elke regio en zorgt dat de distributie wordt gedaan.
  • De gemiddelde telling van het gebruik van de fiets wordt hier het steekproefgemiddelde genoemd. Elk gekozen monster heeft zijn eigen gemiddelde gegenereerd en de verdeling voor het verkregen gemiddelde gemiddelde wordt gedefinieerd als de verdeling van het monster. De verkregen afwijking wordt de standaardfout genoemd.

Voorbeeld van distributie van steekproeven

  1. Ervan uitgaande dat een onderzoeker een onderzoek doet naar het gewicht van de inwoners van een bepaalde stad en hij heeft vijf observaties of monsters, namelijk 70 kg, 75 kg, 85 kg, 80 kg en 65 kg. De stad wordt algemeen beschouwd als een stad met een normale verdeling en hanteert een standaarddeviatie van 5 kg wat betreft gewichtsmaten. Het gemiddelde kan dus worden berekend als (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. We nemen ook aan dat de populatiegrootte enorm is; dus om naar de tweede stap te gaan, delen we het aantal waarnemingen of steekproeven door 1, dwz 1/5 = 0,20. Nu moeten we de vierkantswortel van 0,20 nemen, wat neerkomt op 0,45. De vierkantswortel wordt vervolgens vermenigvuldigd met de standaarddeviatie, dwz 0,45 * 5 = 2,25 kg. De verkregen standaardfout is dus 2,25 kg en het verkregen gemiddelde was 75 kg. Deze twee factoren kunnen worden gebruikt om de verdeling te beschrijven.

Soorten steekproefdistributie

# 1 - Bemonsteringsverdeling van gemiddelde

  • Dit kan worden gedefinieerd als de probabilistische spreiding van alle gemiddelden van steekproeven die willekeurig zijn gekozen met een vaste grootte uit een bepaalde populatie. Wanneer steekproeven hebben gekozen voor een normale populatie, zal de spreiding van het verkregen gemiddelde ook normaal zijn ten opzichte van het gemiddelde en de standaarddeviatie.
  • Als de populatie niet normaal tot stil is, zal de verdeling van de middelen de neiging hebben om dichter bij de normale verdeling te komen, op voorwaarde dat de steekproefomvang vrij groot is.

# 2 - Bemonsteringsverdeling van proportie

Dit heeft voornamelijk te maken met de statistieken die bij attributen zijn betrokken. Hier komt de rol van binominale distributie om de hoek kijken. Over het algemeen reageert het op de wetten van de binominale verdeling, maar naarmate de steekproefomvang toeneemt, wordt het meestal weer een normale verdeling.

# 3 - Student's T-Distribution

Dit type verdeling wordt gebruikt wanneer de standaarddeviatie van de populatie onbekend is bij de onderzoeker of wanneer de omvang van de steekproef erg klein is. Dit type verdeling is zeer symmetrisch en voldoet aan de voorwaarde van standaard normaalvariatie. Naarmate de steekproefomvang toeneemt, neigt zelfs T-verdeling zeer dicht bij de normale verdeling te komen.

# 4 - F-distributie

  • Wanneer de grotere variantie verplicht aanwezig is in de teller, vindt de F-verdeling zijn gebruik omdat de vrijheidsgraad ook de kritische waarden van F verandert, wat van toepassing is op zowel grote als kleine varianties. Dit kan worden berekend uit de beschikbare tabellen.
  • De vergelijking wordt gemaakt op basis van de gemeten waarde van F behorende bij de steekproefset en de waarde, die wordt berekend uit de tabel als de eerdere gelijk is aan of groter is dan de tabelwaarde, wordt de nulhypothese van de studie verworpen.

# 5 - Distributie van Chi-Square-formules

Dit type verdeling wordt gebruikt wanneer de gegevensset betrekking heeft op waarden die het optellen van de kwadraten omvatten. De verzameling kwadraatgrootheden behorende bij de variantie van steekproeven wordt opgeteld, en zo wordt een verdelingsspreiding gemaakt, die we chikwadraatverdeling noemen.

Belang

  • Dit is belangrijk omdat het het pad naar statistische inferentie vereenvoudigt. Bovendien kunnen analytische overwegingen worden gericht op een statische verdeling in plaats van op de gemengde probabilistische spreiding van elk gekozen monster.
  • Eliminatie van variabiliteit aanwezig in de statistiek wordt gedaan door deze verdeling te gebruiken.
  • Het geeft ons een antwoord over de waarschijnlijke uitkomsten die het meest waarschijnlijk zullen gebeuren.
  • Ze spelen een sleutelrol in inferentiële statistische studies, wat betekent dat ze een belangrijke rol spelen bij het maken van conclusies over de hele populatie.

Conclusie

  • Dit is de sleutel in statistieken omdat ze fungeren als een belangrijke richtlijn voor statistische inferentie. Ze begeleiden de onderzoeker, academici of statistici in feite over de spreiding van de frequenties, en signaleren een reeks gevarieerde waarschijnlijke uitkomsten die verder kunnen worden getagd met de hele populatie.
  • De belangrijkste factor die hierbij betrokken is, is het gemiddelde van de steekproef en de standaardfout, die ons, als we schattingen geven, ook helpen bij het berekenen van de steekproefverdeling. Er zijn verschillende soorten distributietechnieken, die elk op basis van het scenario en de dataset worden toegepast.

Interessante artikelen...