Null-hypothese (definitie, voorbeelden) - Hoe te testen?

Wat is de formule voor de nulhypothese?

De nulhypothese gaat ervan uit dat de steekproefgegevens en de populatiegegevens geen verschil hebben, of in eenvoudige bewoordingen, het veronderstelt dat de bewering van de persoon over de gegevens of populatie de absolute waarheid is en altijd gelijk heeft. Dus zelfs als een steekproef uit de populatie wordt genomen, zal het resultaat van de studie van de steekproef hetzelfde zijn als de veronderstelling.

Het wordt aangeduid met H 0 (uitgesproken als 'H niet').

Hoe werkt het?

In de eerste claim van de nulhypothese wordt aangenomen dat de aanname waar is. Stel bijvoorbeeld dat er een claim is waarin staat dat het 30 dagen duurt om een ​​gewoonte te vormen. Daarom zal hier worden aangenomen dat het waar is totdat er enige statistische significantie is om te bewijzen dat onze veronderstelling onjuist is, en het geen 30 dagen duurt om een ​​gewoonte te vormen. Hypothesetesten is een vorm van een wiskundig model dat wordt gebruikt om de hypothese binnen een reeks betrouwbaarheidsniveaus te accepteren of te verwerpen.

Er zijn 4 stappen die in dit model moeten worden gevolgd.

  1. De eerste stap is het formuleren van de 2 hypothesen, namelijk de nulhypothese en de alternatieve hypothese, zodat er maar één gelijk kan hebben.
  2. De tweede stap betreft een strategie waarin verschillende methoden worden vermeld waarmee de gegevens zullen worden geanalyseerd.
  3. De derde stap bestaat uit het daadwerkelijk analyseren van de benodigde set gegevens om conclusies te kunnen trekken.
  4. De laatste en vierde stap is om de resultaten te analyseren en een beslissing te nemen om de hypothese te accepteren of te verwerpen.

Formule voor nulhypothese

' Formule voor nulhypothese (H 0 ): parameter = waarde'

Waar,

  • De parameter is de aanname of verklaring van de betrokken partij of persoon.

Een hypothese wordt getest aan de hand van het significantieniveau van de waargenomen gegevens voor het samenvatten van de theoretische gegevens. Voor het berekenen van de afwijking van de geclaimde gegevens kunnen we de formule gebruiken;

Afwijkingssnelheid = verschil tussen waargenomen gegevens en theoretische gegevens / theoretische gegevens.

Het meten van deviatie is slechts een hulpmiddel om het significantieniveau te bestuderen van de toestanden die worden geclaimd in de nulhypothesetest.

Voorbeelden van het testen van nulhypothesen

Concept 1: Null-hypothese moet een teken van gelijkheid hebben, of met andere woorden, deze hypothese betekent de aanname van geen verschil.

Voorbeeld 1

Een onderzoeksteam komt tot de conclusie dat als kinderen onder de 12 jaar een product met de naam 'ABC' consumeren, de kans op lengtegroei met 10% toenam. Maar door de steekproefgroeisnelheid te evalueren, gecontroleerd door een aantal kinderen te kiezen die het product 'ABC' consumeren, komt dit op 9,8% uit. Verklaar de nulhypothese in het gegeven geval.

Oplossing: in dit geval, als een aanname van een nulhypothese wordt genomen, zal het resultaat dat door de onderzoeker wordt geselecteerd, overeenkomen met de criteria;

H 0 : Parameter = waarde

Waarbij de door de onderzoeker gekozen parameter is dat er bij de consumptie van product 'ABC' door de kinderen onder de 12 jaar kans is op een toename van het groeipercentage met 10%.

De waarde van de parameter is @ 10%

Dus bij het aannemen van de nulhypothese, neemt de onderzoeker de waarde van parameter @ 10% zoals de aanname is aangenomen.

Concept 2: Niveau van significantie, zoals vermeld in de definitie, is het meten van de betrouwbaarheid van de feitelijke gegevens in vergelijking met de gegevens die worden verondersteld of geclaimd in de afgelegde verklaring.

Het significantieniveau kan worden getest door de deviatie in de waargenomen gegevens en de theoretische gegevens te waarderen.

Voorbeeld 2

In een onderzoek door de autoriteit van een bedrijfstak beweren ze dat bij een gemiddelde productie van 100 goederen de kans op de productie van een defect goed 1,5% is. Maar tijdens de studie van een genomen monster, komt de kans op de productie van fault good bijna 1,55% uit. Geef commentaar op de volgende situatie.

Oplossing

In het geval van de nulhypothesetest is het feit dat als de juiste wereld wordt aangenomen, de bewering van de autoriteit dat de kans op de productie van foutgoed 1,5% is voor de productie van elke 100 goederen.

In dit geval kan het significantieniveau worden gemeten door middel van deviatie.

De berekening van het afwijkingspercentage kan als volgt worden gedaan,

  • = (1,55% -1,50%) * 100 / 1,50%

Het afwijkingspercentage is -

  • Afwijkingspercentage = 3,33%
Uitleg

In dit voorbeeld komt de afwijking van de aangenomen parameter uit op 3,33%, wat binnen het acceptabele bereik ligt, dwz 1% tot 5%. De nulhypothese kan dus worden geaccepteerd, zelfs als de werkelijke waardering afwijkt van de aanname. Maar in het geval dat een dergelijke afwijking meer dan 5% of meer zou hebben bedragen (verschilt van voorwaarde tot voorwaarde), moest de hypothese worden afgewezen omdat de gemaakte aanname geen grond zou hebben om te worden gerechtvaardigd.

Concept 3: Er zijn veel verschillende manieren om de veronderstelde bewering te verifiëren in het geval van de 'nulhypothese'. Een van de methoden is om het gemiddelde van de genomen steekproef te vergelijken met het gemiddelde van de populatie. Waarbij de term 'gemiddelde' zou kunnen worden gedefinieerd als het gemiddelde van de waarde van de parameter op het aantal geselecteerde gegevens.

Voorbeeld # 3

Een organisatie van deskundigen beweerde na hun studie dat de gemiddelde werktijd van een werknemer werkzaam in de maakindustrie ongeveer 9,50 uur per dag bedraagt ​​voor een goede afronding van het werk. Maar een productiebedrijf genaamd XYZ Inc. beweerde dat het gemiddelde aantal gewerkte uren van hun werknemers minder is dan 9,50 uur per dag. Voor het bestuderen van de claim is een steekproef van 10 medewerkers genomen en hieronder wordt hun dagelijkse werktijd geregistreerd. Het gemiddelde van de geselecteerde steekproefgegevens is 9,34 uur per dag - opmerking over de claim door XYZ Inc.

Oplossing

Laten we de formule voor de nulhypothese nemen om de situatie te analyseren.

H 0 : Parameter = waarde dwz,

Waar,

  • Parameter die door de experts wordt gehanteerd, is 'gemiddeld werkuur van de werknemer werkzaam in een productiebedrijf'.

De waarde van de experts is 9,50 uur per dag.

  • Gemiddelde (gemiddelde) arbeidsduur van de bevolking = 9,50 uur per dag
  • Gemiddelde (gemiddelde) werkuren van de steekproef = 9,34 uur per dag

De berekening van het afwijkingspercentage kan als volgt worden gedaan,

  • = (9,50-9,34) * 100% / 9,50

Het afwijkingspercentage is -

  • Afwijkingspercentage = 1,68%
Uitleg

In het bovenstaande voorbeeld werd in de verklaring van de experts gesteld dat de gemiddelde arbeidsduur van een werknemer werkzaam in de maakindustrie 9,50 uur per dag bedraagt. Terwijl bij het onderzoek van de genomen steekproef de gemiddelde arbeidsduur uitkomt op 9,34 uur per dag. In het geval van de 'nulhypothese' wordt de bewering opgevat, of de bewering van de experts wordt als parameter beschouwd, en wordt aangenomen dat de waarde van de parameter ook 9,50 uur per dag is, zoals wordt beweerd door de bewering . Maar we kunnen zien dat na het bestuderen van de steekproef het gemiddelde uur minder blijkt te zijn dan het geclaimde uur. In het geval van een dergelijk vermoeden, wordt een dergelijke hypothese 'Alternatieve hypothese' genoemd.

Voordelen

  • Het biedt een logisch kader voor het testen van statistische significantie: het helpt om bepaalde hypothesen te testen met behulp van statistieken.
  • De techniek is beproefd en getest: de methode is de laatste tijd getest en het helpt om bepaalde aannames te bewijzen.
  • Een alternatieve hypothese, die het tegenovergestelde is van de nulhypothese, kan vaag zijn: als dit bijvoorbeeld zegt dat het rendement van onderlinge fondsen 8% is, dan is de alternatieve hypothese dat het rendement van het onderlinge fonds niet gelijk is aan 8%. Bij een tweezijdige toets kan worden aangetoond dat het rendement groter of kleiner is dan 8%.
  • Het weerspiegelt dezelfde onderliggende statistische redenering als betrouwbaarheidsintervallen: de P-waarde in Excel wordt gebruikt voor het testen van het betrouwbaarheidsinterval.

Nadelen

  • Het wordt vaak verkeerd begrepen en verkeerd geïnterpreteerd: soms is het moeilijk om de nulhypothese en een geschikte alternatieve hypothese te formuleren. Dit is de eerste stap en als het mislukt, loopt het hele experiment van het analyseren van de hypothese mis.
  • P-waardetest is niet informatief in vergelijking met betrouwbaarheidsinterval: het betrouwbaarheidsinterval van 5% is meestal niet significant.
  • Dit is bijna altijd onwaar: bijna altijd proberen we te bewijzen dat er statistische significantie is om de nulhypothese te verwerpen. In zeer weinig gevallen wordt deze hypothese aanvaard.

Relevantie en gebruik

De nulhypothese wordt voornamelijk gebruikt voor het verifiëren van de relevantie van statistische gegevens die als steekproef zijn genomen in vergelijking met de kenmerken van de hele populatie waaruit een dergelijke steekproef is genomen. In eenvoudige bewoordingen: als er een aanname is gedaan voor de populatie via de geselecteerde steekproefgegevens, wordt de nulhypothese gebruikt om dergelijke aannames te verifiëren en de significantie van de steekproef te evalueren.

De nulhypothese wordt over het algemeen ook gebruikt om het verschil tussen de alternatieve procedures te verifiëren. Laten we bijvoorbeeld zeggen dat er twee manieren zijn om ziekten te behandelen, en er wordt beweerd dat de ene meer effecten heeft dan de andere. Maar de nulhypothese veronderstelt dat de effecten van beide behandelingen hetzelfde zijn, en dan wordt er onderzoek gedaan om de significantie van een dergelijke aanname en de variantie ervan te vinden.

Interessante artikelen...