T-test (definitie, typen) - Stapsgewijze rekenvoorbeelden

Inhoudsopgave

Wat is een T-test?

Een T-test is een methode die wordt gebruikt om een ​​gevolgtrekking in statistieken af ​​te leiden, die bedoeld is om te achterhalen of er een groot verschil is tussen twee middelen waarbij de twee beschouwde groepen aan elkaar gerelateerd kunnen zijn.

Uitleg

  • Het is gericht op het testen van hypothesen, wat in feite wordt gebruikt om een ​​hypothese te testen die betrekking heeft op een bepaalde populatie. Een T-test houdt rekening met T-statistieken, T-verdelingswaarden en vrijheidsgraden, die worden gebruikt om de kans op verschil tussen twee gegevenssets te bepalen.
  • De basiswerking achter T-Test is dat het een steekproef van elk van de twee sets in overweging neemt en een probleemstelling opstelt door een nulhypothese te beschouwen waarin beide gemiddelden gelijk zijn.
  • Op basis van gelijkgestelde formules worden waarden getekend en vergeleken met de standaardwaarden, wat verder leidt tot acceptatie of verwerping van de nulhypothese. De afwijzing van de nulhypothese geeft aan dat de dataset vrij nauwkeurig is en niet toevallig.

Soorten T-Test

Er zijn voornamelijk vier soorten t-toetsen, die als volgt zijn:

# 1 - T-test voor 1 monster

Het is bedoeld om te testen of het gemiddelde van de beoogde waarde gelijk is aan het gemiddelde van een enkele populatie, bijv. Testen of het gemiddelde gewicht van studenten van klasse 5 meer dan 45 kg is

# 2 - T-test met twee monsters

Het is bedoeld om te testen of het gemiddelde van de beoogde waarde gelijk is aan het gemiddelde van twee onafhankelijke populaties, bijv. Testen of het gemiddelde gewicht van klas 5-jongens verschilt van klas 5-meisjes.

# 3 - Gepaarde T-test

Het is bedoeld om te testen of het gemiddelde van de beoogde waarde gelijk is aan het gemiddelde van de verschillen tussen de waarnemingen die afhankelijk zijn. Door bijvoorbeeld de cijfers van studenten voor en na het volgen van collegegeld voor elk vak te vergelijken, kunnen we vaststellen of het volgen van collegegeld significant genoeg is om de cijfers van studenten te verbeteren.

# 4 - T-test in regressie-output

Het houdt rekening met de coëfficiënt in de regressievergelijking en test in hoeverre deze verschilt van de nulwaarde. bijvoorbeeld of de score van het toelatingsexamen een belangrijke factor is om te bepalen of een student een goede eindscore behaalt.

Veronderstellingen van T-Test

  • De eerste aanname voor een t-test heeft betrekking op de meetschaal. Dit hangt samen met het feit of de schaal een continue of ordinale schaal volgt
  • De tweede aanname kan betrekking hebben op de willekeurige aard van de steekproef. Dit betekent dat de verzamelde gegevens puur willekeurig van aard moeten zijn.
  • De derde aanname kan zijn dat wanneer we de gegevens met betrekking tot de t-testverdeling plotten, deze een normale verdeling zouden moeten volgen en een klokvormige grafiek zouden moeten opleveren.
  • De vierde aanname kan zijn dat voor t-distributie en specifiek om een ​​vorm van de belcurve te verkrijgen, we een grotere steekproefomvang nodig hebben.
  • De uiteindelijke aanname kan zijn dat voor de t-toets. De variantie moet homogeen van aard zijn. e. de standaarddeviaties zijn nagenoeg gelijk.

Hoe te berekenen?

Het werkt in twee verschillende scenario's, namelijk een voor de onafhankelijke steekproef en een andere voor de afhankelijke steekproef.

# 1 - Onafhankelijk voorbeeldscenario

  • We moeten de som berekenen, de steekproefomvang, die wordt bepaald door "N", en de score voor het gemiddelde voor elk van de onafhankelijke steekproeven. Hierna moet voor elk onafhankelijk monster de vrijheidsgraad worden berekend.
  • Dit wordt weergegeven door de steekproef met één af te trekken, die we aanduiden als "n-1". Hierna moeten de variantie en standaarddeviatie worden berekend.
  • De vrijheidsgraden van de samples worden opgeteld, en dit wordt "df-total" genoemd. Vervolgens moeten we de vrijheidsgraad van elk monster vermenigvuldigen met de variantie van elk. We moeten de resultanten optellen en vervolgens het totaal delen door "df-total". Het verkregen resultaat wordt de gepoolde variantie genoemd.
  • De gepoolde variantie wordt vervolgens gedeeld door de n van de steekproeven. Het resultaat dat voor alle monsters is verkregen, wordt vervolgens toegevoegd. De vierkantswortel hiervan wordt genomen, en dit wordt de standaardfout van het verschil genoemd.
  • Ten slotte moeten we het lagere gemiddelde van de steekproef aftrekken van het grotere gemiddelde van de steekproef. Het verkregen verschil wordt vervolgens gedeeld door de standaardfout van het verschil en de verkregen resultaten worden de T-waarde genoemd.

# 2 - Afhankelijk voorbeeldscenario

  • De scores die zijn verkregen uit elk van de paren gegevensverzamelingen worden genoteerd en we moeten deze aftrekken. De verkregen verschillen worden opgeteld en aangeduid als "D." De verschillen van elk monster worden gekwadrateerd en opgeteld om een ​​resultaat te verkrijgen dat "D-Squared" wordt genoemd. Hierna moeten we de "N" of het aantal scores vermenigvuldigen met de "D-kwadraat".
  • Het verkregen resultaat wordt afgetrokken van het kwadraat van de totale "D". Dit resultaat wordt verder onderverdeeld met "N-1". De vierkantswortel van de resultante wordt verkregen en wordt een deler genoemd. Ten slotte moeten we de totale "D" delen door de deler, wat ons de uiteindelijke t-waarde geeft.

Voorbeelden van T-tests

Laten we eens kijken dat we scores hebben voor elk onderwerp in het examen voor twee termen.

Stap 1: trek fase 1 af van fase 2

Stap 2: Tel het verschil bij elkaar op, dwz -55

Stap 3: Vier de verschillen

Stap 4: Tel alle kwadraten met verschil op, dwz 983

Stap 5: Gebruik van de formule om de T-waarde te berekenen

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • T-waarde = -2,29

De verkregen T-waarde wordt vervolgens vergeleken met de T-waarde verkregen uit de tabel met behulp van p-waarde en vrijheidsgraad. Als de berekende t-waarde groter is dan de tabelwaarde op een specifiek vooraf gedefinieerd alfaniveau, kunnen we de nulhypothese verwerpen door te zeggen dat er een verschil is tussen de gemiddelden.

Wanneer het wordt gebruikt?

Dit wordt gebruikt om twee gemiddelden of verhoudingen te vergelijken. We gebruiken ook een t-toets wanneer de populatieparameters onbekend zijn voor de gebruiker. Er zijn grofweg drie gevallen van gebruik van een t-testscenario, die als volgt zijn:

  • Een onafhankelijke steekproef t-test wordt gebruikt wanneer we het gemiddelde van twee groepen willen vergelijken.
  • Een gepaarde sample t-test wordt gebruikt als we het gemiddelde van dezelfde groep willen vergelijken, maar op verschillende tijdstippen.
  • Een voorbeeld van een t-test wordt gebruikt wanneer we het gemiddelde van een individuele groep moeten vergelijken met een onbekend gemiddelde.

Gebruik van T-Test in Excel

  • In Excel is het allerbelangrijkste dat we nodig hebben de installatie van een add-in genaamd Data Analysis. Hierna moeten we naar "Data" op de menutab gaan en erop klikken. De optie "Gegevensanalyse" is daar zichtbaar.
  • Om een ​​T-test uit te voeren, hebben we onze gegevens in kolomvorm nodig. Als we op "Gegevensanalyse" klikken, krijgen we een aantal statistische tests die we kunnen uitvoeren, en uit de lijst moeten we een t-test kiezen en op "Ok" klikken.
  • Er verschijnt een dialoogvenster waarin we de gegevens voor spoor 1 in het vak met variabel bereik 1 moeten invoeren en ook de gegevens van proef 2 in het vak met variabel bereik 2. Standaard blijft de waarde van alpha 0,05, maar dit kan worden gewijzigd op basis van onze voorkeur. Als alles in orde is, klikt u op "OK".
  • We kunnen nu het resultaat van onze T-Test zien op het Excel-blad. De belangrijkste waarde om op te merken is de P-waarde. Voor wat we onze alfawaarde hebben geselecteerd, als onze P-waarde in Excel kleiner is dan de alfawaarde, kunnen we concluderen dat er een statistisch materieel verschil is tussen de gemiddelden van onze twee sets waarden.

Conclusie

De T-Test is gericht op het testen van hypothesen, die in feite wordt gebruikt om een ​​hypothese te testen die betrekking heeft op een bepaalde populatie. Het vertelt ons het significantieniveau van het verschil tussen de groepen, die doorgaans worden gemeten aan de hand van het gemiddelde. Hier ontdekken we in feite het verschil tussen populatiegemiddelden en een hypothetische waarde.

Interessante artikelen...