Aangepaste R-kwadraat (betekenis, formule) - Bereken gecorrigeerde R ^ 2

Wat is Aangepaste R-kwadraat?

Aangepast R-kwadraat verwijst naar de statistische tool die investeerders helpt bij het meten van de omvang van de variantie van de variabele die afhankelijk is en die kan worden verklaard met de onafhankelijke variabele, en houdt rekening met de impact van alleen die onafhankelijke variabelen die een impact hebben op de variatie van de afhankelijke variabele.

Aangepaste R-kwadraat of gemodificeerde R 2 bepaalt de mate van variantie van de afhankelijke variabele, die kan worden verklaard door de onafhankelijke variabele. De specialiteit van de gemodificeerde R 2 is dat het niet de impact van alle onafhankelijke variabelen meetelt, maar alleen die welke de variatie van de afhankelijke variabele beïnvloeden. De waarde van de gewijzigde R 2 kan ook negatief zijn, hoewel deze meestal niet negatief is.

Aangepaste formule R-kwadraat

De formule om het aangepaste R-kwadraat van regressie te berekenen, wordt als volgt weergegeven,

R 2 = ((1 / N) * Σ ((xi - x) * (Yi - y)) / (σx * σy)) 2

Waar

  • R 2 = aangepast R-kwadraat van de regressievergelijking
  • N = aantal waarnemingen in de regressievergelijking
  • Xi = onafhankelijke variabele van de regressievergelijking
  • X = gemiddelde van de onafhankelijke variabele van de regressievergelijking
  • Yi = afhankelijke variabele van de regressievergelijking
  • Y = gemiddelde van de afhankelijke variabele van de regressievergelijking
  • σx = standaarddeviatie van de onafhankelijke variabele
  • σy = standaarddeviatie van de afhankelijke variabele.

Houd er rekening mee dat

Om het in Excel te berekenen, moeten de variabelen y en x in Excel worden opgegeven, en Excel genereert de volledige uitvoer samen met Aangepaste R 2. Het is een bijzonder geval waarin het moeilijk is om het werk in tekstformaat aan te bieden, in tegenstelling tot andere formules.

Interpretatie

Aangepast R-kwadraat bepaalt de mate van variantie van de afhankelijke variabele, die kan worden verklaard door de onafhankelijke variabele. Door naar de aangepaste R 2-waarde te kijken, kan men beoordelen of de gegevens in de regressievergelijking goed passen. Hoe hoger de aangepaste R 2, hoe beter de regressievergelijking, aangezien het impliceert dat de onafhankelijke variabele wordt gekozen om de afhankelijke variabele te bepalen, de variatie in de afhankelijke variabele kan verklaren.

De waarde van de gewijzigde R 2 kan ook negatief zijn, hoewel deze meestal niet negatief is. In het aangepaste R-kwadraat gaat de waarde van het aangepaste R-kwadraat alleen omhoog met de toevoeging van een onafhankelijke variabele wanneer de variatie van de onafhankelijke variabele de variatie in de afhankelijke variabele beïnvloedt. Dit is niet van toepassing in het geval van R 2, alleen relevant voor de waarde van gecorrigeerde R 2.

Voorbeelden

Voorbeeld 1

Laten we proberen het concept van aangepaste R 2 te begrijpen met behulp van een voorbeeld. Laten we proberen te achterhalen wat de relatie is tussen de afstand die de vrachtwagenchauffeur aflegt en de leeftijd van de vrachtwagenchauffeur. Iemand voert een regressievergelijking uit om te valideren of wat hij vindt van de relatie tussen twee variabelen ook gevalideerd wordt door de regressievergelijking.

In dit specifieke voorbeeld zullen we zien welke variabele de afhankelijke variabele is en welke variabele de onafhankelijke variabele is. De afhankelijke variabele in deze regressievergelijking is de afstand die de vrachtwagenchauffeur aflegt, en de onafhankelijke variabele is de leeftijd van de vrachtwagenchauffeur. Door een regressie uit te voeren met de variabelen, kregen we het aangepaste R-kwadraat op 65%. De onderstaande momentopname toont de regressie-uitvoer voor de variabelen. De dataset en de variabelen worden gepresenteerd in het bijgevoegde Excel-blad.

De aangepaste R 2-waarde van 65% voor deze regressie houdt in dat de onafhankelijke variabele 65% van de variatie in de afhankelijke variabele verklaart. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt, die het dichtst bij 100% ligt.

Voorbeeld 2

Laten we proberen het concept van aangepast R-vierkant te begrijpen met behulp van een ander voorbeeld. Laten we proberen erachter te komen wat de relatie is tussen de lengte van de studenten van een klas en het GPA-cijfer van die studenten. In dit specifieke voorbeeld zullen we zien welke variabele de afhankelijke variabele is en welke variabele de onafhankelijke variabele is. De afhankelijke variabele in deze regressievergelijking is de GPA van de studenten en de onafhankelijke variabele is de lengte van de studenten.

Door een regressie uit te voeren met de variabelen, is de aangepaste R 2 verwaarloosbaar of negatief. De onderstaande momentopname toont de regressie-uitvoer voor de variabelen. De dataset en de variabelen worden gepresenteerd in het bijgevoegde Excel-blad.

De aangepaste R 2-waarde is verwaarloosbaar voor deze regressie, wat inhoudt dat de onafhankelijke variabele de variatie in de afhankelijke variabele niet verklaart. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt, die het dichtst bij 100% ligt.

Interpretatie

Aangepast R-vierkant is een belangrijke output om erachter te komen of de dataset goed past of niet. Iemand voert een regressievergelijking uit om te valideren of wat hij vindt van de relatie tussen twee variabelen ook gevalideerd wordt door de regressievergelijking. Hoe hoger de waarde, hoe beter de regressievergelijking, aangezien dit impliceert dat de onafhankelijke variabele die is gekozen om de afhankelijke variabele te bepalen, op de juiste manier wordt gekozen. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt, die het dichtst bij 100% ligt.

Interessante artikelen...