Correlatieformule - Hoe te berekenen? (Stap voor stap)

Formule om de correlatie te berekenen

Correlatie is een statistische maat tussen twee variabelen en wordt gedefinieerd als de verandering van de hoeveelheid in de ene variabele die overeenkomt met de verandering in een andere en wordt berekend door optelling van het product van de som van de eerste variabele minus het gemiddelde van de eerste variabele in de som van de tweede variabele minus het gemiddelde van de tweede variabele gedeeld door geheel onder de wortel van het product van het kwadraat van de eerste variabele min het gemiddelde van de eerste variabele in de som van het kwadraat van de tweede variabele min het gemiddelde van de tweede variabele.

De waarde van correlatie is beperkt tussen -1 en +1 en kan als volgt worden geïnterpreteerd:

  • -1: Als het -1 is, staan ​​variabelen bekend als perfect negatief gecorreleerd. Dat betekent dat als een variabele in de ene richting beweegt, een andere in de tegenovergestelde richting beweegt.
  • 0: Dat betekent dat de variabele geen correlatie heeft.
  • +1: Als het +1 is, staan ​​variabelen bekend als perfect positief gecorreleerd. Beide variabelen bewegen zich in positieve richtingen.

Als we 2 variabele x en y hebben, kan de correlatiecoëfficiënt tussen 2 variabelen worden gevonden als:

Correlatiecoëfficiënt = ∑ (x (i) - gemiddelde (x)) * (y (i) -gemiddeld (y)) / √ (∑ (x (i) -gemiddeld (x)) 2 * ∑ (y (i) -gemiddelde (y)) 2 )

Waar,

  • x (i) = waarde van x in de steekproef
  • Gemiddelde (x) = gemiddelde van alle waarden van x
  • y (i) = waarde van y in de steekproef
  • Gemiddelde (y) = gemiddelde van alle waarden van y

Voorbeelden

Het is moeiteloos om de correlatie in Excel te berekenen. De syntaxis van de gebruikte functie is als volgt:

Correlatiecoëfficiënt = CORREL (array1, array2)

Voorbeeld 1

Laten we hetzelfde voorbeeld nemen dat we hierboven hebben genomen voor het berekenen van correlatie met Excel.

Oplossing:

Hieronder staan ​​de waarden van x en y:

De berekening is als volgt.

Basis Excel-formule = CORREL (matrix (x), matrix (y))

Coëfficiënt = +0,95

Omdat deze coëfficiënt dichtbij +1 ligt, zijn x en y dus zeer positief gecorreleerd.

Voorbeeld 2

Correlatie is vooral handig om de aandelenkoers van bedrijven te analyseren en op basis daarvan een aandelenportefeuille te creëren.

Laten we eens kijken naar de correlatie tussen Apple-aandelen en de Nasdaq-index op basis van de aandelenprestaties van het afgelopen jaar. Apple is een in de VS gevestigde multinational die gespecialiseerd is in IT-producten zoals iPod, iPad, Mac, enz.

Oplossing:

Hieronder vindt u het maandelijkse rendement van Apple- en Nasdaq-aandelen over het afgelopen jaar:

Laten we nu de waarden invoeren -

Correlatiecoëfficiënt = ∑ (x (i) - gemiddelde (x)). (Y (i) -gemiddelde (y)) / √ ∑ (x (i) -gemiddeld (x)) 2 ∑ (y (i) - gemiddelde (y)) 2

Correlatie tussen Apple en Nasdaq = 0.039 / (√0.0039)

Coëfficiënt = 0,62

Aangezien de correlatie tussen Apple en Nasdaq positief is, is Apple dus positief gecorreleerd met Nasdaq.

Voorbeeld # 3

Laten we nu eens kijken naar de correlatie tussen de Walmart- en Nasdaq-index op basis van de aandelenprestaties van het afgelopen jaar. Walmart is een in de VS gevestigd bedrijf dat een supermarktketen heeft.

Oplossing:

Hieronder vindt u de maandelijkse prestaties tussen Walmart en Nasdaq gedurende het afgelopen jaar-

Laten we nu de waarden in de formule invoeren -

Correlatiecoëfficiënt = ∑ (x (i) - gemiddelde (x)). (Y (i) -gemiddelde (y)) / √ ∑ (x (i) -gemiddeld (x)) 2 ∑ (y (i) - gemiddelde (y)) 2

Daarom is de berekening als volgt,

Correlatie tussen Walmart en Nasdaq = 0,0032 / (√ 0,0346 * 0,0219)

Coëfficiënt = 0,12

We kunnen zien dat Walmart en Nasdaq ook positief gecorreleerd zijn, maar niet zo veel in vergelijking met Apple-correlatie met Nasdaq.

Relevantie en gebruik

Een correlatiecoëfficiënt is nuttig bij het vaststellen van de lineaire relatie tussen twee variabelen. Het meet hoe een variabele beweegt in vergelijking met de beweging van een andere variabele. Het praktische gebruik van deze coëfficiënt is om de relatie te achterhalen tussen de beweging van de aandelenkoers en de algemene marktbeweging. De basis van deze analyse, een aandelenanalist, zal het aandeel van de aandelen omvatten om een ​​optimale portefeuille te creëren met een minimum aan risico. Ook in de data science is het handig om de relatie tussen 2 variabelen te achterhalen.

Ook wordt de correlatiecoëfficiënt zeer veel gebruikt voor het bestuderen van de constructvaliditeit van gegevens in factoranalyse. Het wordt veel gebruikt in regressieanalyse om de waarden van afhankelijke variabelen te voorspellen op basis van de relatie tussen afhankelijke en onafhankelijke variabelen. Deze vergelijking is erg handig bij kwantitatieve analyse om de aard van de relatie tussen verschillende variabelen te achterhalen. De basis van deze relatie, als een variabele geen verband houdt met andere variabelen, kan deze uit de lijst worden verwijderd.

Interessante artikelen...