Regressie (betekenis, typen) - Wat is regressieanalyse?

Inhoudsopgave

Wat is regressie?

Regressieanalyse is een op statistieken gebaseerde meting die wordt gebruikt in financiën, beleggen, enz., Die tot doel heeft een relatie op te zetten tussen een afhankelijke variabele en andere reeksen onafhankelijke variabelen, en de belangrijkste focus is het bepalen van de sterkte van de bovenstaande relatie.

Toelichtingen

  • Laten we, om regressieanalyse in een lekenterm uit te leggen, aannemen dat een verkoopleider van een bedrijf zijn best doet om de verkoop van de volgende maand te voorspellen. Er zijn tal van factoren die de verkoop van het product stimuleren, gaande van het weer tot de nieuwe strategie van de concurrent, het festival en de verandering in de levensstijl van consumenten.
  • Dit is een methode om de verschillende factoren die de verkoop beïnvloeden, die de grootste impact hebben, op één lijn te brengen. Het kan helpen bij het beantwoorden van veel vragen, zoals wat de belangrijkste factoren zijn, welke factoren minder belangrijk zijn, wat de relatie is tussen deze factoren en vooral, wat is de zekerheid van deze factoren.
  • Deze factoren worden variabelen genoemd. De belangrijkste factor die we proberen te voorspellen, wordt de afhankelijke variabele genoemd, en de andere factoren die van invloed zijn op de afhankelijke variabele worden de onafhankelijke variabelen genoemd.

Formule

Eenvoudige lineaire regressieanalyse in Excel kan worden uitgedrukt als de onderstaande formule en meet de relatie tussen een afhankelijke variabele en een onafhankelijke variabele.

Y = een + bX + ϵ

Hier:

  • Y - Afhankelijke variabele
  • X - Onafhankelijke (verklarende) variabele
  • a - onderscheppen
  • b - Helling
  • ϵ - Residu (fout)

Hoe regressieanalyse te interpreteren?

Dit kan worden geïnterpreteerd door een eenvoudig scenario aan te nemen. Hier nemen we de relatie tussen de prijzen van de antiekverzameling die wordt geveild en de duur van de leeftijd. Hoe ouder een antiek wordt, hoe meer het opbrengt. Ervan uitgaande dat we gegevens hebben ingesteld voor de laatste 50 items die zijn geveild, kunnen we voorspellen wat de toekomstige veilingprijzen zullen zijn op basis van de leeftijd van het item. Met behulp van deze gegevens kunnen we een regressievergelijking maken.

De regressieformule die een relatie kan leggen tussen leeftijd en prijs is als volgt:

y = β0 + β1 x + fout
  • Hier is de afhankelijke factor Y. Y staat voor de prijs van elk te veilen item, terwijl de onafhankelijke factor X is, die de leeftijd bepaalt.
  • Parameters β0 en β1 zijn parameters die niet bekend zijn en zullen worden geschat door de vergelijking.
  • β0 is een constante die wordt gebruikt om de lineaire trendlijn te definiëren die de Y-as onderschept.
  • β1 is een constante die de omvang van de verandering in de waarde van de afhankelijke variabele laat zien als een gerelateerde functie van de verandering die impliciet voor de onafhankelijke variabelen is.
  • Dit wordt in feite de helling van de vergelijking genoemd. Wanneer de helling een voering is, betekent dit dat er een evenredige relatie is tussen leeftijd en prijs, en waar de helling omgekeerd is, betekent dit dat de relatie indirect evenredig is.
  • De fout kan worden gedefinieerd als de ruis of variatie in de doelvariabele en is willekeurig van aard.

Real-life voorbeelden van regressieanalyse

Laten we aannemen dat we een verband moeten leggen tussen de verkopen die hebben plaatsgevonden en het bedrag dat is uitgegeven aan advertenties met betrekking tot een product.

Over het algemeen kunnen we een positieve relatie zien tussen de verkoophoeveelheid en het bedrag dat aan advertenties wordt besteed. Door een eenvoudige lineaire regressievergelijking te combineren, hebben we:

Y = a + bX

Stel dat we de waarde krijgen als

Y = 500 + 30X

Interpretatie van het resultaat:

De voorspelde helling van 30 helpt ons te concluderen dat de gemiddelde verkoop $ 30 per jaar stijgt naarmate de uitgaven aan advertenties toenemen.

Soorten regressieanalyse

# 1 - Lineair

Dit kan worden uitgedrukt als de onderstaande formule en meet de relatie tussen een afhankelijke variabele en een onafhankelijke variabele.

# 2 - Polynoom

Bij deze methode wordt de analyse gebruikt om de relatie tussen afzonderlijke afhankelijke factoren en meerdere onafhankelijke variabelen te meten.

# 3 - Logistiek

Hier is de afhankelijke factor of variabele binair van aard. De onafhankelijke variabelen kunnen continu of binair zijn. Bij multinominale logistische regressie kunnen we het ons veroorloven om meer dan twee categorieën te hebben bij het kiezen van onze onafhankelijke variabele.

# 4 - Kwantiel

Dit is een additief concept van lineaire regressie en wordt voornamelijk gebruikt wanneer uitschieters en scheefheid in de gegevens aanwezig zijn.

# 5 - Elastisch net

Dit is handig wanneer men zeer sterk gecorreleerde onafhankelijke variabelen verwerkt.

# 6 - Regressie van hoofdcomponenten (PCR)

Dit is een techniek die toepasbaar is wanneer er te veel onafhankelijke variabelen zijn of er multicollineariteit in de gegevens bestaat

# 7 - Gedeeltelijke kleinste vierkanten (PLS)

Het is een tegenovergestelde methode van de hoofdcomponent waarbij we onafhankelijke variabelen hebben die sterk gecorreleerd zijn. Het is ook toepasbaar als er veel onafhankelijke variabelen zijn.

# 8 - Ondersteuning van Vector

Dit kan een oplossing bieden voor lineaire en niet-lineaire modellen. Het maakt gebruik van niet-lineaire kernelfuncties om de optimale oplossing voor niet-lineaire modellen te vinden.

# 9 - Rangorde

Het is van toepassing op de voorspelling van gerangschikte waarden. In principe is het geschikt wanneer de afhankelijke variabele ordinaal van aard is

# 10 - Poisson

Dit is van toepassing wanneer de afhankelijke variabele telgegevens heeft.

# 11 - Negatieve binominale waarde

Het is ook van toepassing om telgegevens alleen te beheren dat negatieve binominale regressie niet uitgaat van een verdeling van de telling met een variantie die gelijk is aan het gemiddelde, terwijl Poisson-regressie ervan uitgaat dat de variantie gelijk is aan het gemiddelde.

# 12 - Quasi Poisson

Het is een vervanging voor negatieve binominale regressie. Het is ook van toepassing op verspreide telgegevens. De variantie van een quasi-Poisson-model is een lineaire functie van het gemiddelde, terwijl de variantie van een negatief binominaal model een kwadratische functie is van het gemiddelde.

# 13 - Cox

Het wordt meer gebruikt voor het analyseren van time-to-event-gegevens.

Verschil tussen regressie en correlatie

  • Regressie stelt de relatie vast tussen een onafhankelijke variantie en een afhankelijke variabele waarbij beide variabelen verschillend zijn, terwijl correlatie de associatie of afhankelijkheid van twee variabelen bepaalt als er geen verschil is tussen beide variabelen.
  • Het belangrijkste doel van regressie is om een ​​best passende lijn te creëren en de schatting van één variabele wordt gedaan op basis van andere, terwijl in correlatie de lineaire relatie tussen twee variabelen aantoont.
  • Hierin schatten we de grootte van een bepaalde verandering in de herkende variabele (X) op de geschatte variabele (Y), terwijl, in correlatie, de coëfficiënt wordt gebruikt om te meten in hoeverre de twee variabelen samen bewegen.
  • Het is een proces van het schatten van de grootte van willekeurige onafhankelijke variabelen op basis van de grootte van een statisch afhankelijke variabele, terwijl correlatie ons helpt om een ​​bepaalde waarde te bepalen om de onderlinge afhankelijkheid tussen beide variabelen uit te drukken.

Conclusie

  • Bij regressieanalyse worden voornamelijk gegevens gebruikt om een ​​verband tussen twee of meer variabelen vast te stellen. Hier wordt aangenomen dat relaties die in het verleden bestaan, ook reflecteren in het heden of de toekomst. Weinigen beschouwen dit als een tijdsverschil tussen verleden en heden / toekomst.
  • Het is echter een veelgebruikte prognose- en schattingstechniek. Hoewel het om wiskunde gaat, wat voor veel gebruikers moeilijk kan zijn, is de techniek relatief eenvoudig te gebruiken, vooral als er een model beschikbaar is.

Interessante artikelen...