Skewness-formule is een statistische formule die een berekening is van de kansverdeling van de gegeven reeks variabelen en dezelfde kan positief, negatief of ongedefinieerd zijn.
Formule om scheefheid te berekenen
De term "scheefheid" verwijst naar de statistische metriek die wordt gebruikt om de asymmetrie te meten van een kansverdeling van willekeurige variabelen rond zijn eigen gemiddelde, en de waarde ervan kan positief, negatief of ongedefinieerd zijn. De berekening van de skewness-vergelijking gebeurt op basis van het gemiddelde van de verdeling, het aantal variabelen en de standaarddeviatie van de verdeling.
Wiskundig gezien wordt de scheefheidsformule weergegeven als,
Scheefheid = ∑ N ik (X ik - X) 3 / (N-1) * σ 3
waar
- X i = i de willekeurige variabele
- X = gemiddelde van de verdeling
- N = aantal variabelen in de distributie
- Ơ = standaard distributie
Berekening van scheefheid (stap voor stap)
- Stap 1: Vorm allereerst een gegevensverdeling van willekeurige variabelen, en deze variabelen worden aangeduid met X i .
- Stap 2: Bereken vervolgens het aantal variabelen dat beschikbaar is in de gegevensdistributie, en het wordt aangeduid met N.
- Stap 3: Bereken vervolgens het gemiddelde van de gegevensverdeling door de som van alle willekeurige variabelen van de gegevensverdeling te delen door het aantal variabelen in de verdeling. Het gemiddelde van de verdeling wordt aangegeven met X.

- Stap 4: Bepaal vervolgens de standaarddeviatie van de verdeling door de afwijkingen van elke variabele ten opzichte van het gemiddelde te gebruiken, dwz X i - X en het aantal variabelen in de verdeling. De standaarddeviatie wordt berekend, zoals hieronder weergegeven.

- Stap 5: Ten slotte wordt de scheefheid berekend op basis van de afwijkingen van elke variabele van het gemiddelde, een aantal variabelen en de standaarddeviatie van de verdeling, zoals hieronder weergegeven.

Voorbeeld
Laten we het voorbeeld nemen van een zomerkamp waarin 20 studenten bepaalde banen toebedden die ze uitvoerden om geld te verdienen om geld in te zamelen voor een schoolpicknick. Verschillende studenten verdienden echter een ander bedrag. Bepaal op basis van onderstaande informatie de scheefheid in de inkomensverdeling onder de studenten tijdens het zomerkamp.
Oplossing:
Het volgende zijn de gegevens voor de berekening van scheefheid.

Aantal variabelen, n = 2 + 3 + 5 + 6 + 4 = 20
Laten we het middelpunt van elk van de intervallen berekenen
- ($ 0 + $ 50) / 2 = $ 25
- ($ 50 + $ 100) / 2 = $ 75
- ($ 100 + $ 150) / 2 = $ 125
- ($ 150 + $ 200) / 2 = $ 175
- ($ 200 + $ 250) / 2 = $ 225
Nu kan het gemiddelde van de verdeling worden berekend als,


Gemiddelde = ($ 25 * 2 + $ 75 * 3 + $ 125 * 5 + $ 175 * 6 + $ 225 * 4) / 20
Gemiddelde = $ 142,50
De kwadraten van de afwijkingen van elke variabele kunnen als volgt worden berekend,
- ($ 25 - $ 142,5) 2 = 13806,25
- ($ 75 - $ 142,5) 2 = 4556,25
- ($ 125 - $ 142,5) 2 = 306,25
- ($ 175 - $ 142,5) 2 = 1056,25
- ($ 225 - $ 142,5) 2 = 6806,25
Nu kan de standaarddeviatie worden berekend met behulp van de onderstaande formule als,


ơ = ((13806,25 * 2 + 4556,25 * 3 + 306,25 * 5 + 1056,25 * 6 + 6806,25 * 4) / 20) 1/2
ơ = 61,80
De kubussen van de afwijkingen van elke variabele kunnen als volgt worden berekend,
- ($ 25 - $ 142,5) 3 = -1622234,4
- ($ 75 - $ 142,5) 3 = -307546,9
- ($ 125 - $ 142,5) 3 = -5359,4
- ($ 175 - $ 142,5) 3 = 34328,1
- ($ 225 - $ 142,5) 3 = 561515,6
Daarom zal de berekening van de scheefheid van de verdeling als volgt zijn:


= (-1622234,4 * 2 + -307546,9 * 3 + -5359,4 * 5 + 34328,1 * 6 + 561515,6 * 4) / ((20 - 1) * (61,80) 3 )
Scheefheid zal zijn -

Scheefheid = -0,39
Daarom is de scheefheid van de distributie -0,39, wat aangeeft dat de datadistributie ongeveer symmetrisch is.
Relevantie en gebruik van Skewness-formule
Zoals we al in dit artikel hebben gezien, wordt scheefheid gebruikt om de symmetrie van datadistributie te beschrijven of te schatten. Het is erg belangrijk vanuit het perspectief van risicobeheer, portefeuillebeheer, handel en prijsstelling van opties. De maat wordt "Skewness" genoemd omdat de geplotte grafiek een scheef beeld geeft. Een positieve skew geeft aan dat de extreme variabelen groter zijn dan skews. De gegevensverdeling is zodanig dat de gemiddelde waarde zodanig escaleert dat deze groter is dan de mediaan, wat resulteert in een scheefgetrokken gegevensset. Aan de andere kant geeft een negatieve scheeftrekking aan dat de extreme variabelen kleiner zijn, waardoor de gemiddelde waarde naar beneden gaat, wat resulteert in een mediaan die groter is dan het gemiddelde. Scheefheid stelt dus het gebrek aan symmetrie of de mate van asymmetrie vast.