Regressiecoëfficiënten: berekening en uitleg
In de statistiek zijn regressiecoëfficiënten van groot belang. De coëfficiënten bij regressie kunnen bepaald worden door middel van het computerprogramma SPSS maar kunnen ook met de hand worden berekend. De regressiecoëfficiënten zijn de zogenaamde B's in een vergelijking. Hoe bereken je de regressiecoëfficiënten en wat houdt het precies in? Lees in dit artikel over de verschillende coëfficiënten bij een regressie-analyse en over de onafhankelijke variabelen en afhankelijke variabele. Wat moet je weten bij regressie-analyse? Ontdek het hier!
De regressiecoëfficiënten
Als eerste kijken we naar een vergelijking die we vaak zien bij regressie: een multipele en enkelvoudige regressie vergelijking. Bij enkelvoudige regressie is er sprake van maar één onafhankelijke variabele (X) die zoveel mogelijk variantie probeert te verklaren op de afhankelijke variabele (Y). Bij enkelvoudige regressie heb je twee regressiecoëfficiënten: B0 (intercept of constante) en B1 (helling).
Multipele regressie
Wanneer er sprake is van meervoudiige of multipele regressie, dan is er sprake van meerdere onafhankelijke variabelen in een model. In de meeste gevallen is er sprake van multipele regressie. De meeste onderzoeksvragen bevat namelijk meer dan één variabele die variantie in de afhankelijke variabele proberen te verklaren. Hoe meer onafhankelijke variabelen je in het model stopt, hoe groter de verklaarde variantie in de meeste gevallen zal zijn. Toch is het niet altijd even verstandig om zoveel mogelijk onafhankelijke variabelen in het model te stoppen. Er is namelijk al snel sprake van multicollineariteit.
Bij multipele regressie zijn de B's voor de waarden van de X'en de regressiecoëfficiënten. Bij enkelvoudige regressie ziet de geschatte enkelvoudige regressievergelijking er als volgt uit:
- Y(dakje) = B0 + BYX X
De afhankelijke variabele wordt weergegeven met een Y(dakje). De constante (of intercept) wordt weergegeven met B0 en is een vaste waarde. De constante is de geschatte waarde voor Y als X de waarde 0 heeft. BYX is in de vergelijking de helling (ook wel slope genoemd).
Hoe bereken je de consante B0?
Een vergelijking is natuurlijk heel leuk, maar hoe kom je aan de waarden die in de vergelijking zitten? Om te beginnen kijken we naar de constante van een model. De constante is het eerste (of laatste) getal en wordt meestal weergegeven als B0. Het kan voorkomen dat de constante niet direct na de vergelijking te zien is. Sommige mensen zetten de constante liever aan het einde van een vergelijking. De constante kan berekend worden met de volgende formule:
- B0 = MY - BYX * MX
Hier staat dat de constante berekend wordt door het gemiddelde van Y te nemen (MY). Dit getal trek je van de helling (BYX) af die vermenigvuldigd is met het gemiddelde van X (MX).
Hoe bereken je de helling BYX?
De helling (of slope) in een model is B1 of BYX. De B staat voor de eerste X en is dus een regressiecoëfficiënt. De helling kun je ook met de hand berekenen. Je berekent de helling met de volgende formule:
- BYX = rYX * (sdY / sdX)
Hier staat dat je sowieso drie waarden nodig hebt om de helling te berekenen. Als eerste heb je de correlatie nodig tussen de Y en de X. Ten tweede en derde heb je de standaarddeviatie nodig van zowel de Y als de X.
De notatie van een multipel regressiemodel
Wanneer er meer dan één onafhankelijke variabele in het model is opgenomen is er sprake van multipele regressie. Het model bevat nu meer dan één onafhankelijke variabele. Het model wordt als volgt genoteerd (bij 2 X'en):
- Y(dakje) = B0Y.12 + BY1.2X1 + BY2.1X2
De B's in de vergelijking worden de partiële regressiecoëfficiënten genoemd.
De gestandaardiseerde regressie coëfficiënten
In een meervoudig regressiemodel kun je de hellingen als volgt berekenen.
- BY1.2 = βY1.2 * (sdY / sd1)
De βY1.2 is een gestandaardiseerde regressie coëfficiënt. Deze waarde kun je berekenen met de volgende formule:
- βY1.2 = rY1 - rY2r12 / 1 - r212
Een SPSS tabel begrijpen
Als er gebruik gemaakt wordt van SPSS is het belangrijk om te begrijpen wat er precies in een tabel staat. In de meeste gevallen worden de regressiecoëfficiënten berekend. De coëfficiënten worden dan beknopt weergegeven in een tabel. Een SPSS tabel kan als volgt worden weergegeven. Een SPSS tabel is leuk, maar wat staat er nou precies in. Welke waarden zijn belangrijk?
Model | B | std. Error | Bèta | t | sig. |
1. Constante | 45674.544 | 456.432 | |||
Intelligentie | 189.457 | 234.455 | 0.345 | 2.174 | 0.056 |
Leeftijd | 34.987 | 123.567 | 0.234 | 0.876 | 0.458 |
De B-waarden die worden weergegeven zijn de gewichten (regressiegewichten). De bèta waarden kunnen worden gebruikt om de B-waarden te berekenen met de formules die boven zijn weergegeven.