Partiële en semi-partiële correlatie: wat is het verschil?
In de statistiek wordt vaak gebruik gemaakt van de partiële en semi-partiële correlaties. Twee termen die we vaak terug vinden bij regressie-analyse. Wat is precies de betekenis van de twee soorten correlaties en hoe moeten we deze twee dan interpreteren? Zijn de partiële en semi-partiële correlaties ook terug te vinden in het computerprogramma SPSS? Wat valt er allemaal te zeggen over correlaties, regressie-analyse en in het bijzonder de partiële en semi-partiële correlatie in de statistiek. Ontdek de verschllen en de overeenkomsten in dit artikel.
Correlaties bij regressie analyse
Wie het over statistiek heeft komt bijna automatisch wel uit bij twee termen die heel belangrijk zijn bij de analyse van gegevens. Deze twee termen hebben alles te maken met de correlaties. Een correlatie is een ander woord voor samenhang tussen twee gegevens. In de statistiek wordt vaak gebruik gemaakt van de afhankelijke variabele (Y) en onafhankelijke variabelen (X). De correlatie tussen de X en de Y is belangrijk. Je zou bijna kunnen zeggen dat heel de statistiek om correlaties draait.
Een regressie analyse
Wetenschappers die data of gegevens verzamelen proberen logische en juiste conclusies te trekken op basis van die gegevens. Deze conclusies worden getrokken op basis van statistische principes. Zonder de statistiek is het bijna niet mogelijk om wiskundig juiste conclusies te trekken. Conclusies die te valideren zijn. Een belangrijk model in de statistiek is het regressie model (regressie analyse). Bij regressie analyse proberen onafhankelijke variabelen zoveel mogelijk variantie te verklaren uit de afhankelijke variabele.
Semi-partiële correlatie
Wanneer er meerdere onafhankelijke variabelen in een model zitten proberen deze variabelen allemaal een uniek deel van de afhankelijke variabele te verklaren. Het unieke deel dat correleert tussen de X en de Y wordt de semi-partiële correlatie genoemd. Het gaat specifiek en alleen om het unieke deel dat verder niet correleert met overige onafhankelijke variabelen. Vaak is het namelijk zo dat verschillende onafhankelijke variabelen (X’en) onderling ook samenhang vertonen. Deze onderlinge correlatie tussen de X’en wordt multicollineariteit genoemd. Als we het hebben over de semi-partiële correlatie is de samenhang met de overige X’en verwijderd. In SPSS wordt de semi-partiële correlatie weergegeven als PART.
Partiële correlatie
De partiële correlatie is net iets anders. Het gaat in dit geval niet om een waarde van het unieke deel maar om de proportie. Het gaat dus om het deel dat uniek verklaard is in het totale deel dat verklaard kan worden (de Y) zonder het deel (of de delen) dat verklaard kan worden door overige onafhankelijke variableen. Als er dus meerdere X'en in het model zitten moet de overlap (correlatie) met de Y niet meegerekend worden. In SPSS wordt de partiële correlatie weergegeven als PARTIAL. In een geschat regressie model (estimated regression model) zijn de B waarden partiële regressie coëfficiënten.
Verschil tussen de correlaties
Zoals gezegd gaat het bij de semi-partiële correlatie om een uniek deel tussen de X en de Y. Bij de partiële correlatie gaat het om de proportie. Hoe moet je dat nou begrijpen? Met een simpel rekenvoorbeeld is direct te zien hoe de twee correlaties van elkaar verschillen:
- Stel dat de totale variantie in Y een waarde van 0.60 heeft
- De semi-partiële correlatie tussen X1 en Y is bijvoorbeeld 0.20 (het unieke deel)
- De partiële correlatie tussen X1 en Y is bijvoorbeeld (0.20 / 0.80) = 0.25
- De partiële correlatie geeft dus de proportie weer!
- De partiële correlatie is bijna altijd groter dan de semi-partiële correlatie. De partiële correlatie kan in elk geval niet kleiner zijn dan de semi-partiële correlatie