Hiërarchische regressie: Forward, Backward en Stepwise
Bij regressie is het belangrijk om te kijken naar de manier waarop variabelen worden toegevoegd aan het model. Bij hiërarchische regressie zijn er een aantal mogelijkheden: forward, backward en stepwise. Elke mogelijkheid is uniek en is toepasbaar op een specifieke statistische situatie. Wat is precies de betekenis van elke mogelijkheid en hoe is dat te zien in SPSS. Wat zijn de voordelen van elke methode en zijn er ook nadelen? Hoe kun je hiërarchische regressie herkennen?
Hiërarchische regressie in statistiek
Bij automatische hiërarchische regressie zijn er drie methoden: forward, backward en stepwise. De drie methoden worden veel gebruikt. Hiërarchische regressieanalyse is iets anders dan simultane regressieanalyse. Bij simultane regressie worden alle onafhankelijke variabelen in één keer in het model gestopt. De uitomsten worden dan vaak in één tabel weergegeven. Bij hiërarchische regressie werkt het anders. Er zijn in dat geval meer modellen zichtbaar in SPSS omdat er keuzes worden gemaakt.
Forward analyse
Bij forward hiërarchische analyse wordt er specifiek gekeken naar de onafhankelijke variabelen die je hebt. Je begint met een leeg model en maakt dan een keuze uit de variabelen. Je stopt één voor één de variabelen in het model en kijkt naar de uitkomsten. Het is bijvoorbeeld mogelijk dat je de volgende onafhankelijke variabelen hebt:
- Geslacht
- Leeftijd
- Intelligentie
- Lengte
- Oogkleur
Als alle variabelen in één keer in het model worden gestopt spreek je van simultane regressie. Vaak wil je niet alle variabelen in één keer in het model stoppen en wil je de effecten per onafhankelijke variabele weten. Je kunt dan voor forward analyse kiezen. Het statistiekprogramma SPSS zal bij een Forward analyse eerst de variabele toevoegen die de grooste (semi-)partiële correlatie heeft met de afhankelijke variabele (Y). Een forward analyse stopt als er geen variabelen meer zijn of als er geen variabele meer is die een significante bijdrage kan leveren aan het model. Een forward analyse bij de bovenstaande onafhankelijke variabelen kan er dus als volgt uit zien:
- Leeftijd
- Leeftijd, Geslacht
- Leeftijd, Geslacht, Lengte
- Oogkleur en Intelligentie (niet significant, dus niet opgenomen)
Backward analyse
Bij backward analyse werkt het precies andersom dan bij forward analyse. SPSS zal nu eerst alle variabelen in het model stoppen en steeds de variabele uit het model halen die de kleinste (semi-)partiële correlatie heeft. SPSS haalt alleen de variabele uit het model als deze niet meer significant is. Als een variabele nog wel significant is (en een kleine sem-partiële correlatie heeft) dan blijft deze in het model en stopt de backward analyse. SPSS kan bij een backward analyse dus het volgende laten zien:
- Leeftijd, Geslacht, Lengte, Oogkleur, Intelligentie
- Leeftijd, Geslacht, Lengte, Oogkleur
- Leeftijd, Geslacht, Lengte
Een voordeel van het gebruik van een backward analyse is dat de verklaarde variantie vaak hoog is. Een nadeel is dat er vaak een zeer complex model wordt gegenereerd. Een Backward analyse zal de hoogste totale verklaarde variantie laten zien.
Stepwise analyse
Als zowel de forward analayse als de backward analyse wordt gecombineerd in SPSS kom je uit bij de stepwise analyse. Het statistiek programma SPSS zal eerst een forward analyse uitvoeren. Bij een forward houd je dus een aantal onafhankelijke variabelen over. Vervolgens gaat SPSS een backward anayse uitvoeren en verwijdert de variabelen met de kleinste correlatie die ook niet significant zijn. Het resultaat is een uitgekleed model dat ook tegelijk het meest simpel is. Een model dat is uitgevoerd met de Stepwise analyse zal de laagst verklaarde variantie hebben.