Statistisk undersøgelse af residualer
Residualer er ugrupperede observationer
Når vi laver lineær regression, så kan vi beregne et residual for hvert punkt. Residualet beskriver, hvor langt punktet er fra regressionslinjen.
Residualerne udgør et ugrupperet datasæt, og vi kan derfor undersøge dem med de statistiske metoder, vi bruger til at behandle ugrupperede observationer.
Andelen af residualer i intervallet [-2s;2s]
Som tommelfingerregel skal 95% af residualerne ligge inden for 2 residualspredninger. Residualspredningen kaldes s. Dermed skal ca. 95% af residualerne ligge i intervallet [-2s;2s]. Ca. 5% af residualerne vil derfor ligge uden for intervallet [-2s;2s].
Det er typisk nemmest at bestemme andelen af residualer, der ligger uden for intervallet [-2s;2s]. Vi kan derefter bestemme andelen af residualer, der ligger i intervallet [-2s;2s] ved at trække andelen af residualer uden for intervallet fra 100%. Hvis fx 4% af residualerne ligger uden for intervallet [-2s;2s], så ligger 96% af residualerne i interv...