3 svar
90 visningar
lund behöver inte mer hjälp
lund 529
Postad: 17 sep 2022 14:32 Redigerad: 17 sep 2022 14:34

Linjär regression i R

Jag har en datamängd med fyra variabler, tjära (tar), nikotin (nico), vikt (wight) och kolmonoxid (CO) för 25 stycken Amerikanska cigarettmärken. Jag har skapat både enkel linjär regression samt multilinjär regression för dessa i R men då resultatet inte blev pålitligt vill jag söka förklaringen till detta genom att plotta alla variabler parvis mot varandra, vilket jag har gjort nedan.

Jag ska nu hitta en observation som är tvivelaktig att ha med i regressionerna och ta bort detta från den givna datan för att sedan göra om regressionerna på den reducerade datamängd för vilken den tvivelaktiga observationen har tagits bort.. Men hur ska jag tolka denna plot? Det enda jag kan finna är att tar och nic verkar vara kollineära men detta är väl inte en observation som jag kan ta bort från datan? Isf måste jag väl föra en multilinjär regression två gånger varvid variablerna tar och nico inte ska vara i samma, men detta verkar inte vara korrekt. Tack på förhand!

Smutsmunnen 1050
Postad: 17 sep 2022 14:57

Du har en observation som ligger uppe i högra hörnet hela tiden.

Den är det nog värt att titta närmre på. En extremcigg.

lund 529
Postad: 17 sep 2022 22:44
Smutsmunnen skrev:

Du har en observation som ligger uppe i högra hörnet hela tiden.

Den är det nog värt att titta närmre på. En extremcigg.

Tack! Jag la märke till denna med, men bör då även inte den längst ner i det vänstra hörnet vara en observation som avviker/är tvivelaktig då med?

Smutsmunnen 1050
Postad: 18 sep 2022 10:21

Jo det har du rätt i.

Svara
Close