Linjär regression i R
Jag har en datamängd med fyra variabler, tjära (tar), nikotin (nico), vikt (wight) och kolmonoxid (CO) för 25 stycken Amerikanska cigarettmärken. Jag har skapat både enkel linjär regression samt multilinjär regression för dessa i R men då resultatet inte blev pålitligt vill jag söka förklaringen till detta genom att plotta alla variabler parvis mot varandra, vilket jag har gjort nedan.
Jag ska nu hitta en observation som är tvivelaktig att ha med i regressionerna och ta bort detta från den givna datan för att sedan göra om regressionerna på den reducerade datamängd för vilken den tvivelaktiga observationen har tagits bort.. Men hur ska jag tolka denna plot? Det enda jag kan finna är att tar och nic verkar vara kollineära men detta är väl inte en observation som jag kan ta bort från datan? Isf måste jag väl föra en multilinjär regression två gånger varvid variablerna tar och nico inte ska vara i samma, men detta verkar inte vara korrekt. Tack på förhand!
Du har en observation som ligger uppe i högra hörnet hela tiden.
Den är det nog värt att titta närmre på. En extremcigg.
Smutsmunnen skrev:Du har en observation som ligger uppe i högra hörnet hela tiden.
Den är det nog värt att titta närmre på. En extremcigg.
Tack! Jag la märke till denna med, men bör då även inte den längst ner i det vänstra hörnet vara en observation som avviker/är tvivelaktig då med?
Jo det har du rätt i.