Standardavvikelse Kvantiativ metod (Sjuksköterska)
Hej!
Försöker att lära mig att skriva om standardavvikelser. Jag är helt nollställd på vad det betyder. Har fått en formel som lyder:
Och en uppgift där jag ska göra en standardavvikelse:
"Pulsfrekvensen mättes på 11 studenter. Följande värden erhölls: 59, 60, 64, 60, 76, 72, 56, 72, 80, 64 respektive 80 slag per minut."
Hur gör jag? Förklara helst begrepp med och vad ni gör så man förstår :)
Börja med att räkna ut medelvärdet. Detta betecknas
Räkna ut skillnaden mellan varje mätvärde och medelvärdet. Detta betecknas .
Kvadrera skillnaden. Detta betecknas .
Addera alla de kvadrerade skillnaderna. Detta betecknas .
Nu har du nästan bara kvar att beräkna rotuttrycket. Där betyder n antalet mätvärden, d v s 11.
Multiplicera ihop så har du fått fram standardavvikelsen s.
Var det här en begriplig förklaring? Jag berättar bara hur du skall göra, inte varför, för jag gissar att du inte är intresserad av det. ;-)
Till att börja med görs ett antagande om att din data är fördelad med underliggande väntevärde och standardavvikelse .
Vi känner varken väntevärdet eller standardavvikelsen, och använder datan för att skatta dessa med medelvärdet och stickprovsstandardavvikelsen .
Medelvärdet beräknas genom att addera alla värden för att sedan dela på antalet värden,
Och stickprovsstandardavvikelsen,
Smaragdalena du får gärna förklara varför med :)
Till att börja med vill jag tacka pi-streck=en-halv för påpekandet att vi börjar med att gissa att din data är normalfördelad. Det betyder att det är vanligast med mätvärden som ligger i närheten av medelvärdet, och att det är lika vanligt med t ex 5 steg över medel som 5 steg under.
Dataserierna 5, 10, 15 och 9,10, 11 har båda samma medelvärde (10) men har olika spridning. Hur kan man visa detta? Att bara summera ihop skillnaderna mellan varje mätvärde och medelvärdet ger alltid resultatet 0, så det fungerar inte. Om man kvadrerar skillnaderna innan man adderar dem, blir alla termerna positiva, och det verkar rimligt att dividera med antalet mätvärden. Den första serien får en större varians (som det heter) än den andra. Standardavvikelsen är roten ur variansen - rot-tecknet skall gå längre åt höger än vad du har skrivit, man skall dra roten ur alltihop (så det jag skrev innan var fel). Anledningen till att man skall dela med (n-1), inte n, kommer jag inte ihåg.
Jag kommer inte heller ihåg detaljerna, men anledningen till att man dividerar med istället för har att göra med att man vill ha en så kallad väntevärdesriktig skattning av variansen, (standardavvikelsen i kvadrat). En väntevärdesriktig skattning är sådan att "dess väntevärde är lika med värdet på den sökta parametern". För variansen används tydligen Bessel's correction.
Ett annat sätt att se på det är att vi ska skatta en parameter (standardavvikelsen) med stycken oberoende mätvärden (antal frihetsgrader). Men, i formeln för stickprovsstandardavvikelsen ingår en skattning av väntevärdet (medelvärdet), och då använder vi samma antal mätvärden . När vi beräknade medelvärdet användes en frihetsgrad, i.e. termerna i stickprovsvariansen är inte oberoende. Alla termer innehåller samma skattning av väntevärdet (medelvärdet).
Säg att man har tre stycken mätvärden där man vet datavärde och och att medelvärdet av de tre datavärdena är
Då måste det tredje datavärdet vara 3.1; man är alltså fri att variera 2 stycken datavärden.
Förklaringarna hittills har varit heltäckande såvitt jag kan se, så jag kastar in en extra kommentar om de här begreppen "standardavvikelse" och "varians".
För att lösa uppgifter behöver man förstås ha koll på detaljerna, men för den övergripande förståelsen röstar jag för att hålla huvudet kallt och inte gräva ned sig för snabbt. Även om varians och standardavvikelse definitivt har långtgående förankring i naturvetenskapen så representerar de ofta bara ett vettigt försök att bedöma spridningen i en samling data. Ungefär som när Smaragdalena resonerar kring olika sätt att visa spridningen, och landar i att en summering av kvadraterna kanske kan vara rimligt.
Man använder varians- och standardavvikelsemått i mängder av områden. Ett hyfsat udda område är när man tittar på hur "slagiga" olika aktiekurser är. Då räknar man ut standardavvikelsen av dagsavkastningarna, och kallar det spridningsmåttet för "realiserad volatilitet". Det underliga där är att avkastningar inte är normalfördelade, så varför använder man ändå standardavvikelsen? Jo, för att det är ett välkänt och ganska vettigt spridningsmått ändå =)
foppa skrev :Förklaringarna hittills har varit heltäckande såvitt jag kan se, så jag kastar in en extra kommentar om de här begreppen "standardavvikelse" och "varians".
För att lösa uppgifter behöver man förstås ha koll på detaljerna, men för den övergripande förståelsen röstar jag för att hålla huvudet kallt och inte gräva ned sig för snabbt. Även om varians och standardavvikelse definitivt har långtgående förankring i naturvetenskapen så representerar de ofta bara ett vettigt försök att bedöma spridningen i en samling data. Ungefär som när Smaragdalena resonerar kring olika sätt att visa spridningen, och landar i att en summering av kvadraterna kanske kan vara rimligt.
Man använder varians- och standardavvikelsemått i mängder av områden. Ett hyfsat udda område är när man tittar på hur "slagiga" olika aktiekurser är. Då räknar man ut standardavvikelsen av dagsavkastningarna, och kallar det spridningsmåttet för "realiserad volatilitet". Det underliga där är att avkastningar inte är normalfördelade, så varför använder man ändå standardavvikelsen? Jo, för att det är ett välkänt och ganska vettigt spridningsmått ändå =)
Alla stokastiska fördelningar, som normalfördelningen, den likformiga fördelningen, Poissonfördelningen, och den du talar om, har ett väntevärde och en standardavvikelse.
Den korrigerade stickprovsvariansen är en väntevärdesriktig skattning av variansen, oavsett fördelning. Så, om vi har oändligt många datapunkter kommer stickprovsvariansen vara lika med variansen :)
Det är ju såklart modeller, och inte verkligheten. Men, man måste nog göra något antagande om vilken modell man använder om ens skattningar ska vara intressanta.
Givet en mängd datapunkter med medelvärde och stickprovsstandardavvikelse kanske man vill kunna besvara "Hur många procent av framtida mätvärden kommer att ligga inom och ?". Har man anledning att tro att datapunkterna är fördelade enligt någon modell man känner till, så kan man besvara denna fråga.