Kvartiler: Ojämn serie, x% har mer/mindre än nedre/övre kvartil
På en jämn serie som tex 1 2 3 4 5 6 7 8 9 10 11 12, är det något lätt att konstatera att tex 75% har ett värde högre än den undre kvartilen. Den undre kvartilen i detta exempel är ju 3,5, så om 75% har mer än det är det alltså värderna 4 5 6 7 8 9 10 11 12 vilket är 9 värden => 9/12 = 3/4 = 75%. Men för en ojämn serie tex 1 2 3 4 5 6 7 8 9 10 11 12 13 där tex den undre kvartilen är 3,5 igen, då finns det ju inget heltal tal som kan säga att x/13 blir 75% dvs jag kan inte säga att 75% av värderna är mer än den undre kvartilen för 9/13 blir 0.6923... och 10/13 blir 0.7692... Vad ska synsättet vara i detta läge för en ojämn serie kring kvartiler och distribution?
Statistiska mått bör användas på stora mängder data, annars hamnar man i sådana här konstiga diskussioner. Om man har 40000 eller 40001 mätvärden spelar ingen större roll, för undre kvartilen är ändå väldigt nära det tiotusende värdet.
Det vanligaste sättet att hantera små mängder data är följande:
Med N stycken värden i storleksordning har man (N-1) steg att gå från det minsta till det största. Undre kvartilen kan då sägas vara det värde du hittar efter (N-1)/4 steg. Om det inte blir ett heltal steg, får man ta motsvarande del av skillnaden mellan två mätvärden.
Exempel; N=10. Undre kvartil 9/4 steg = 2.25 steg. Gå två steg och 25% av avståndet till nästa tal.
Bubo skrev:Statistiska mått bör användas på stora mängder data, annars hamnar man i sådana här konstiga diskussioner. Om man har 40000 eller 40001 mätvärden spelar ingen större roll, för undre kvartilen är ändå väldigt nära det tiotusende värdet.
Det vanligaste sättet att hantera små mängder data är följande:
Med N stycken värden i storleksordning har man (N-1) steg att gå från det minsta till det största. Undre kvartilen kan då sägas vara det värde du hittar efter (N-1)/4 steg. Om det inte blir ett heltal steg, får man ta motsvarande del av skillnaden mellan två mätvärden.
Exempel; N=10. Undre kvartil 9/4 steg = 2.25 steg. Gå två steg och 25% av avståndet till nästa tal.
Jaha okej! Tack :D
Bubo skrev:Statistiska mått bör användas på stora mängder data, annars hamnar man i sådana här konstiga diskussioner. Om man har 40000 eller 40001 mätvärden spelar ingen större roll, för undre kvartilen är ändå väldigt nära det tiotusende värdet.
Det vanligaste sättet att hantera små mängder data är följande:
Med N stycken värden i storleksordning har man (N-1) steg att gå från det minsta till det största. Undre kvartilen kan då sägas vara det värde du hittar efter (N-1)/4 steg. Om det inte blir ett heltal steg, får man ta motsvarande del av skillnaden mellan två mätvärden.
Exempel; N=10. Undre kvartil 9/4 steg = 2.25 steg. Gå två steg och 25% av avståndet till nästa tal.
Vad blir uträckningen för den övre kvartilen i detta scenario med en liten serie som är ojämn?
Med 13 tal blir det 12 steg, så övre kvartilen blir 8 steg bort, det nionde talet.
Med 12 tal blir det 11 steg, så övre kcartilen blir 33/4 steg bort, det åttonde talet plus 0.75 gånger (nionde talet- åttonde talet)
Bubo skrev:Med 13 tal blir det 12 steg, så övre kvartilen blir 8 steg bort, det nionde talet.
Med 12 tal blir det 11 steg, så övre kcartilen blir 33/4 steg bort, det åttonde talet plus 0.75 gånger (nionde talet- åttonde talet)
Tack så mycket :)