Förutspå kommande inkommande siffror

Hej

Jag är i stort behov av er som kan och vet.

Min matematik räcker knappt till för att räkna ut växelkurs och nu har jag tagit på mig ett massivt problem. Jag vet att en absolut lösning inte finns eftersom det är människor som påverkar de ingående siffror som jag vill kunna förutspå. Tillåt mig förklara närmare.

Jag får in reklamationer av olika människor alla dagar i veckan, och av detta får jag fram en totalsumma per dag. Denna totalsumman sammanställer jag var vecka var dag. Av detta skulle jag vilja se hur det kommer att se ut kommande vecka just en specifik dag, hur kan man räkna ut detta?

Av dessa summer tar jag ut snittet per vecka (se nedan)

Sen tar jag vecka två minus vecka ett, mellanskillnad, vecka tre minus vecka två mellanskillnad se listan nedan

Denna differens minskar med veckorna eller efterhand jag får in mer siffror. Denna differens bör sen nästa inkomna värde ligga inom!?

Tänker jag rätt eller finn det någon annan som har bättre förslag?

Är lite osäker på om jag håller med att din serie av differenser är av intresse för dig... de visar hur mycket det senaste värdet har påverkat snittet, men om det är de faktiska beloppen (totalsumman per dag) du är intresserad av så ger det nog inte så mycket för dig att gräva djupare i medelvärdets beteende.

Det går att göra såna här saker hur enkelt eller komplicerat som helst. Din bästa gissning om kommande dagar eller veckor är oftast bäst representerat av ett medelvärde av tidigare observationer, t.ex. snittet per vecka som du räknat ut för måndagar. Sedan kan du finjustera den gissningen genom din erfarenhet, t.ex. om det finns varierat beteende beroende på vilken veckodag det är. Om alla dagar bedöms vara likadana räknar du ut snittet baserat på alla dagar oavsett om det är måndag, tisdag eller något annat. Kanske finns det säsongsvariation också, t.ex. reklamationer efter stora handelshelger? Ett vettigt tips är att börja enkelt och justera modellen efterhand.

Om du är intresserad av vilka värden nästa värde kommer ligga inom är du intresserad av spridningen i ditt dataset. Om du har mycket data kan det kanske vara vettigt att räkna ut ett löpande standardavvikelse-mått på samma sätt som du räknar ett löpande medelvärde. Kolla upp termer som standardavvikelse, konfidensintervall i relation till normalfördelning. Om du inte har så mycket data men ändå vill visa på en spridning kan du använda något enkelt som största/minsta värde som observerats tidigare, eller "näst största/minsta värde". Sånt här är alltid en gissningslek egentligen, så det viktigaste är att du förstår vad siffrorna betyder och kan resonera kring dem. Hellre det än att applicera avancerade grejer och riskera att tappa greppet om den verklighet de avspeglar!

Svara