1
svar
142
visningar
Analys av datafil
Jag ska Beräkna årsvisa medelvärden och medianer och har kommit så långt. Jag vet inte hur jag ska fortsätta, tänker att jag ska använda "filterkommandon", men exakt hur, vet jag inte! :)
Datafilen (Temperaturdata)
Min kod
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import norm, t
import math
from sklearn import linear_model
import statsmodels.api as sm
from sklearn.model_selection import train_test_split
from scipy import stats
df=pd.read_csv('SMHI.csv',sep=';', decimal=',')
df
df.head()
df.tail()
meanLufttemperatur = df['Lufttemperatur'].mean()
print(meanLufttemperatur)
5.9208525091524935
std_av11=math.sqrt((((df['Lufttemperatur'] - meanLufttemperatur)**2).sum())/(len(df['Lufttemperatur'])-1))
print(f'standardavvikelse = {std_av11}')
standardavvikelse = 8.933196325206683
medianLufttemperatur=df['Lufttemperatur'].median()
print(medianLufttemperatur)
5.6
Titta på groupby() som finns in pandasbiblioteket. Med den kan du gruppera på året från datumkolumnen. Sedan kan du anropa .mean() eller .median() som du gjort innan. Då ska du få dina medelvärden och medianer för varje år.