colMeans(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Mittelwerten je Spalte zurück.

Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. Falls der Parameter nicht gesetzt wurde, ist der Eintrag im Rückgabe-Vektor NA, falls ein NA in der Spalte auftaucht.

Code-Beispiel

#Datensatz erzeugen
set.seed(1)
n = 1000
df = data.frame(ID=1:n,x=rnorm(n),y=rnorm(n,1,0),z=runif(n))
 
# Mittelwerte für die Spalten x, y und z berechnen
colMeans(df[,-1])
#          x           y           z 
#-0.01164814  1.00000000  0.48969716 
 
# einen Wert auf NA setzen
df$x[n/2]=NA
# dann liefert colMeans ebenfalls NA
colMeans(df[,-1])
# x         y         z 
#NA 1.0000000 0.4896972 
# Um das zu vermeiden, setzen wir den Parameter na.rm auf TRUE
colMeans(df[,-1],na.rm=TRUE)
#          x           y           z 
#-0.01078566  1.00000000  0.48969716
 
#gleiches Verhalten mittels sapply
sapply(df[,-1],FUN=mean,na.rm=TRUE)

Siehe auch

rowSums, colSums, rowMeans

Data Science mit Python

 

Leider ist der Kurs noch nicht fertig, ich arbeite aber daran. Melde dich jetzt unverbindlich an und erhalte 25% Frühbucherrabatt auf meinen Onlinekurs Data Science mit Python. Du erfährst außerdem als Erste/r sobald ich den Kurs fertiggestellt habe.

Du hast Dich erfolgreich angemeldet!