colMeans(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Mittelwerten je Spalte zurück.
Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. Falls der Parameter nicht gesetzt wurde, ist der Eintrag im Rückgabe-Vektor NA, falls ein NA in der Spalte auftaucht.
Code-Beispiel
#Datensatz erzeugen set.seed(1) n = 1000 df = data.frame(ID=1:n,x=rnorm(n),y=rnorm(n,1,0),z=runif(n)) # Mittelwerte für die Spalten x, y und z berechnen colMeans(df[,-1]) # x y z #-0.01164814 1.00000000 0.48969716 # einen Wert auf NA setzen df$x[n/2]=NA # dann liefert colMeans ebenfalls NA colMeans(df[,-1]) # x y z #NA 1.0000000 0.4896972 # Um das zu vermeiden, setzen wir den Parameter na.rm auf TRUE colMeans(df[,-1],na.rm=TRUE) # x y z #-0.01078566 1.00000000 0.48969716 #gleiches Verhalten mittels sapply sapply(df[,-1],FUN=mean,na.rm=TRUE)
Siehe auch
rowSums, colSums, rowMeans