R-Glossar: colSums - DataBraineo - Data Science Consulting

colSums

colSums(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Summe je Spalte zurück.

Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. Falls der Parameter nicht gesetzt wurde, ist der Eintrag im Rückgabe-Vektor NA, falls ein NA in der Spalte auftaucht.

Code-Beispiel

#Datensatz erzeugen
#Datensatz erzeugen
set.seed(1)
n = 1000
df = data.frame(ID=1:n,x=rnorm(n),y=rnorm(n,1,0),z=runif(n))
 
# Mittelwerte für die Spalten x, y und z berechnen
colSums(df[,-1])
#       x            y         z 
#-11.64814  1000.00000  489.69716 
 
# einen Wert auf NA setzen
df$x[n/2]=NA
# dann liefert colMeans ebenfalls NA
colSums(df[,-1])
# x           y          z 
#NA  1000.00000  489.69716 
# Um das zu vermeiden, setzen wir den Parameter na.rm auf TRUE
colSums(df[,-1],na.rm=TRUE)
#        x           y          z 
#-10.77488  1000.00000  489.69716 
 
#gleiche Funktion mittels sapply
sapply(df[,-1],FUN=sum,na.rm=TRUE)

Siehe auch

rowSums, colMeans, rowMeans

Verwandte Artikel:

Glossar: data.frame: leere Spalten entfernen
Willst Du komplett leere Spalten aus einem data.frame entfernen, musst Du dafür die Anzahl der NAs zählen und mit der Anzahl Zeilen vergleichen.
Glossar: colMeans
colMeans(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Mittelwerten je Spalte zurück. Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden.

Glossar:

colSums

Code-Beispiel

Siehe auch

Gratis für Dich

Eine Email an Dich ist schon unterwegs!

Kategorien

Data Science mit Python

Du hast Dich erfolgreich angemeldet!

colSums

Code-Beispiel

Siehe auch

Gratis für Dich

Eine Email an Dich ist schon unterwegs!

Kategorien

Schlagwörter

Data Science mit Python

Du hast Dich erfolgreich angemeldet!