Hej Leute,

heute trage ich im R-Bite mal zusammen, wie ihr in R Spalten eines data.frames auswählen könnt. Es gibt nämlich eine ganze Menge davon. Eigentlich ist die Vielfalt ja toll und man hat selbst sowieso eine Lieblingsmethode. Auf der anderen Seite macht es das Lesen von R-Code von anderen manchmal ganz schön schwer. Aber schaut selbst:

Indizes

#erste Spalte
iris[,1]
#erste bis dritte Spalte
iris[,1:3]
#erste und fünfte Spalte
iris[,c(1,5)]

Spaltennamen

colnames(iris)
#die Spalte Sepal.Length. Praktisch, weil Ergänzung mit TAB
iris$Sepal.Length
#das gleiche
iris[,"Sepal.Length"]
#zwei Spalten per Name auswählen
iris[,c("Sepal.Length","Sepal.Width")]

Bedingungen

iris[,grepl("Sepal",colnames(iris))]

Subset

subset(iris,select=c(Sepal.Length))

Dplyr: select

Die Syntax aus dem Tidyverse

library(dplyr)
select(iris, Sepal.Length,Sepal.Width)
#oder mit pipe-Schreibweise
iris %>% select(Sepal.Length,Sepal.Width)

Data.Table

Das Package Data.Table ist ziemlich schnell, wenn es um größere Datenmengen geht.

library(data.table)
#in data.table konvertieren 
dt <- as.data.table(iris)
dt[ , .(Sepal.Length,Sepal.Width)]

Viel Spaß beim Coden!