Das geht zum Glück ganz einfach: Man benutzt das $-Zeichen mit dem neuen Spaltennamen, um der Spalte direkt Werte zuzuweisen. Falls die Spalte noch nicht exisitert, wird sie hinzugefügt.
df <- data.frame(x = rnorm(10))
# fügt dem data.frame df eine neue Spalte y mit den quadrierten Werten von x hinzu
df$y <- df$x^2

Willst Du die Syntax von dem Package dplyr nutzen, geht das mit dem Befehl mutate. Dabei wir der data.frame df als erstes Argument übergeben. Als zweites Argument kommt dann die neue Variable y mit der Zuweisung. Allerdings ist dplyr

library(dplyr)
df <- data.frame(x = rnorm(10))
# der mutate-Befehl aus dem Package dplyr macht das gleiche
df <- mutate(df, y = x^2)
 
#alternativ mit der magrittr-Pipe
df <- df %>% mutate(y = x^2)

Mehr über das Package dplyr kannst Du in meiner ausführlichen Anleitung zu dplyr nachlesen.

GRATIS 5-Tage Minikurs: Datenanalyse in R

Du kennst Dich noch nicht so gut damit aus, wie man einen Datensatz in R analysiert? Ich bin da, um Dir zu helfen. Hole Dir jetzt meinen kostenlosen Datenanalyse mit R – Kurs und fange an, Dir diese zukunftsweisenden Skills anzueignen.

Mit dem Befehl mutate kann man auch mehrere neue Spalten mit einem Befehl hinzufügen. Diese dürfen sogar voneinander abhängen (wie in unserem Beispiel z von y), sofern die Reihenfolge stimmt (hier y vor z). Natürlich geht das ganze auch mit zwei base-R-Befehlen hintereinander.
# mehrere Spalten gleichzeitig hinzufügen
df <- mutate(df, 
             y = x^2, 
             z = 3*y + rnorm(10)
             )
 
# klassisch
df$y <- df$x^2
df$z <- 3*df$y + rnorm(10)

Benchmark

Ein (nicht sehr realitätsnahes) Benchmark zeigt, dass die klassische Variante schneller ist:

library(rbenchmark)
n = 1000
benchmark(klassisch = {df <- data.frame(x = rnorm(n));df$y <- df$x^2},
          dplyr = {df <- data.frame(x = rnorm(n));df <- mutate(df, y = x^2)},
          replications = 1000
          )
 
benchmark(klassisch = {df <- data.frame(x = rnorm(n));df$y <- df$x^2;df$z <- 3*df$y+rnorm(n)},
          dplyr = {df <- data.frame(x = rnorm(n));df <- mutate(df, y = x^2, z = 3*y + rnorm(n))},
          replications = 1000
)
LERNE DATA SCIENCE mit R

Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.

Data Science mit Python

 

Leider ist der Kurs noch nicht fertig, ich arbeite aber daran. Melde dich jetzt unverbindlich an und erhalte 25% Frühbucherrabatt auf meinen Onlinekurs Data Science mit Python. Du erfährst außerdem als Erste/r sobald ich den Kurs fertiggestellt habe.

Du hast Dich erfolgreich angemeldet!