Die eingebaute Hilfe von R ist zwar umfangreich und vollständig, aber nicht immer leicht zu verstehen. Auch die Beispiel sind häufig kompliziert und richten sich an erfahrene Programmierer.

Auf dieser Seite findet Ihr ein Glossar der wichtigsten R-Befehlen, das nach und nach wächst. Natürlich sind alle Erklärungen auf deutsch. Zudem gibt es zu jedem hier aufgelisteten Befehl eine kurze Erklärung und Code-Beispiele.

LERNE DATA SCIENCE mit R

Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.

AJAX progress indicator
(Löschen)
  • c

  • colMeans
    colMeans(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Mittelwerten je Spalte zurück. Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. - mehr
  • colSums
    colSums(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Summe je Spalte zurück. Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. - mehr
  • l

  • list.files
    list.files liest ein Verzeichnis aus und gibt einen Vektor mit Datei- oder Ordnernamen zurück. Dabei lassen sich mit dem Parameter pattern komplexe Filter als reguläre Ausdrücke realisieren. - mehr
  • ls
    ls() listet alle Variablen auf. - mehr
  • m

  • mean
    mean(x) berechnet den Mittelwert, genauer gesagt das arithmetische Mittel, eines numerischen Vektors x. - mehr
  • median
    median(x) gibt den Median zurück, also den Wert, der an mittlerer Position steht, wenn man die Zahlen der Größe nach ordnet. Bei einer geraden Anzahl wird der Mittelwert der beiden mittleren Zahlen. - mehr
  • merge
    merge(df1,df2,...) verbindet zwei data.frames, wie ein join in SQL. Ist kein weiterer Parameter angegeben, ist es ein inner join, mit all.x, all.y oder all=TRUE wird daraus ein left, right oder full join. Mit dem Parameter by wird angegeben, welche Spalten als ID für gleiche Einträge genommen(...) - mehr
  • min
    min(x) gibt das Minimum eines Vektors x zurück. Das funktioniert nicht nur für numerische Vektoren, sondern auch für Strings, dann wird das nach lexikografischer Ordnung minimale Element zurückgegeben. - mehr
  • r

  • barplot
    Der R-Befehl barplot zeichnet einen Säulen- bzw. Balkenchart in R. Dabei entspricht die Höhe bzw. Länge der Balken den Werten des übergebenen Vektors. - mehr
  • curve
    Die Funktion curve(f) zeichnet die Funktion f. Mit den nächsten beiden Parametern from und to wird der x-Achsen-Abschnitt definiert, also z.B. curve(exp,0,1) zeichnet die Exponentialfunktion im Intervall [0,1]. - mehr
  • getwd
    Der Befehl getwd() gibt das aktuelle Arbeitsverzeichnis zurück. - mehr
  • hist
    Mit hist(x) könnt ihr in R ganz schnell die Häufigkeitsverteilung eines numerische Vektors x anzeigen lassen. D.h., es werden Intervalle definiert und dann gezählt, wieviele Elemente von x in diesem Intervall liegen. - mehr
  • paste
    Der R-Befehl paste ermöglicht das Verbinden (Konkatenieren) von zwei oder mehr Strings oder Stringvektoren. - mehr
  • setwd
    Die R-Funktion setwd(Verzeichnis) ermöglicht es, das aktuelle Arbeitsverzeichnis (engl. working directory) zu wechseln und ist das Pendant zu getwd. - mehr
  • rnorm
    rnorm(n,mu,sigma) erzeugt eine normalverteilte Zufallsstichprobe der Größe n mit Erwartungswert mu und Standardabweichung sigma. - mehr
  • s

  • set.seed
    set.seed(i) startet den R-Zufallsgenererator an einer bestimmten Stelle. - mehr
  • system.time
    system.time(...) misst die Zeit, die R benötigt, um den Befehl in der Klammer auszuführen. Dabei wird der Befehl auch tatsächlich ausgeführt, d.h. findet in der Klammer eine Variablenzuordnung statt, ist die Variable danach auch verfügbar. - mehr
  • t

  • t.test
    t.test führt einen Ein- oder Zweistichproben t-Test durch, d.h. es wird entweder getestet, ob der Mittelwert einer Stichprobe von einem vorgegebenem Wert signifikant abweicht oder bei zwei Stichproben wird überprüft, ob sich die beiden Mittelwerte signifikant unterscheiden. - mehr
LERNE DATA SCIENCE mit R

Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.