Die eingebaute Hilfe von R ist zwar umfangreich und vollständig, aber nicht immer leicht zu verstehen. Auch die Beispiel sind häufig kompliziert und richten sich an erfahrene Programmierer.
Auf dieser Seite findet Ihr ein Glossar der wichtigsten R-Befehlen, das nach und nach wächst. Natürlich sind alle Erklärungen auf deutsch. Zudem gibt es zu jedem hier aufgelisteten Befehl eine kurze Erklärung und Code-Beispiele.
LERNE DATA SCIENCE mit R
Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.
c
- colMeanscolMeans(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Mittelwerten je Spalte zurück. Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. - mehr
- colSumscolSums(x) bekommt als Parameter eine Matrix oder einen data.frame und liefert einen Vektor mit den Summe je Spalte zurück. Als zweiten Parameter kann noch das Flag na.rm=TRUE gesetzt werden, damit NAs ignoriert werden. - mehr
l
- list.fileslist.files liest ein Verzeichnis aus und gibt einen Vektor mit Datei- oder Ordnernamen zurück. Dabei lassen sich mit dem Parameter pattern komplexe Filter als reguläre Ausdrücke realisieren. - mehr
- lsls() listet alle Variablen auf. - mehr
m
- meanmean(x) berechnet den Mittelwert, genauer gesagt das arithmetische Mittel, eines numerischen Vektors x. - mehr
- medianmedian(x) gibt den Median zurück, also den Wert, der an mittlerer Position steht, wenn man die Zahlen der Größe nach ordnet. Bei einer geraden Anzahl wird der Mittelwert der beiden mittleren Zahlen. - mehr
- mergemerge(df1,df2,...) verbindet zwei data.frames, wie ein join in SQL. Ist kein weiterer Parameter angegeben, ist es ein inner join, mit all.x, all.y oder all=TRUE wird daraus ein left, right oder full join. Mit dem Parameter by wird angegeben, welche Spalten als ID für gleiche Einträge genommen(...) - mehr
- minmin(x) gibt das Minimum eines Vektors x zurück. Das funktioniert nicht nur für numerische Vektoren, sondern auch für Strings, dann wird das nach lexikografischer Ordnung minimale Element zurückgegeben. - mehr
r
- barplotDer R-Befehl barplot zeichnet einen Säulen- bzw. Balkenchart in R. Dabei entspricht die Höhe bzw. Länge der Balken den Werten des übergebenen Vektors. - mehr
- curveDie Funktion curve(f) zeichnet die Funktion f. Mit den nächsten beiden Parametern from und to wird der x-Achsen-Abschnitt definiert, also z.B. curve(exp,0,1) zeichnet die Exponentialfunktion im Intervall [0,1]. - mehr
- getwdDer Befehl getwd() gibt das aktuelle Arbeitsverzeichnis zurück. - mehr
- histMit hist(x) könnt ihr in R ganz schnell die Häufigkeitsverteilung eines numerische Vektors x anzeigen lassen. D.h., es werden Intervalle definiert und dann gezählt, wieviele Elemente von x in diesem Intervall liegen. - mehr
- pasteDer R-Befehl paste ermöglicht das Verbinden (Konkatenieren) von zwei oder mehr Strings oder Stringvektoren. - mehr
- setwdDie R-Funktion setwd(Verzeichnis) ermöglicht es, das aktuelle Arbeitsverzeichnis (engl. working directory) zu wechseln und ist das Pendant zu getwd. - mehr
- rnormrnorm(n,mu,sigma) erzeugt eine normalverteilte Zufallsstichprobe der Größe n mit Erwartungswert mu und Standardabweichung sigma. - mehr
s
- set.seedset.seed(i) startet den R-Zufallsgenererator an einer bestimmten Stelle. - mehr
- system.timesystem.time(...) misst die Zeit, die R benötigt, um den Befehl in der Klammer auszuführen. Dabei wird der Befehl auch tatsächlich ausgeführt, d.h. findet in der Klammer eine Variablenzuordnung statt, ist die Variable danach auch verfügbar. - mehr
t
- t.testt.test führt einen Ein- oder Zweistichproben t-Test durch, d.h. es wird entweder getestet, ob der Mittelwert einer Stichprobe von einem vorgegebenem Wert signifikant abweicht oder bei zwei Stichproben wird überprüft, ob sich die beiden Mittelwerte signifikant unterscheiden. - mehr
LERNE DATA SCIENCE mit R
Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.