R ist eine Programmiersprache, die im Data Science Umfeld neben Python die größte Verbreitung hat. R ist eine Skriptsprache, d.h. man schreibt typischerweise ein Skript in einem Editor bzw. IDE (z.B. RStudio) und schickt es dann Zeile für Zeile an den sogenannten Interpreter. Das Gegenstück sind sogenannte Compiler-Programmiersprachen wie C++, die den gesamten Code auf einmal an den Compiler schicken, der daraus ein maschinenlesbares Programm erzeugt.
1992 wurde R von Ross Ihaka und Robert Gentlement als kostenlose Variante von S, einer Statistik-Programmiersprache entwickelt. Mittlerweile ist R open source und für Linux, Windows und macOS verfügbar. Es gibt eine sehr aktive R-Community. Durch die große Zahl an Packages, die die Funktionsfähigkeit von R massiv erweitern, ist so ziemlich jeder statistische Algorithmus und grafische Darstellung implementiert. Zudem gibt es Packages, um z.B. Reports inkl. Code analog den Jupyter Notebooks (RMarkdown), interaktive Dashboards (Shiny) oder APIs (Plumber) zu programmieren. Die Packages liegen zentral auf den sogenannten CRAN-Servern (Comprehensive R Archive Network) und die Installation erfolgt einfach aus R heraus.
Auf databraineo.de findet ihr zahlreiche weiterführende Artikel und How-Tos zu R: