rnorm(n, mu, sigma) erzeugt eine normalverteilte Zufallsstichprobe der Größe n mit Erwartungswert mu und Standardabweichung sigma.

Es empfiehlt sich, am Anfang eines Skripts den Zufallsgenerator von R mit set.seed zu initialisieren. Damit ist eine Reproduzierbarkeit sichergestellt.

 

Beispiel

#Datensatz erzeugen
set.seed(1)
n = 10000
df = data.frame(x=rnorm(n), y=rnorm(n,1,0), z=rnorm(n,0.5,3))
 
#Mittelwert der drei Spalten
colMeans(df)
#           x            y            z 
#-0.006537039  1.000000000  0.487429803 
 
#Standard-Abweichung der drei Spalten 
sapply(df,sd)
#       x        y        z 
#1.012356 0.000000 2.972333
 
# Histogramme
par(mfrow=c(1,3))
hist(df$x, xlab="x", ylab="Anzahl", main="x ~ N(0, 1)")
hist(df$y, breaks = 10, xlim = c(-2,2), xlab="y", ylab="Anzahl", main="y ~ N(1, 0)")
hist(df$z, xlab="z", ylab="Anzahl", main="z ~ N(0.5, 3)")
drei Histogramme, die Beispiele für Normalverteilungen sind. Diese wurden mit dem Befehl rnorm der Statistik-Programmiersprache R erzeugt
Histogramme zur Normalverteilung

Data Science mit Python

 

Leider ist der Kurs noch nicht fertig, ich arbeite aber daran. Melde dich jetzt unverbindlich an und erhalte 25% Frühbucherrabatt auf meinen Onlinekurs Data Science mit Python. Du erfährst außerdem als Erste/r sobald ich den Kurs fertiggestellt habe.

Du hast Dich erfolgreich angemeldet!