Data Science Lexikon

Data Lake

Ein Data Lake (Datensee) ist eine unstrukturierte Ansammlung von Daten, welche meist in Rohdatenformaten gespeichert werden. Data Lakes sind häufig die Speicherlösung für Big Data.

Weiterlesen

Deep Learning

Deep Learning bedeutet, dass ein neuronales Netz mit relativ vielen Zwischenschichten als Machine Learning Algorithmus einsetzt wird. Deep, also tief, bezieht sich eben auf die Anzahl Zwischenschichten. Eine gewisse Anzahl Schichten, ab wann ein neuronales Netz tief ist, gibt es aber nicht.

Weiterlesen

Hyperparameter

Hyperparameter sind die Parameter eines Machine Learning Algorithmus, die nicht direkt durch die Trainingsdaten angepasst werden bzw. vor dem Training gesetzt werden, zum Beispiel die Anzahl Knoten eines neuronalen Netzes.

Weiterlesen

R (Programmiersprache)

R ist eine Interpreter-Programmiersprache, die im Data Science Umfeld neben Python die größte Verbreitung hat. Ursprünglich von und für Statistikern entwickelt, hat R seine Stärken in der Datenanalyse und -Datenvisualisierung. Durch zahlreiche Erweiterungen (Packages) kann R mittlerweile vieles mehr wie z.B. dynamische Reports, interaktive Dashboards, APIs, usw.

Weiterlesen

Anaconda

Anaconda ist eine kostenlose Python Distribution, die insbesondere im Data Science Bereich weit verbreitet ist. Neben Python und vielen Packages ist das Package Management System conda, die Möglichkeit virtuelle environments zu erzeugen sowie die IDE Spyder mit dabei. Anaconda ist für Windows, Linux und MacOS verfügbar.

Weiterlesen

Hol Dir mein Buch

Zertifikatsstudium “Data Science & Big Data”

Gratis für Dich

Data Science mit Python

 

Leider ist der Kurs noch nicht fertig, ich arbeite aber daran. Melde dich jetzt unverbindlich an und erhalte 25% Frühbucherrabatt auf meinen Onlinekurs Data Science mit Python. Du erfährst außerdem als Erste/r sobald ich den Kurs fertiggestellt habe.

Du hast Dich erfolgreich angemeldet!

0
    0
    Warenkorb
    Warenkorb ist leerzum Shop