
Du bist auf einen Begriff gestoßen, der Dir nichts sagt oder wo Du nicht sicher bist, was er bedeutet. Dann bist Du hier im Data Science Lexikon richtig, denn hier findest Du Erklärungen zu den wichtigsten Fachbegriffen aus dem Bereich Maschinelles Lernen, Künstliche Intelligenz und Data Science.
Fehlt hier etwa noch ein wichtiger Begriff? Schreib mir und ich ergänze die Definition.

a
- AnacondaAnaconda ist eine kostenlose Python Distribution, die insbesondere im Data Science Bereich weit verbreitet ist. Neben Python und vielen Packages ist das Package Management System conda, die Möglichkeit virtuelle environments zu erzeugen sowie die IDE Spyder mit dabei. Anaconda ist für Windows,(...) - mehr
c
- CI/CDCI steht für continuous integration und CD für continuous deployment bzw. delivery, beides Schlüsseltätigkeiten im Bereich DevOps. Mit CI/CD ist die Automatisierung von Build-Prozessen (z.B. Kompilierung), Tests und Produktivsetzen gemeint, um die Lücke zwischen Entwicklung und einsatzfähigem(...) - mehr
d
- Data LakeEin Data Lake (Datensee) ist eine unstrukturierte Ansammlung von Daten, welche meist in Rohdatenformaten gespeichert werden. Data Lakes sind häufig die Speicherlösung für Big Data. - mehr
- Deep LearningDeep Learning bedeutet, dass ein neuronales Netz mit relativ vielen Zwischenschichten als Machine Learning Algorithmus einsetzt wird. Deep, also tief, bezieht sich eben auf die Anzahl Zwischenschichten. Eine gewisse Anzahl Schichten, ab wann ein neuronales Netz tief ist, gibt es aber nicht. - mehr
h
- HyperparameterHyperparameter sind die Parameter eines Machine Learning Algorithmus, die nicht direkt durch die Trainingsdaten angepasst werden bzw. vor dem Training gesetzt werden, zum Beispiel die Anzahl Knoten eines neuronalen Netzes. - mehr
k
- Key-Value-StoresIn Key-Value-Stores besteht ein Datensatz aus einem Schlüssel (Key) und einem oder mehreren Werten (Value), ähnlich zu einem Lexikon. - mehr
m
- Maschinelles LernenMaschinelles Lernen (engl. machine learning, Abk. ML) bezeichnet den Prozess, aus einem Trainingsdatensatz Regeln abzuleiten und diese dann auf neue Daten anzuwenden. - mehr
n
- Neuronales NetzNeuronale Netze sind eine Modellklasse im Bereich Maschinelles Lernen, welche aus Knoten und Verbindungen dazwischen bestehen. Dabei geht es nicht um die exakte Nachbildung der Neuronen im Gehirn, sondern z.B. um eine gute Performance bei der Bilderkennung. - mehr
- NoSQLNoSQL steht für „not only SQL“ und ist ein Sammelbegriff für Datenbanken, welche nicht nach dem tabellenbasierten Ansatz relationaler Datenbanken arbeiten. - mehr
p
- PytorchPytorch ist neben Tensorflow das bekannteste Neuronale Netze-Framework. Pytorch ist eine open-source Library für Python und wird von namhaften Unternehmen verwendet. - mehr
r
- R (Programmiersprache)R ist eine Interpreter-Programmiersprache, die im Data Science Umfeld neben Python die größte Verbreitung hat. Ursprünglich von und für Statistikern entwickelt, hat R seine Stärken in der Datenanalyse und -Datenvisualisierung. Durch zahlreiche Erweiterungen (Packages) kann R mittlerweile(...) - mehr
- reinforcement learningReinforcement Learning ist ein Teilgebiet des Maschinellen Lernens, bei dem ein Agent selbstständig lernt, indem er in einer Umgebung (engl. environment) so agiert, dass er ein Belohnungssystem maximiert. - mehr
- RStudioRStudio ist die wohl am weitesten verbreitete integrierte Entwicklungsumgebung (IDE) für die Programmiersprache R. D.h. RStudio ist eine Software, welche das Programmieren in R deutlich komfortabler, schneller und einfacher macht, z.B. durch Autovervollständigung, einem Variablen-Fenster usw. - mehr
s
- Spaltenorientierte DatenbankenSpaltenorientierte Datenbanken speichern die Spalten einer Tabelle separat voneinander, während relationale Datenbanken zeilenweise vorgehen. - mehr
t
- TensorflowTensorflow ist mit eines der populärsten Frameworks für künstliche neuronale Netze. Tensorflow ist mittlerweile open source. Besonders häufig wird Tensorflow zusammen mit dem high-level Interface Keras verwendet, um maschinelles Lernen mittels neuronaler Netze durchzuführen. Viele große Firmen(...) - mehr
- Turing-TestDer Turing-Test ist ein Szenario, um die Intelligenz von Computern zu testen. Zur Durchführung führt ein Mensch zwei Gespräche per Tastatur. Der eine Gesprächspartner ist eine "künstliche Intelligenz", der andere ein Mensch. Kann nach einer gewissen Zeit nicht zwischen Mensch und künstlicher(...) - mehr
u
- überwachtes LernenÜberwachtes Lernen (engl. supervised learning) bezeichnet das Lernen einer Funktion mit definierten Inputs und Outputs anhand von Trainingsdaten. D.h. anhand eines Trainingsdatensatzes, der aus Paaren von Inputs und Outputs besteht (labeled dataset), lernt der Algorithmus, zu beliebigen(...) - mehr