Überwachtes Lernen (engl. supervised learning) bezeichnet das Lernen einer Funktion mit definierten Inputs und Outputs anhand von Trainingsdaten. D.h. der Trainingsdatensatz besteht aus Paaren von Inputs und Outputs. Man spricht von einem labeled dataset (markierter Datensatz).
Die meisten ML-Anwendungen werden dem überwachten Lernen zugeordnet. So wäre beispielsweise in der Hautkrebserkennung ein Bild ein Input und die Diagnose (Krebs ja/nein) der Output. Der ML-Algorithmus lernt anhand eines Bilddatensatzes, bei der jedes Bild mit der Diagnose versehen wurde.
Generell ist es aufwändig, einen solchen Datensatz bereit zu stellen, da der Output (z.B die Klasse) meist manuell bestimmt wird.
Algorithmen, welche keine definierten Outputs benötigen, fallen in die Klasse des unüberwachten Lernens (unsupervised learning). Dabei geht es eher darum, Strukturen innerhalb des Datensatzes zu finden, das Ergebnis steht nicht fest. Ein typisches Beispiel ist das Clustering, bei dem Objekte/Datenpunkte in Gruppen eingeteilt werden, so dass ähnliche Objekte/Datenpunkte der gleichen Gruppe angehören.