Data Scientist: The Sexiest Job of the 21st Century (HBR)
Hallo und herzlich Willkommen auf databraineo, dem deutschsprachigen Data Science Blog. Ich bin Holger, Daten-Enthusiast von ganzem Herzen. Ich liebe das Spannungsfeld aus Analytics-, Coding- und Business-Skills, das den Job des Data Scientists ausmacht.
Meine Mission ist es, Dir die Data Science Welt zu zeigen und Dich dafür zu begeistern!
Du hast eine Frage? Stell‘ sie mir in der Rubrik Ask the Doc.
LERNE DATA SCIENCE mit R
Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.
Ask the Doc
Overfitting im Machine Learning – Was ist das und wie vermeidet man es?
Overfitting ist eine der größten Stolpersteine im Machinellen Lernen. Jeder, der mit Daten zu tun hat, ist in diese Falle schon mal gelaufen. Hoffentlich wurde es bemerkt, denn ansonsten waren die gefunden Zusammenhänge oder der Prognose-Algorithmus für die Tonne. Muss man so hart sagen.
Wie funktioniert Reinforcement Learning? Bestärkendes Lernen erklärt
[latexpage]Maschinellen Lernen kann man in drei Klassen unterteilen: überwachtes Lernen (supervised learning),...
Data Scientist oder Data Engineer – Was ist der Unterschied?
Ich werde immer mal wieder gefragt, was denn der Unterschied zwischen einem Data Scientist und einem Data Engineer oder zwischen einem Data Analyst und einem Data Scientist sei. In Jobanzeigen sieht man mal den einen, mal den anderen Begriff, aber auch dort scheint es nicht immer klar abgegrenzt zu sein.
Was ist der Naive Bayes-Algorithmus?
Der Naive Bayes-Algorithmus ist ein probabilistischer Klassifikationsalgorithmus. Puh, schon ein schwieriger Ausdruck. Im Prinzip heißt das aber nur, dass der Naive Bayes-Algorithmus uns für jede Klasse eine Wahrscheinlichkeit gibt, dass die Beobachtung zu dieser Klasse gehört.
Kann man eine KI entwickeln, die ohne langes Training etwas lernt?
Das ist tatsächlich ein sehr spannendes Forschungsfeld, das viele Leute umtreibt. Die KI-Technik, aus wenigen Beispiel...
R
GRATIS 5-Tage Kurs – jetzt anmelden!
ggplot2 – so erstellst Du Charts in R
Um Charts in R zu stellen, führt eigentlich kein Weg an dem R-Paket ggplot2 vorbei. Egal, ob Du ein barplot in R, also...
Shiny Tutorial: Erstelle ein Dashboard in R
Ist es nicht cool, die Daten, die man mühsam aufbereitet hat, schön zu visualisieren? Genau das zeige ich Euch in diesem R Shiny Tutorial. Wir erstellen zusammen eine Shiny App in R, und das ist ganz easy.
Eigene Funktionen in R programmieren
R-Funktionen sind für die R-Experten ein alter Hut, aber für die Newbies unter Euch ein wichtiges Werkzeug. Ja,...
Datentypen in R – einfach erklärt (Teil 2)
Nachdem wir im ersten Teil die Basis-Datentypen in R besprochen haben, geht es nun in Teil 2 an Vektoren, Listen, data.frames usw. Wie immer mit vielen Codebeispielen …
Datentypen in R – einfach erklärt
Du bist neu in R und brauchst Grundlagen? Hier erkläre ich Dir die Basis-Datentypen in R, natürlich so einfach wie möglich und mit vielen Beispielen …
Python
GRATIS 5-Tage Kurs – jetzt anmelden!
MATPLOTLIB: Charts und Plots in Python
Hej Leute, in diesem Artikel geht es darum, wie ihr Diagramme und Charts in Python erstellt. Dafür gibt es...
Interaktive Dashboards in Python – Plotly Dash Tutorial
Die Aufgaben eines Data Scientist umfassen nicht nur Analysen, sondern auch die Darstellung der Ergebnisse. Interaktive Dashboards sind ideal, um vielfältige Daten übersichtlich darzustellen. In diesem Tutorial zu Plotly Dash zeige ich Euch, wie man Dashboards in Python programmiert.
Python-Tutorial für ein Kommandozeilen-Tool mit argparse
Möchtest Du ein Kommandozeilen-Tool (CLI = command line interface) in Python bauen? Mir ging es vor kurzem so. Ich...
Lineare Regression in Python
Hallo liebe Brainies, ich erkläre euch hier, was lineare Regression ist und wie ihr lineare Regression in Python...
Datenimport in Python: Excel-Dateien einlesen und schreiben
Wir wollen Daten analysen, oder? Sonst wärt ihr ja nicht hier! Dazu müssen aber erstmal die Daten in Python importiert werden. Dateien sind oft im Excel-Format (xlsx), denn in fast allen Abteilungen einer Firma ist Excel immer noch die Software, mit der Tabellen bearbeitet werden. Das Einlesen in Python ist ganz einfach …