Data Scientist: The Sexiest Job of the 21st Century (HBR)
Hallo und herzlich Willkommen auf databraineo, dem deutschsprachigen Data Science Blog. Ich bin Holger, Daten-Enthusiast von ganzem Herzen. Ich liebe das Spannungsfeld aus Analytics-, Coding- und Business-Skills, das den Job des Data Scientists ausmacht.
Meine Mission ist es, Dir die Data Science Welt zu zeigen und Dich dafür zu begeistern!
Du hast eine Frage? Stell‘ sie mir in der Rubrik Ask the Doc.
LERNE DATA SCIENCE mit R
Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.
Ask the Doc

Wie erklärt man einem Kind, wie maschinelles Lernen funktioniert?
Es kommt natürlich ein bisschen darauf an, wie alt das Kind ist. Eine eingängige Beschreibung ist, dass...

Was ist Keras?
Hej Leute, vielleicht habt ihr schon mal von Keras im Zusammenhang mit Neuronalen Netzen gehört. Nun fragt ihr euch,...

Was ist Julia? Eine tolle Programmiersprache!
Julia ist eine junge Programmiersprache, die aktuell immer mal wieder als tolle Alternative im Bereich Data Science...
R
GRATIS 5-Tage Kurs – jetzt anmelden!

Datentypen in R – einfach erklärt
Du bist neu in R und brauchst Grundlagen? Hier erkläre ich Dir die Basis-Datentypen in R, natürlich so einfach wie möglich und mit vielen Beispielen …

Datensatzformat – Quer vs. Längs – Konvertierung in Excel und R
Es geht um die Struktur von Datentabellen, also wie eine Tabelle aufgebaut ist. Was gibt es denn darüber zu erzählen, denkt ihr euch vielleicht. Eine Tabelle hat Zeilen und Spalten. Das stimmt natürlich, aber dennoch gibt es zwei Varianten, die beide ihre Vor- und Nachteile haben, so dass auch beide ihre Daseins-Berechtigung haben.

Das R-Package dplyr: Eine ausführliche Anleitung (mit vielen Beispielen)
Heute stelle ich Euch ein super nützliches R-Package namens dplyr vor. Dieses dient der sogenannten Datenmanipulation, also zum Beispiel neue Spalten zu einer Tabelle hinzufügen, eine Tabelle nach bestimmten Werten zu filtern oder auch nach Klassen zu gruppieren. Keine Angst, wir gehen Schritt für Schritt vor.

Kopieren, Umbennen und Löschen von Dateien in R
Ein Verzeichnis durchsuchen Eine Liste (technisch: ein Vektor) mit den Dateinamen eines Verzeichnisses zu bekommen,...

Was ist der Naive Bayes-Algorithmus?
Der Naive Bayes-Algorithmus ist ein probabilistischer Klassifikationsalgorithmus. Puh, schon ein schwieriger Ausdruck. Im Prinzip heißt das aber nur, dass der Naive Bayes-Algorithmus uns für jede Klasse eine Wahrscheinlichkeit gibt, dass die Beobachtung zu dieser Klasse gehört.
Python
GRATIS 5-Tage Kurs – jetzt anmelden!

Jupyter Lab Shortcuts: Steigere Deine Produktivität – auch für Jupyter Notebook
Du hast gerade angefangen, Jupyter Notebook oder Jupyter Lab zu benutzen? Oder Du möchtest einfach schneller werden und nicht immer die Maus benutzen? Dann sind die folgenden Shortcuts genau das richtige für Dich.

Strings in Python
Heute lernt ihr, was Strings sind und wie man mit Ihnen in Python arbeitet

Operatoren in Python
Hej Leute, heute geht es um ein wichtiges Thema in Python: Operatoren. Ohne diese geht beim Programmieren gar nichts....

Python Datentypen Übersicht
Dieser Blogartikel gibt eine Übersicht über die verschiedenen Basis-Datentypen in Python und richtet sich damit an die...

Install Anaconda – Die Python-Distribution Anaconda
Hej Leute, ihr wollt als Data Scientist durchstarten, habt euch vorgenommen, Python zu lernen und wollt nun wissen,...
Alle Artikel
Daten analysieren, auswerten und visualisieren – Das Zertifikatsstudium ‚Data Science & Big Data‘ der TU Dortmund
Das Zertifikatsstudium ‚Data Science & Big Data‘ der Technischen Universität Dortmund...
WeiterlesenMATPLOTLIB: Charts und Plots in Python
Hej Leute, in diesem Artikel geht es darum, wie ihr Diagramme und Charts in Python erstellt....
Weiterlesenggplot2 – so erstellst Du Charts in R
Um Charts in R zu stellen, führt eigentlich kein Weg an dem R-Paket ggplot2 vorbei. Egal, ob...
WeiterlesenBuchreview: Praktische Statistik für Data Scientists
Wie der Titel schon verrät, enthält das Buch eine Übersicht der wichtigsten statistischen Konzepte, mit denen Data Scientisten arbeiten. Dabei unterteilen die Autoren ihr Buch in diese Kapitel …
WeiterlesenOverfitting im Machine Learning – Was ist das und wie vermeidet man es?
Overfitting ist eine der größten Stolpersteine im Machinellen Lernen. Jeder, der mit Daten zu tun hat, ist in diese Falle schon mal gelaufen. Hoffentlich wurde es bemerkt, denn ansonsten waren die gefunden Zusammenhänge oder der Prognose-Algorithmus für die Tonne. Muss man so hart sagen.
WeiterlesenShiny Tutorial: Erstelle ein Dashboard in R
Ist es nicht cool, die Daten, die man mühsam aufbereitet hat, schön zu visualisieren? Genau das zeige ich Euch in diesem R Shiny Tutorial. Wir erstellen zusammen eine Shiny App in R, und das ist ganz easy.
WeiterlesenInteraktive Dashboards in Python – Plotly Dash Tutorial
Die Aufgaben eines Data Scientist umfassen nicht nur Analysen, sondern auch die Darstellung der Ergebnisse. Interaktive Dashboards sind ideal, um vielfältige Daten übersichtlich darzustellen. In diesem Tutorial zu Plotly Dash zeige ich Euch, wie man Dashboards in Python programmiert.
WeiterlesenWie funktioniert Reinforcement Learning? Bestärkendes Lernen erklärt
Maschinellen Lernen kann man in drei Klassen unterteilen: überwachtes Lernen (supervised...
WeiterlesenEigene Funktionen in R programmieren
R-Funktionen sind für die R-Experten ein alter Hut, aber für die Newbies unter Euch ein...
WeiterlesenPython-Tutorial für ein Kommandozeilen-Tool mit argparse
Möchtest Du ein Kommandozeilen-Tool (CLI = command line interface) in Python bauen? Mir ging...
WeiterlesenDatentypen in R – einfach erklärt (Teil 2)
Nachdem wir im ersten Teil die Basis-Datentypen in R besprochen haben, geht es nun in Teil 2 an Vektoren, Listen, data.frames usw. Wie immer mit vielen Codebeispielen …
WeiterlesenDatentypen in R – einfach erklärt
Du bist neu in R und brauchst Grundlagen? Hier erkläre ich Dir die Basis-Datentypen in R, natürlich so einfach wie möglich und mit vielen Beispielen …
WeiterlesenLineare Regression in Python
Hallo liebe Brainies, ich erkläre euch hier, was lineare Regression ist und wie ihr lineare...
WeiterlesenGeld verdienen als Data Scientist-Freelancer – Die Freelancer-Börse Malt.de im Interview
Heute mal etwas ganz anderes als meine Data Science-Tutorials. Es geht um’s Geld verdienen. Der eine oder andere von Euch hat sicherlich schon mal daran gedacht, seine Fähigkeiten als Freelancer anzubieten. Aber wie kommt man an interessante Projekte?
WeiterlesenDatenimport in Python: Excel-Dateien einlesen und schreiben
Wir wollen Daten analysen, oder? Sonst wärt ihr ja nicht hier! Dazu müssen aber erstmal die Daten in Python importiert werden. Dateien sind oft im Excel-Format (xlsx), denn in fast allen Abteilungen einer Firma ist Excel immer noch die Software, mit der Tabellen bearbeitet werden. Das Einlesen in Python ist ganz einfach …
WeiterlesenJupyter Lab Shortcuts: Steigere Deine Produktivität – auch für Jupyter Notebook
Du hast gerade angefangen, Jupyter Notebook oder Jupyter Lab zu benutzen? Oder Du möchtest einfach schneller werden und nicht immer die Maus benutzen? Dann sind die folgenden Shortcuts genau das richtige für Dich.
WeiterlesenSQL 1×1
Als Data Scientist haben wir mit Daten zu tun und in vielen Fällen liegen diese Daten in einer relationalen Datenbank. Und die Abfragesprache dafür ist SQL. Also muss ein Data Scientist mindestens die Grundzüge von SQL beherrschen. Das ist aber zum Glück gar nicht schwer.
WeiterlesenDer t-Test – Vergleich von Mittelwerten
Hej Leute, heute geht es um Statistik und zwar um den t-Test! Jetzt ist es raus, kreisch, schrei,...
WeiterlesenStrings in Python
Heute lernt ihr, was Strings sind und wie man mit Ihnen in Python arbeitet
WeiterlesenOperatoren in Python
Hej Leute, heute geht es um ein wichtiges Thema in Python: Operatoren. Ohne diese geht beim...
Weiterlesen