+

Machine Learning in Python

Das Themenfeld Machine Learning lässt sich in Klassifikations- und Regressionsprobleme unterteilen, die entweder überwachter oder unüberwachter Natur sein können. In diesem Training lernen sie die unterschiedlichen Problemklassen mit den bedeutendsten Methoden des Machine Learning zu lösen.

Zunächst lernen Sie Machine Learning Verfahren für überwachte Klassifikations- und Regressionsszenarien einzusetzen. Jedes der besprochenen Verfahren wird in dem Training zunächst theoretisch eingeleitet, anschließend in Python umgesetzt und schließlich in einer kleinen Übung durch die Teilnehmer ausprobiert. Inhaltliche Fragestellungen, die aufgrund von Beispieldatensätzen formuliert werden, dienen dem Kurs als roter Faden durch die Verfahren. Neben den Algorithmen versucht das Training einen Eindruck von Machine Learning Prozessen zu vermitteln. D.h., es wird aufgezeigt, welche Schritte notwendig sind, um einen Machine Learning Task zu lösen und wie diese konkret umgesetzt werden.

Anschließend werden nicht überwachte Szenarien besprochen. Zu diesem Zählen insbesondere Clusteranalysen und die Hauptkomponentenanalyse. Beide Verfahrensklassen dienen der Dimensionsreduktion und werden häufig in Interaktion mit überwachten Lernmethoden eingesetzt. Wie die Verfahren miteinander kombiniert werden und welche Herausforderungen dabei bestehen, erfahren Sie im Kurs.

Lernziele

  • Kennenlernen der Verfahrensklassen und ausgewählter Methoden im Bereich ML
  • Einführung in den Entwicklungsprozess von Machine Learning Tasks
  • Einführung in grundlegenden Techniken des Machine Learning mit Python
  • Eigene Machine Learning Modelle mit Python erstellen und evaluieren

Inhalte

  • Grundlagen des Machine Learnings / Data Minings
    • Überblick über Modelle und Methoden, Über das Problem der Prognose
    • Supervised vs. Unsupervised Learning
  • Overfitting, Underfitting und Parametertuning – Techniken der Modellerstellung
    • Grundproblem, einfache Kreuzvalidierung, 3 Fold-Technik, k-Fold-Validierung
  • Klassifikationsverfahren
    • Entscheidungsbäume, Random Forest, Gradient Boosting Machines, Neuronale Netze
    • Evaluation von Klassifikationsverfahren (ROC-Kurven, Cutoff-Wert, Präzision, Sensitivität, Spezifität)
  • Regressionsprobleme
    • Lineare Regression, Regression Trees, Random Forest, Neuronale Netze, regularisierte Regressionen (Ridge Regression, Lasso Regression, Elastic Net)
    • Evaluation von Regressionsproblemen
  • Clusteranalysen
    • k-Nearest Neighbors, k-Means, agglomerative Clusteranalyse, DBSCAN
  • Hauptkomponentenanalyse
    • Grundbegriffe und Anwendungsszenarien, Ausblick auf Rotationsverfahren, Kriterien zur Dimensionsreduktion, Interpretation

Voraussetzungen

Grundlegende Programmiererfahrung in Python sollte vorhanden sein.

Weitere Informationen

Training am eigenen Laptop

(Softwarevoraussetzungen und Installationsanleitung erhalten Sie im Vorfeld)

Auf einen Blick
+

Kurs-Nr : DSPYTMACHINE
Dauer : 2 Tage
Preis: 1.509,00 € zzgl. MwSt.
1.795,71 € inkl. MwSt.

Fragen zum Training??

Informationen anfordern

Zielgruppe

Data Scientist, Datenanalysten, Statistiker, Mathematiker, Researcher

Kurs buchen

Termin auf Anfrage

Zurück zur Übersicht