+

Machine Learning in Python

Das Themenfeld Machine Learning lässt sich in Klassifikations- und Regressionsprobleme unterteilen, die entweder überwachter oder unüberwachter Natur sein können. In diesem Training lernen sie die unterschiedlichen Problemklassen mit den bedeutendsten Methoden des Machine Learning zu lösen.

Zunächst lernen Sie Machine Learning Verfahren für überwachte Klassifikations- und Regressionsszenarien einzusetzen. Jedes der besprochenen Verfahren wird in dem Training zunächst theoretisch eingeleitet, anschließend in Python umgesetzt und schließlich in einer kleinen Übung durch die Teilnehmer ausprobiert. Inhaltliche Fragestellungen, die aufgrund von Beispieldatensätzen formuliert werden, dienen dem Kurs als roter Faden durch die Verfahren. Neben den Algorithmen versucht das Training einen Eindruck von Machine Learning Prozessen zu vermitteln. D.h., es wird aufgezeigt, welche Schritte notwendig sind, um einen Machine Learning Task zu lösen und wie diese konkret umgesetzt werden.

Anschließend werden nicht überwachte Szenarien besprochen. Zu diesem Zählen insbesondere Clusteranalysen und die Hauptkomponentenanalyse. Beide Verfahrensklassen dienen der Dimensionsreduktion und werden häufig in Interaktion mit überwachten Lernmethoden eingesetzt. Wie die Verfahren miteinander kombiniert werden und welche Herausforderungen dabei bestehen, erfahren Sie im Kurs.

Learning objectives

  • Kennenlernen der Verfahrensklassen und ausgewählter Methoden im Bereich ML
  • Einführung in den Entwicklungsprozess von Machine Learning Tasks
  • Einführung in grundlegenden Techniken des Machine Learning mit Python
  • Eigene Machine Learning Modelle mit Python erstellen und evaluieren

Content

  • Grundlagen des Machine Learnings / Data Minings
    • Überblick über Modelle und Methoden, Über das Problem der Prognose
    • Supervised vs. Unsupervised Learning
  • Overfitting, Underfitting und Parametertuning – Techniken der Modellerstellung
    • Grundproblem, einfache Kreuzvalidierung, 3 Fold-Technik, k-Fold-Validierung
  • Klassifikationsverfahren
    • Entscheidungsbäume, Random Forest, Gradient Boosting Machines, Neuronale Netze
    • Evaluation von Klassifikationsverfahren (ROC-Kurven, Cutoff-Wert, Präzision, Sensitivität, Spezifität)
  • Regressionsprobleme
    • Lineare Regression, Regression Trees, Random Forest, Neuronale Netze, regularisierte Regressionen (Ridge Regression, Lasso Regression, Elastic Net)
    • Evaluation von Regressionsproblemen
  • Clusteranalysen
    • k-Nearest Neighbors, k-Means, agglomerative Clusteranalyse, DBSCAN
  • Hauptkomponentenanalyse
    • Grundbegriffe und Anwendungsszenarien, Ausblick auf Rotationsverfahren, Kriterien zur Dimensionsreduktion, Interpretation

Requirements

Grundlegende Programmiererfahrung in Python sollte vorhanden sein.

Additional information

Training am eigenen Laptop

(Softwarevoraussetzungen und Installationsanleitung erhalten Sie im Vorfeld)

At a glance
+

Course Nr. : DSPYTMACHINE
Duration : 2 Days
Price: 1.400,00 € plus VAT
1.666,00 € incl. Vat

Questions?

Request information

Target audience

Data Scientist, Datenanalysten, Statistiker, Mathematiker, Researcher

Book course

Date on request

Back to the overview