+

Machine Learning in R

Das Themenfeld Machine Learning lässt sich in Klassifikations- und Regressionsprobleme unterteilen, die entweder überwachter oder unüberwachter Natur sein können. In diesem Training lernen Sie die unterschiedlichen Problemklassen mit den bedeutendsten Methoden des Machine Learning zu lösen.

Erfahren Sie zunächst, wie Sie Machine Learning Verfahren für überwachte Klassifikations- und Regressionsszenarien einsetzen. Jedes der besprochenen Verfahren wird in dem Training zunächst theoretisch eingeleitet, anschließend in R umgesetzt und schließlich in einer kleinen Übung durch die Teilnehmer ausprobiert. Inhaltliche Fragestellungen, die aufgrund von Beispieldatensätzen formuliert werden, dienen dem Kurs als roter Faden durch die Verfahren. Neben den Algorithmen versucht das Training einen Eindruck von Machine Learning Prozessen zu vermitteln. D.h., es wird aufgezeigt, welche Schritte notwendig sind, um einen Machine Learning Task zu lösen und wie diese konkret umgesetzt werden.

Anschließend werden nicht überwachte Szenarien besprochen. Zu diesen Zählen insbesondere Clusteranalysen und die Hauptkomponentenanalyse. Beide Verfahrensklassen dienen der Dimensionsreduktion und werden häufig in Interaktion mit überwachten Lernmethoden eingesetzt. Wie die Verfahren miteinander kombiniert werden und welche Herausforderungen dabei bestehen, erfahren Sie im Kurs.

Learning objectives

  • Kennenlernen der Verfahrensklassen und ausgewählter Methoden im Bereich ML
  • Einführung in den Entwicklungsprozess von Machine Learning Tasks
  • Einführung in grundlegenden Techniken des Machine Learning mit R
  • Eigene Machine Learning Modelle mit R erstellen und evaluieren

Content

  • Grundlagen des Machine Learning
    • Überblick über Modelle und Methoden, Über das Problem der Prognose
    • Supervised vs. Unsupervised Learning
  • Overfitting, Underfitting und Parametertuning – Techniken der Modellerstellung
    • Grundproblem, einfache Kreuzvalidierung, 3 Fold-Technik, k-Fold-Validierung
  • Klassifikationsverfahren
    • Entscheidungsbäume, Random Forest, Gradient Boosting Machines, Neuronale Netze
    • Evaluation von Klassifikationsverfahren (ROC-Kurven, Cutoff-Wert, Präzision, Sensitivität, Spezifität)
  • Regressionsprobleme
    • Lineare Regression, Regression Trees,  Random Forest, Neuronale Netze, regularisierte Regressionen (Ridge Regression, Lasso Regression, Elastic Net)
    • Evaluation von Regressionsproblemen
  • Clusteranalysen
    • k-Nearest Neighbors, k-Means, Agglomerative Clusteranalyse, DBSCAN
  • Hauptkomponentenanalyse

Grundbegriffe und Anwendungsszenarien, Rotationsverfahren, Kriterien zur Dimensionsreduktion, Interpretation

Requirements

Vorkenntnisse in R sind Voraussetzung einer produktiven Teilnahme. D.h. die Grunddatentypen und syntaktische Strukturen sind bekannt.

Additional information

Training am eigenen Laptop

 (Softwarevoraussetzungen und Installationsanleitung erhalten Sie im Vorfeld)

At a glance
+

Course Nr. : DSRPMACHINE
Duration : 2 Days
Price: 1.509,00 € plus VAT
1.795,71 € incl. Vat

Questions?

Request information

Target audience

Data-Scientist, Datenanalysten, Statistiker, Mathematiker, Researcher

Dieser Kurs richtet sich an Personen, die an dem Themenfeld „Machine Learning“ interessiert sind oder ihre Kenntnisse in diesem Bereich erweitern möchten.

Book course

Date on request

Back to the overview