MOC 20775
Performing Data Engineering on Microsoft HD Insight

Preis & Daten
  • 2250 € zzgl. MwSt.
    inkl. Schulungsunterlage und Verpflegung
  • Seminarnummer: MOC 20775
    Dauer: 5 Tage
Unsere Termine

Seminarziel

Nach Abschluss dieses Seminars sind Sie in der Lage, Big-Data-Workflows auf HDInsight zu planen und zu implementieren.

Das Seminar kann zur Vorbereitung auf die Zertifizierungen als Microsoft Certified Solutions Associate (MCSA): Data Engineering with Azure und Microsoft Certified Solutions Expert (MCSE): Data Management and Analytics genutzt werden.

Bitte beachten Sie: Das Seminar ist nur noch bis 30. Juni 2019 verfügbar. Es wird ersetzt durch DP-200T01: Implementing an Azure Data Solution und DP-201T01: Designing an Azure Data Solution.

Inhalt

  • Einführung in HDInsight
    • Big Data
    • Hadoop
    • MapReduce
    • HDInsight
  • Bereitstellung von HDInsight-Clustern
    • HDInsight-Clustertypen
    • Verwaltung von HDInsight-Clustern mit dem Azure-Portal
    • Verwaltung von HDInsight-Clustern mit Azure PowerShell
  • Berechtigung von Benutzern für den Zugriff auf Ressourcen
    • Nicht in die Domäne eingebundene Cluster
    • Konfiguration von in die Domäne eingebundenen HDInsight-Clustern
    • Verwaltung von in die Domäne eingebundenen HDInsight-Clustern
  • Laden von Daten in HDInsight
    • Speichern von Daten für die HDInsight-Verarbeitung
    • Tools für das Laden von Daten
    • Optimieren der Verarbeitungszeit
  • Troubleshooting von HDInsight
    • Analyse von HDInsight-Protokollen
    • YARN-Protokolle
    • Heap Dumps
    • Operations Management Suite
  • Implementierung von Batch-Lösungen
    • Apache-Hive-Speicher
    • Abfragen mit Hive und Pig
    • Operationalisieren von HDInsight
  • Design von Batch-ETL-Lösungen für Big Data mit Spark
  • Datenanalyse mit Spark SQL
  • Datenanalyse mit Hive und Phoenix
  • Azure Stream Analytics
  • Implementierung von Streaminglösungen mit Kafka und HBase
  • Entwicklung von Lösungen für die Echtzeitverarbeitung von Big Data mit Apache Storm
  • Erstellen von Spark-Streaming-Anwendungen

Zielgruppe

  • Dateningenieure, Datenarchitekten, Datenwissenschaftler und Datenentwickler

Voraussetzungen

  • Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen
  • Kenntnisse über gängige statistische Methoden und Best Practices für die Datenanalyse
  • Grundkenntnisse über das Microsoft-Windows-Betriebssystem und seine Kernfunktionalität
  • Praktische Erfahrung mit relationalen Datenbanken

Prüfungen

Dieses Seminar bereitet auf folgende Prüfung vor:

70-775