GC-DE Data Engineering on Google Cloud Platform

Übersicht

In diesem Kurs erlernen die Teilnehmer das Design und die Entwicklung skalierbarer Datenverarbeitungssysteme auf der Google Cloud Platform. Sie implementieren Batch- und Streaming-Datenpipelines mit Cloud Dataflow, gewinnen Geschäftseinblicke aus großen Datenmengen mit BigQuery und arbeiten mit Machine Learning-Modellen in TensorFlow und Cloud ML. Darüber hinaus lernen sie, unstrukturierte Daten mit Spark und ML-APIs in Cloud Dataproc zu nutzen und Echtzeitanalysen aus Streaming-Daten zu ermöglichen.

Lernziele

    Dieser Kurs vermittelt den Teilnehmern folgende Fähigkeiten:
  • Entwerfen und erstellen Sie Datenverarbeitungssysteme auf der Google Cloud Platform
  • Verarbeiten Sie Batch- und Streaming-Datendurch Implementierung von Autoscaling-Datenpipelines in Cloud Dataflow
  • Leiten Sie mithilfe von Google BigQuery Geschäftseinblicke aus extrem großen Datenmengen ab
  • Trainieren, evaluieren und vorhersagen mit Machine Learning-Modellen mit Tensorflow und Cloud ML
  • Nutzen Sie unstrukturierte Daten mithilfe von Spark- und ML-APIs in Cloud Dataproc
  • Ermöglichen Sie sofortige Einblicke aus Streaming-Daten

Hinweise

Dieses Seminar wird in Kooperation mit der TÜV Rheinland Akademie durchgeführt.

Zielgruppe

    Dieser Kurs richtet sich an erfahrene Entwickler, die für die Verwaltung großer Datentransformationen verantwortlich sind, einschließlich:
  • Extrahieren, Laden, Transformieren, Reinigen und Validieren von Daten
  • Entwerfen von Pipelines und Architekturen für die Datenverarbeitung
  • Erstellen und Pflegen von maschinellen Lern- und statistischen Modellen
  • Abfragen von Datensätzen, Visualisieren von Abfrageergebnissen und Erstellen von Berichten

Voraussetzungen

Teilnehmer sollten den Kurs "Google Cloud Fundamentals: Big Data & Machine Learning" (Seminarnummer: 28005) besucht oder vergleichbare Kenntnissse haben. Außerdem sind Grundkenntnisse in gängigen Abfragesprachen wie SQL, Erfahrung mit Datenmodellierung, Extrahieren, Transformieren, Laden von Aktivitäten, Entwickeln von Anwendungen mit einer gemeinsamen Programmiersprache wie Python bekannt. Teilnehmer solten auch mit Machine Learning und/oder Statistiken vertraut sein.

Inhalte

  • Google Cloud Dataproc-Übersicht
  • Dataproc-Jobs ausführen
  • Integration von Dataproc in die Google Cloud Platform
  • Unstrukturierte Daten mit den Machine-Learning-APIs von Google erfassen
  • Serverlose Datenanalyse mit BigQuery
  • Serverlose Autoscaling-Datenpipelines mit Dataflow
  • Erste Schritte mit maschinellem Lernen
  • Erstellen von ML-Modellen mit Tensorflow
  • Skalierung von ML-Modellen mit CloudML
  • Feature-Entwicklung
  • Architektur von Streaming-Analyse-Pipelines
  • Variable Volumes aufnehmen
  • Streaming-Pipelines implementieren
  • Streaming-Analysen und Dashboards
  • Hoher Durchsatz und niedrige Latenz mit Bigtable

Termine

Bitte fragen Sie uns nach Terminen und Preisen.
Ansprechpartner Training
Ivana Damnjancuk
+41 44 842 77 11
ch-info@claranet.com