Analyzing with Cloudera Data Warehouse (ACDW)

 

Kursüberblick

In diesem viertägigen Kurs "Analyzing with Data Warehouse" lernen Sie, traditionelle Datenanalyse- und Business-Intelligence-Fähigkeiten auf Big Data anzuwenden. In diesem Kurs werden die Werkzeuge vorgestellt, die Datenexperten benötigen, um mit SQL und vertrauten Skriptsprachen auf komplexe Datensätze zuzugreifen, sie zu bearbeiten, umzuwandeln und zu analysieren.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Zielgruppe

Dieser Kurs richtet sich an Datenanalysten, Business Intelligence-Spezialisten, Entwickler, Systemarchitekten und Datenbankadministratoren. Einige SQL-Kenntnisse werden vorausgesetzt, ebenso wie grundlegende Kenntnisse der Linux-Befehlszeile.

Kursziele

Durch Diskussionen unter der Leitung eines Ausbilders und interaktive, praktische Übungen lernen die Teilnehmer, sich im Ökosystem zurechtzufinden und zu lernen, wie man:

  • Verwendung von Apache Hive und Apache Impala für den Datenzugriff durch Abfragen
  • Identifizieren von Unterschieden zwischen Hive und Impala, z. B. Unterschiede in der Syntax, den Datenformaten und den unterstützten Funktionen
  • Schreiben und Ausführen von Abfragen, die Funktionen, Aggregatfunktionen und Unterabfragen verwenden
  • Verwendung von Joins und Unions zur Kombination von Datensätzen
  • Erstellen, Ändern und Löschen von Tabellen, Ansichten und Datenbanken
  • Daten in Tabellen laden und Abfrageergebnisse speichern
  • Auswahl von Dateiformaten und Entwicklung von Partitionierungsschemata für bessere Leistung
  • Analyse- und Fensterfunktionen nutzen, um Einblick in ihre Daten zu erhalten
  • Speichern und Abfragen komplexer oder verschachtelter Datenstrukturen
  • Verarbeitung und Analyse von halbstrukturierten und unstrukturierten Daten
  • Optimieren und Erweitern der Fähigkeiten von Hive und Impala
  • Bestimmen, ob Hive, Impala, ein RDBMS oder eine Mischung aus diesen die beste Wahl für eine bestimmte Aufgabe ist
  • Nutzen Sie die Vorteile des CDP Public Cloud Data Warehouse

Kursinhalt

  • Grundlagen für Big Data Analytics
  • Einführung in Apache Hive und Impala
  • Abfragen mit Apache Hive und Impala
  • Allgemeine Operatoren und eingebaute Funktionen
  • Data Management
  • Datenspeicherung und Leistung
  • Arbeiten mit mehreren Datensätzen
  • Analytische Funktionen und Fensterung
  • Komplexe Daten
  • Analysieren von Text
  • Apache Hive-Optimierung
  • Apache Impala-Optimierung
  • Erweitern von Hive und Impala
  • Die Wahl des besten Werkzeugs für die Aufgabe
  • CDP Öffentliches Cloud Data Warehouse
  • Anhang: Apache Kudu

Preise & Trainingsmethoden

Online Training

Dauer
4 Tage

Preis
  • US$ 3.520,–
Classroom Training

Dauer
4 Tage

Preis
  • Deutschland: US$ 3.520,–
  • Schweiz: US$ 5.250,–

Derzeit gibt es keine Trainingstermine für diesen Kurs.