Wir beraten Sie gerne!
+49 40 253346-10     Kontakt
> > > 54011

Data Science - Grundlagen der Datenauswertung bei Big Data Lösungen (54011)

 

Kursüberblick

Anhand des Twitter Projekts und mit Hilfe des Vorgehensmodells CRISP-DM lernen Sie, wie ein Data Science Projekt organisiert und realisiert werden kann.

Im Praxisteil wird Ihnen die wissenschaftliche Sprache R nähergebracht, indem Sie selbst verschiedene Auswertungen auf die Twitter Daten anwenden. Ergänzend erhalten Sie eine Einführung in verschiedene Data Science Methoden und die dazugehörigen Anwendungsfälle.

Zielgruppe

Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, System- und Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen möchten.

Voraussetzungen

Teilnehmer, die vorher unser Seminar Big Data – Data Engineering Grundlagen besucht haben oder gleichwertige Vorkenntnisse mitbringen, werden von dem Seminar optimal profitieren.

Kursinhalt

Data Science Überblick
  • Mindset change (Data Thinking, Data Discovery, Data Wrangling, Data Cleansing)
  • Business Intelligence vs Advanced Analytics
  • Descriptive Analytics
  • Data Mining
  • Predictive Analytics
  • Prescriptive Analytics
  • Cognitive Analytics
Use Cases
  • Data- Driven Marketing
  • Fraud Detection
  • Predictive Maintenance
  • Recommender Systeme
  • Autonomes Fahren
  • Predictive Planning
Vorgehensmodell
  • CRISP-DM als konzeptuelles Prozessmodell zur Datenanalyse
Methoden
  • Pearson- Korrelationskoeffizient
  • Clustering
  • Assoziation
  • Dimensionsreduktion
  • Text Mining/ Web Mining
  • Regression (lineare, logistische)
  • Time Series Analysis
  • Klassifikation mit Entscheidungsbäumen
  • Neuronale Netze
  • Deep Learning
  • Reinforced Learning
  • Cognitive Computing
  • Hypothesentests
  • Visualisierung
Tools und Sprachen
  • R
  • Python
  • IBM SPSS Statistics
  • IBM SPSS Modeler
  • Spark
  • Tableau
Hands on – R
  • Sentiment- Analyse von Twitterdaten mit R
  • Logistisches Regressionsmodell für Gesundheitsdaten mit R
Classroom Training

Dauer 2 Tage

Preis (exkl. MwSt.)
  • Deutschland: 1.290,- €

Sprache der Kursunterlagen: englisch

 
Zum Buchen bitte auf den Ortsnamen klicken Kurstermine
Deutschland
06.02. - 07.02.2020 Stuttgart
11.06. - 12.06.2020 Hamburg
17.08. - 18.08.2020 München
01.10. - 02.10.2020 Düsseldorf