Kursüberblick
Dieser 1-tägige Kurs konzentriert sich auf die Erstellung intelligenter Anwendungen, die Bilder und Dokumente mit verschiedenen multimodalen Modellen und agentenbasierten Tools sehen, interpretieren und grundieren können. Lernende untersuchen, wie visuelle und Dokumenteingaben mit Sprachmodellen kombiniert werden können, um strukturierte Extraktions-, Analyse- und Entscheidungsfindungsworkflows zu ermöglichen. Der Kurs betont praktische Muster zum Extrahieren von Informationen, zur Orchestrierung von Werkzeugen und zur Verankerung von Modellantworten in visuellen Daten.
Zielgruppe
Dieser Kurs richtet sich an Entwickler, KI-Ingenieure und technische Experten, die Anwendungen erstellen möchten, die mit Bildern und Dokumenten mit multimodalen, agentgesteuerten Ansätzen arbeiten. Es eignet sich am besten für Lernende mit grundlegender Programmiererfahrung und allgemeinem Verständnis von Cloud- oder KI-Konzepten.