Kursüberblick
Warum LearnRAG?
LearnRAG ist ein 100% lokales Retrieval-Augmented Generation (RAG) System, das mit jedem lokal laufenden LLM verwendet werden kann. Im Gegensatz zu cloudbasierten KI-Systemen wird keine Daten an externe Dienste weitergegeben – alles läuft sicher auf Ihrem eigenen Rechner.
- Läuft vollständig auf lokaler Hardware – keine Internetverbindung erforderlich
- Leistungsstarke hybride Suche mit BM25, FAISS und GraphRAG
- Volle Kontrolle über Datenschutz & Sicherheit
- Optimiert für schnelle und präzise Retrieval-Augmented-Generierung
Dieser Workshop vermittelt Ihnen, wie Sie eine effiziente RAG-Pipeline aufbauen, analysieren und optimieren, während Sie die volle Datenhoheit behalten.
Schwerpunkte des Workshops
- Datenextraktion & Chunking: Optimale Vorbereitung von Text für Retrieval
- Hybride Retrieval-Strategien: Kombination von BM25, FAISS & Graph-basiertem Retrieval
- Query Expansion & Reranking: Verbesserung der Suchgenauigkeit mit HyDE & Neural Reranking
- Multi-Step Agentic Retrieval: Interaktives und kontextbewusstes Retrieval
- Optimierung der RAG-Pipeline: Performance-Tuning, Latenzreduktion & Benchmarking
Im Gegensatz zu cloudbasierten KI-Retrieval-Modellen verarbeitet LearnRAG alles lokal, sodass volle Datensicherheit und Privatsphäre gewährleistet sind.
- Keine externen API-Aufrufe
- Kein Risiko von Datenlecks
- Volle Kontrolle über Dokumentenerfassung & Indexierung
In diesem Workshop lernen Sie, wie Sie effiziente Retrieval-Strategien implementieren, ohne Datenschutz zu gefährden.
Fazit
Diese drei Tage ermöglichen uns eine umfassende Erkundung von:
- Grundlagen von RAG & Retrieval (Tag 1)
- Optimierung, Ranking & Chat-Awareness (Tag 2)
- Fortgeschrittene Retrieval-Techniken & Agentic Retrieval (Tag 3)
Zielgruppe
- Entwickler & Ingenieure, die mit KI-Retrieval-Systemen arbeiten
- Data Scientists, die Such- & Retrieval-Pipelines optimieren möchten
- KI-Enthusiasten, die praktische RAG-Anwendungen erkunden möchten
Kursinhalt
Tag 1: Einführung & erste Schritte mit RAG
Session 1: Grundlagen von Retrieval-Augmented Generation (RAG)
- Was ist RAG und warum ist es wichtig?
- Herausforderungen beim Aufbau effektiver Retrieval-Pipelines
- Überblick über bestehende RAG-Implementierungen
Session 2: Einrichtung von LearnRAG
- Installation & Einrichtung (100% lokal, kein Internet erforderlich)
- LearnRAG starten und die bestehende Retrieval-Pipeline untersuchen
- Der RAG-Workflow: Dokumentenerfassung → Retrieval → Generierung
Session 3: Dokumentenverarbeitung & Chunking
- Warum ist die Vorverarbeitung von Dokumenten entscheidend?
- Verschiedene Chunking-Strategien (Semantisches vs. festes Chunking)
- Praxisübung: Optimierung der Textzerlegung in LearnRAG
Session 4: Hybride Retrieval-Methoden – Ein erster Blick
- Überblick über BM25, FAISS & Graph-basiertes Retrieval
- Praxisübung: Vergleich von Retrieval-Strategien in LearnRAG
Tag 2: Verbesserung von Retrieval & Kontextverständnis
Session 5: Query Expansion & Neural Reranking
- Wie HyDE (Hypothetical Document Expansion) die Recall-Rate verbessert
- Die Rolle von Neural Rerankers für präzisere Ergebnisse
- Praxisübung: Feintuning von HyDE & Neural Reranking in LearnRAG
Session 6: Graph-basiertes Retrieval mit GraphRAG
- Aufbau eines Knowledge Graphs aus Dokumenten
- Wie GraphRAG das kontextuelle Retrieval verbessert
- Praxisübung: Optimierung von GraphRAG für bessere Antworten
Session 7: Kontextbewusstes Retrieval in RAG-Pipelines
- Chat-Speicher & Langzeitkontext für verbesserte Antworten
- Experimentieren mit Langzeit-Nutzerinteraktionen
- Praxisübung: Retrieval-Anpassung für Chat-History-Awareness
Session 8: Performance-Optimierung in RAG
- Identifizierung von Flaschenhälsen in Retrieval-Geschwindigkeit
- Praxisübung: Performance-Analyse & Optimierung in LearnRAG
Tag 3: Fortgeschrittene Retrieval-Techniken & Agentic Retrieval
Session 9: Erweiterte hybride Retrieval-Strategien
- Über BM25 & FAISS hinaus: Alternative Indexierungsstrategien
- Dynamisches Reranking und Gewichtung von Retrieval-Methoden
- Praxisübung: Adaptive Retrieval-Systeme in LearnRAG entwickeln
Session 10: Multi-Step Retrieval & Agentic Approaches
- Zero-Shot und Multi-Step Retrieval-Modelle
- Wann sollte ein LLM weitere Informationen anfordern statt zu raten?
- Praxisübung: Implementierung eines Agentic Retrieval-Ansatzes
Session 11: Benchmarking & Fehleranalyse in Retrieval-Pipelines
- Best Practices zur Evaluierung von RAG-Pipelines
- Echte Test-Szenarien & Debugging von Retrieval-Fehlern
- Praxisübung: Erstellung von Performance-Benchmarks für LearnRAG
Session 12: Abschlussdiskussion & nächste Schritte
- Was haben wir gelernt & wie kann man das Wissen anwenden?
- Ideen für weitere Verbesserungen
- Offene Q&A-Runde & Networking