Während deutsche Unternehmen noch mit einfachen RAG-Pipelines experimentieren, markiert ADORE einen Paradigmenwechsel: von linearer Retrieval-Logik zu strukturiertem Evidenzmanagement. Die eigentliche Innovation liegt nicht in der Agentenorchestierung, sondern in der Frage, die das System beantworten kann – „Woher weiß ich das?” statt nur „Was weiß ich?”.
I. Das Versprechen und seine Vorgeschichte
Enterprise-RAG ist zum Fetisch der Digitalisierungsabteilungen geworden. Vektorsuche, Chunk-Embeddings, Prompt-Tuning – die Mechanik ist verstanden, die Toolchains sind ausgereift, die Proof-of-Concepts stapeln sich. Und doch: Die meisten Systeme scheitern nicht an technischer Komplexität, sondern an epistemischer Naivität. Sie verwechseln Informationsretrieval mit Wissenskonstruktion.
ADORE – „Agentic Deep Research and Orchestration Engine” – adressiert genau dieses Problem. Nicht durch mehr Parameter, nicht durch bessere Embeddings, sondern durch eine architektonische Neuordnung: Die Trennung von Evidenzakkumulation und Wissensgenese. Was auf den ersten Blick wie ein weiteres Multi-Agenten-Framework aussieht, ist bei genauerem Hinsehen ein System mit klarer epistemologischer Position.
II. Die drei Schwächen klassischer RAG-Architekturen
Die Kritik an „retrieve-then-generate”-Pipelines ist nicht neu, aber ADORE formuliert sie präzise:
Oberflächlichkeit. Klassische RAG-Systeme optimieren auf Speed und Kosteneffizienz. Das Ergebnis: plausible, aber flache Antworten. Für FAQ-Automation ausreichend, für strategische Entscheidungsgrundlagen unbrauchbar.
Intransparenz. Woher stammt eine konkrete Aussage im generierten Report? Klassische Systeme können das nicht beantworten – die Generierung ist black box, die Quellen sind bestenfalls als Fußnoten appendiert, nicht aber strukturell mit Claims verknüpft.
Unkontrollierte Vollständigkeit. Wann ist genug recherchiert? Klassische Systeme stoppen nach N Iterationen oder K retrieval calls. Nicht weil die Frage beantwortet ist, sondern weil das Budget erschöpft ist. Das ist Prozesslogik, keine Wissenslogik — was aber nicht unbedingt falsch sein muss, wie die Forschungen von Gerd Gigerenzer zu den sog. Simple Heuristics zeigen1Simple Heuristics That Make Us Smart.
III. Memory Bank als epistemische Infrastruktur
Die zentrale Innovation von ADORE ist die Memory Bank – ein Claim-Evidence-Graph, der nicht einfach Chunks sammelt, sondern strukturierte Wissensfragmente mit expliziten Belegketten speichert. Jeder Claim ist mit konkreter Evidenz verknüpft, jede Evidenz ist einer Quelle zugeordnet, jeder Abschnitt hat zugelassene Evidenz-Subsets.
Das klingt technisch, ist aber konzeptionell radikal: Das System darf nicht „improvisieren”. Die „memory-locked synthesis” erzwingt, dass jede Aussage im finalen Report auf dokumentierte Evidenz zurückführbar ist. Kein Halluzinieren, kein Interpolieren, kein „plausibel klingendes Rauschen”.
Diese architektonische Disziplin löst das Vertrauensproblem generativer Systeme. Nicht durch bessere Modelle, sondern durch strukturelle Constraints. Die Memory Bank ist weniger Wissensspeicher als vielmehr epistemische Firewall.
IV. Evidence-Coverage als Qualitätsmetrik
Der zweite Mechanismus ist subtiler: Evidence-coverage–guided execution. Statt fixer Retrieval-Schleifen führt ADORE einen reflexiven Loop ein: Nach jedem Retrieval-Schritt wird geprüft, welche Teile der Outline noch unzureichend belegt sind. Lücken werden identifiziert, Queries werden gezielt nachgeschärft, weitere Quellen werden erschlossen.
Das System stoppt nicht nach X Iterationen, sondern wenn vordefinierte Coverage-Kriterien erfüllt sind. Das ist näher an menschlichem Research-Verhalten: Man recherchiert, bis man die Frage beantworten kann, nicht bis die Zeit abgelaufen ist.
Hier zeigt sich der Unterschied zwischen Prozessoptimierung und Wissensarchitektur. Klassische RAG-Systeme optimieren Latenz und Token-Effizienz. ADORE optimiert epistemische Vollständigkeit. Das kostet mehr, dauert länger, ist komplexer – aber es liefert, was Enterprise-Kontext tatsächlich braucht: belastbare Grundlagen für Entscheidungen.
V. Agentenorchestierung als Arbeitsteilung
Die Multi-Agenten-Architektur – Grounding Agent, Planning Agent, Execution Agent, Report Generation Agent – ist weniger technische Spielerei als funktionale Differenzierung:
- Grounding Agent: Klärung der Anfrage, Scope-Definition
- Planning Agent: Strukturierung als editierbare Outline
- Execution Agent: Iteratives Retrieval mit Query-Evolution
- Report Generation: Memory-locked Synthesis
Diese Arbeitsteilung spiegelt die Phasen menschlicher Research-Arbeit. Der Unterschied: Das System dokumentiert explizit, was in jeder Phase passiert. Jeder Schritt ist nachvollziehbar, jede Entscheidung ist protokolliert.
Das ist keine bloße Transparenz-Kosmetik. Es ist die Voraussetzung für Auditing. In regulierten Branchen – Finance, Healthcare, Legal – ist Nachvollziehbarkeit keine Nice-to-have-Feature, sondern Compliance-Anforderung.
VI. Die Benchmark-Frage und die PR-Schere
Die Evaluierungsergebnisse sind beeindruckend: RACE-Score 52,65 (Platz 1 DeepResearch Bench), Win-Rate 77% im Head-to-Head, 28% über Human Baseline im Enterprise-Benchmark.
Aber hier beginnt die kritische Frage.
Was genau wurde gemessen? Vollständigkeit? Präzision? Sprachliche Qualität? Nützlichkeit für tatsächliche Entscheidungen? Die Benchmarks messen, was messbar ist – nicht notwendig, was relevant ist.
Die PR-Schere – die Lücke zwischen kommunizierter Leistungsfähigkeit und operativer Realität – öffnet sich genau hier. ADORE mag bessere Reports schreiben als Wettbewerber. Aber schreibt es Reports, die bessere Entscheidungen ermöglichen? Funktioniert es robust mit unstrukturierten Enterprise-Daten? Wie verhält es sich bei widersprüchlichen Quellen, bei Zeitdruck, bei unklaren Fragestellungen?
VII. Epistemische Architektur als Paradigma
ADORE ist weniger ein Produkt als ein Architektur-Paradigma. Die eigentliche Innovation liegt nicht in der technischen Umsetzung, sondern in der konzeptionellen Entscheidung: Wissen ist nicht das, was ein LLM generiert, sondern das, was strukturiert dokumentiert und nachvollziehbar belegt ist.
Diese Position hat Konsequenzen:
- Langsamkeit als Qualitätsmerkmal: Gute Research braucht Zeit. Systeme, die das nicht akzeptieren, liefern schlechte Research.
- Komplexität als Notwendigkeit: Epistemische Disziplin ist nicht einfach. Systeme, die das verschleiern, sind unseriös.
- Dokumentation als Kernfunktion: Was nicht dokumentiert ist, ist nicht passiert. Systeme, die das ignorieren, sind nicht auditierbar.
IX. Offene Fragen
Drei Fragen bleiben:
Erstens: Kostenstruktur. Ein Multi-Agenten-System mit iterativem Retrieval ist teuer. Wann rechtfertigt Qualität den Aufwand? Wo ist „gut genug” besser als „systematisch vollständig”?
Zweitens: Robustheit. Wie verhält sich ADORE, wenn der Planning Agent eine suboptimale Outline erstellt? Wenn Retrieval keine relevante Evidenz findet? Wenn Quellen widersprüchlich sind?
Drittens: Integration. Wie lässt sich ADORE in bestehende Enterprise-Infrastrukturen einbetten? Welche Datenquellen kann es erschließen? Welche Compliance-Anforderungen kann es erfüllen?
X. Fazit: Epistemologie vor Technologie
ADORE zeigt, dass die Zukunft von Enterprise-AI nicht in besseren Modellen liegt, sondern in besseren Architekturen. Architekturen, die epistemische Disziplin erzwingen. Architekturen, die Nachvollziehbarkeit strukturell garantieren. Architekturen, die Wissenskonstruktion als mehrstufigen, dokumentierten Prozess verstehen.
Das ist keine technische Innovation. Es ist eine konzeptionelle Neuausrichtung. Von „Was kann das Modell?” zu „Was darf das System?”. Von Optimierung auf Plausibilität zu Optimierung auf Nachweisbarkeit. Von generativer Beliebigkeit zu strukturierter Evidenz.
Ob ADORE sich durchsetzt, wird weniger von Benchmarks abhängen als von der Frage, ob Unternehmen bereit sind, Komplexität als Preis für Qualität zu akzeptieren.
