Eine kritische Analyse der KI-Strategie im Vergleich zur europäischen Fintech-Realität
Der amerikanische Fintech-Anbieter Brex vollzieht nach eigenen Angaben einen grundlegenden Architekturwechsel: Weg von klassischen, zentral orchestrierten Agenten-Workflows, hin zu einem sogenannten „Agent Mesh” – einem Netz spezialisierter Mini-Agenten, die über einen gemeinsamen Nachrichtenstrom in natürlicher Sprache kommunizieren. Das proklamierte Ziel: bis zu 99 Prozent Automatisierung von Unternehmensausgaben.
Die technische Substanz hinter dem Marketing
Zunächst das Positive: Der architektonische Ansatz ist nicht ohne Substanz. Die Abkehr vom monolithischen Orchestrator-Modell zugunsten lose gekoppelter, spezialisierter Agenten entspricht bewährten Prinzipien verteilter Systeme – übertragen auf die LLM-Ebene. Brex definiert drei zentrale Konzepte: Config (Definition von Agent, Modell, Tools, Subscriptions), MessageStream (Log aller Nachrichten und Zustandswechsel) und Clock (deterministische Event-Reihenfolge). Hinzu kommen eingebaute Evaluatoren: Ein LLM als „Richter” und ein Audit-Agent, der Entscheidungen auf Genauigkeit und Policy-Compliance prüft.
Diese Architektur adressiert reale Probleme regulierter Finanzprozesse: Nachvollziehbarkeit, Revisionssicherheit, deterministische Abläufe. Wenn ein Compliance-Agent, ein Budgetprüfer, ein Belegabgleicher und ein Zahlungsagent über Events koordiniert werden statt in einem fragilen Monolithen zu stecken, ist das konzeptionell sauberer und wartbarer. Der Gedanke, dass klassische Orchestrierungsframeworks mit besseren Modellen zum Engpass werden, ist nachvollziehbar – sie stammen aus einer Zeit, in der man LLMs noch nicht zutraute, ohne enge Leitplanken zu arbeiten.
Die PR-Schere: Kommunikationsintensität versus Substanznachweis
Hier beginnt jedoch die kritische Einordnung. Die 99-Prozent-Automatisierungsbehauptung ist ein Paradebeispiel für das, was man als PR-Schere bezeichnen könnte: Die Diskrepanz zwischen Kommunikationsintensität und nachprüfbarer Substanz.
Was fehlt? Unabhängige Benchmarks. Eine präzise Definition dessen, was als „automatisiert” gilt. Angaben zur Fehlerquote. Daten zur menschlichen Nachbearbeitung. Die Formulierung „Kunden, die stark auf KI setzen, könnten erreichen” ist bezeichnend – sie verlagert die Verantwortung für ausbleibende Ergebnisse prophylaktisch auf den Kunden. Wer die 99 Prozent nicht erreicht, hat eben nicht „stark genug” auf KI gesetzt.
Die Progression von „60–70 Prozent vor dem Brex Assistant” zu „bis zu 99 Prozent” klingt beeindruckend, ist aber ohne Methodik wertlos. Zählt eine automatisch ausgefüllte Spesenabrechnung, die ein Mensch noch absegnen muss, als automatisiert? Was ist mit Ausna…
