Die AI-Agenten-Landschaft hat sich bis Ende 2024 erheblich weiterentwickelt und ist nun in drei Hauptschichten organisiert: Agent-Hosting/Serving, Agent-Frameworks und LLM-Modelle & Speicher.
Modell-Serving und Speicher
Im Bereich des Modell-Servings dominieren OpenAI und Anthropic mit geschlossenen API-basierten Diensten, während Anbieter wie Together.AI und Fireworks offene Modelle hinter kostenpflichtigen APIs anbieten. Für lokale Anwendungen sind vLLM für produktionsreife GPU-basierte Lasten sowie Ollama und LM Studio bei Privaten beliebt.
Für die Speicherung von “externem Gedächtnis” der Agenten werden Vektordatenbanken wie Chroma, Weaviate und Pinecone eingesetzt. Auch Postgres mit der pgvector-Erweiterung unterstützt Vektorsuche, während Dienste wie Neon und Supabase Embedding-basierte Suche und Speicherung für Agenten anbieten.
Tools und Agent-Frameworks
Agenten rufen Tools über ein von OpenAI definiertes JSON-Schema auf. Composio ist eine beliebte Allzweck-Bibliothek für Tools, während spezialisierte Anbieter wie Browserbase und Exa Tools für Webbrowsing und ‑suche bereitstellen.
Agent-Frameworks orchestrieren LLM-Aufrufe und verwalten den Agentenzustand. Sie unterscheiden sich in der Verwaltung des Agentenzustands, der Struktur des Kontextfensters, der agentenübergreifenden Kommunikation, den Ansätzen zum Gedächtnis und der Unterstützung offener Modelle.
Agent-Hosting und ‑Serving
Die Zukunft der Agenten liegt in ihrer Behandlung als Dienste, die auf On-Premise- oder Cloud-Infrastruktur bereitgestellt werden. Das Bereitstellen von Agenten als Dienst ist aufgrund der Zustandsverwaltung und sicheren Tool-Ausführung komplexer als das Bereitstellen von LLMs.
Die Entwicklung des Agent-Stacks befindet sich noch in einem frühen Stadium und wird sich voraussichtlich weiter entwickeln, wobei insbesondere Fortschritte in den Bereichen Gedächtnis, Tool-Nutzung, sichere Ausführung und Bereitstellung zu erwarten sind.
Einschätzung
Aus meiner Sicht hinzuzufügen wären noch die Kategorien “Benchmark/Evaluierungs-Tools”, “Industrial AI”, Multiagentensysteme”, “Agentenbasierte Automatisierung”, “Orchestrierung” und “SciAgents”, wobei es zu Überschneidungen mit den anderen Kategorien/Schichten kommen dürfte. Demnächst wahrscheinlich noch Neuroagents.
Quellen: