Jüngste Durchbrüche im Bereich des maschinellen Lernens und der künstlichen Intelligenz, die sich auf wissenschaftliche Daten stützen, revolutionieren die Entdeckung neuer Materialien. Trotz der Fülle der vorhandenen wissenschaftlichen Literatur sind sowohl strukturierte experimentelle Daten als auch chemisches Fachwissen, das leicht in datengesteuerte Arbeitsabläufe integriert werden kann, nur begrenzt verfügbar. Die Motivation, diese Informationen sowie zusätzlichen Kontext aus First-Principle-Berechnungen und physikalisch informierten Deep-Learning-Surrogatmodellen zu integrieren, besteht darin, eine effiziente Erkundung des relevanten chemischen Raums zu ermöglichen und Struktur-Eigenschaftsbeziehungen neuer Materialien a priori vorherzusagen. Letztendlich könnte ein solcher Rahmen die Expertise menschlicher Fachexperten ersetzen.
In dieser Arbeit stellen wir dZiner vor, einen KI-Agenten für Chemiker, der mit Hilfe von großen Sprachmodellen (LLMs) neue Verbindungen mit gewünschten Eigenschaften durch inverses Design (Eigenschaft-zu-Struktur) entdeckt. Konkret nutzt der Agent bereichsspezifische Erkenntnisse aus der wissenschaftlichen Fachliteratur, um neue Materialien mit verbesserten chemischen Eigenschaften vorzuschlagen, die er iterativ unter Verwendung relevanter Surrogatmodelle in einem rationalen Designprozess bewertet, während er gleichzeitig die Designeinschränkungen berücksichtigt.
Das Modell unterstützt sowohl Closed-Loop- als auch Human-in-the-Loop-Feedback-Zyklen und ermöglicht so die Zusammenarbeit zwischen Mensch und KI beim Moleküldesign mit Echtzeit-Eigenschaftsableitung und Bewertung der Unsicherheit und chemischen Machbarkeit.
Wir demonstrieren die Flexibilität dieses Agenten, indem wir ihn auf verschiedene Materialeigenschaften anwenden, darunter Tenside, Liganden und Arzneimittelkandidaten sowie metallorganische Gerüste. Unser Ansatz verspricht, sowohl die Entdeckung neuer Materialien zu beschleunigen als auch das gezielte Design von Materialien mit gewünschten Funktionalitäten zu ermöglichen. Die Methodik ist als Open-Source-Software verfügbar auf https://github.com/mehradans92/dZiner.