"The Dangerous Art of Text Mining" von Jo Guldi untersucht die Chancen und Risiken des Text Mining in der Forschung. Das Buch hebt die bahnbrechenden Möglichkeiten hervor, die durch die Analyse von Wortverwendungen über die Zeit entstehen, warnt aber gleichzeitig vor den Gefahren, die auftreten können, wenn die Geisteswissenschaften nicht einbezogen werden.
In seiner Rezension auf H Soz Kult setzt sich Simon Specht mit den zentralen Aussagen des Buches auseinander. Während sie in ihrem früheren Werk, dem „History Manifesto“, eine Rückbesinnung auf langfristige historische Fragestellungen forderte, warnt sie nun vor den Gefahren, die aus einer historisch uninformierten Anwendung von Data Science resultieren können. Guldi, Professorin für quantitative Theorien und Methoden an der Emory University, verfolgt das Ziel, sowohl Datenwissenschaftler für die Historizität ihrer Materialien zu sensibilisieren als auch Historikern zu zeigen, wie Text Mining fruchtbar eingesetzt werden kann.
Das Buch ist in drei Hauptteile gegliedert.
Im ersten Teil wird die Kluft zwischen den quantifizierungsskeptischen Geisteswissenschaften und der geschichtslosen Data Science thematisiert. Guldi argumentiert, dass die Data Science oft die Produktionsbedingungen historischer Daten ignoriert und dadurch zu Fehlinterpretationen neigt. Sie bietet Richtlinien an, um diese Missverständnisse zu vermeiden, und betont die Notwendigkeit eines „hybrid thinking“, das eine Zusammenarbeit zwischen Datenwissenschaftlern und Historikern fördert.
Im zweiten Teil präsentiert Guldi verschiedene Fallstudien, in denen sie Algorithmen des Text Mining anwendet, insbesondere auf das Korpus der britischen Parlamentsdebatten von 1806 bis 1911. Hierbei stellt sie fest, dass die Algorithmen oft nicht die komplexen historischen Fragestellungen angemessen abbilden können. Besonders überzeugend ist ihr Ansatz in einer Fallstudie über Umweltaktivisten im US-Kongress, wo sie einen vollständigen Zyklus einer „critical search“ demonstriert.
Im dritten Teil plädiert Guldi dafür, dass kritisch reflektiertes Text Mining dazu beitragen kann, historiographische Narrative zu überprüfen und neue Perspektiven für zukünftige Studien zu schaffen. Sie hebt hervor, dass Text Mining auch zur demokratischen Öffentlichkeit beitragen kann, wenn Bürger Zugang zu den Daten ihrer Parlamente erhalten.
Trotz einiger Schwächen, wie etwa zahlreichen Satzfehlern und unzureichenden Reflexionen über die Algorithmen im zweiten Teil, bietet das Buch laut Specht spannende Einsichten in das Potenzial des Text Mining für die Geschichtswissenschaft. Guldi fordert eine stärkere Verbindung zwischen Geschichts- und Datenwissenschaften und unterstreicht die Relevanz historischer Kompetenzen in der heutigen datengetriebenen Welt.
Quelle und weitere Informationen:
Simon Specht, Rezension zu: Guldi, Jo: The Dangerous Art of Text Mining. A Methodology for Digital History. Cambridge 2023 , ISBN 978-1-009-26299-6, in: H-Soz-Kult, 20.11.2024, https://www.hsozkult.de/publicationreview/id/reb-141879.
The Dangerous Art of Text Mining. A Methodology for Digital History
Kommentar hinzufügen
Kommentare