Hintergrund
Offene Daten sind ein zentraler Baustein für Transparenz und datenbasierte Entscheidungen. Doch ihre Nutzung scheitert oft an Unübersichtlichkeit, technischen Hürden oder fehlender Transparenz über die verwendeten Datenquellen.
Gleichzeitig entwickeln sich KI-Assistenten stetig weiter und unterstützen schon heute bei der Arbeit mit Daten, wie wir zum Beispiel in diesem Artikel ausführen.
Mit diesem Projekt haben wir das Potenzial von MCP, einem offenen Standard zur Verbindung von Sprachmodellen mit externen Datenquellen - erprobt. Wie funktionieren MCP-Server genau und sind sie in der Lage Nutzer:innen ohne technisches Vorwissen die Suche, Analyse und Visualisierung der offenen Daten Berlins zu erleichtern?
Unsere Erkenntnisse zu den MCP-Servern, insbesondere auch zu den technischen Limitationen und Herausforderungen haben wir in einem ausführlichen Blogpost zusammengetragen.
Unser Praxisansatz: Zwei MCP-Server für Berlins offene Daten
In diesem Projekt haben wir zwei MCP-Server für Berlin entwickelt und getestet:
Der Open Data Portal MCP-Server ermöglicht den direkten, KI-gestützten Zugriff auf das Berliner Datenportal. Nutzer:innen können in natürlicher Sprache nach Datensätzen suchen, Metadaten abrufen, Datenvorschauen anzeigen lassen oder Aggregationen und Analysen durchführen.
Beispielsweise können Fragen wie „In welchen Bezirken gibt es die meisten Fahrraddiebstähle pro Jahr?“ oder „Wo finde ich den nächsten Trinkbrunnen?“ direkt beantwortet werden.
Der Datawrapper MCP-Server geht einen Schritt weiter und ermöglicht die Erstellung von Visualisierungen ohne Programmierkenntnisse. Nutzer:innen können per Sprachbefehl Diagramme, Karten oder Tabellen erstellen und veröffentlichen.
Ein Beispiel: „Erstelle mir ein Balkendiagramm, das die Anzahl der Kitas in Berlin pro Bezirk zeigt.“
Fazit: Auf die Datenqualität kommt es an!
Die MCP-Server bieten einen schnellen Überblick über verfügbare Datensätze und unterstützen Nutzer:innen bei der Exploration und ersten Analysen. Besonders für Nutzer:innen ohne technisches Vorwissen erleichtern sie den Einstieg in die Arbeit mit offenen Daten.
Gleichzeitig zeigte sich, dass MCP-Server kein Ersatz für Fachwissen sind. Die Einordnung von Ergebnissen, die Bewertung der Datenqualität und komplexere Analysen erfordern weiterhin Hintergrundwissen. Auch bei der Erstellung von Visualisierungen sind spezialisierte Tools wie Datawrapper für präzise Anpassungen besser geeignet.
Ein weiteres wichtiges Ergebnis ist, dass die Qualität der Daten und Metadaten der entscheidende Faktor für die Leistungsfähigkeit der MCP-Server ist. Gut strukturierte und dokumentierte Datensätze ermöglichen deutlich bessere Ergebnisse als unstrukturierte oder schlecht dokumentierte Daten.
Der zugrundeliegende Code unserer MCP-Server liegt auf GitHub offen zugänglich. Wir freuen uns über Feedback und Anmerkungen.