Übersicht

Open Data MCP-Server

Zwei prototypische MCP-Server, um Berlins offene Daten noch besser zu finden, analysieren und visualisieren zu können

Hintergrund

Offene Daten sind ein zentraler Baustein für Transparenz und datenbasierte Entscheidungen. Doch ihre Nutzung scheitert oft an Unübersichtlichkeit, technischen Hürden oder fehlender Transparenz über die verwendeten Datenquellen.

Gleichzeitig entwickeln sich KI-Assistenten stetig weiter und unterstützen schon heute bei der Arbeit mit Daten, wie wir zum Beispiel in diesem Artikel ausführen.

Mit diesem Projekt haben wir das Potenzial von MCP, einem offenen Standard zur Verbindung von Sprachmodellen mit externen Datenquellen - erprobt. Wie funktionieren MCP-Server genau und sind sie in der Lage Nutzer:innen ohne technisches Vorwissen die Suche, Analyse und Visualisierung der offenen Daten Berlins zu erleichtern?

Unsere Erkenntnisse zu den MCP-Servern, insbesondere auch zu den technischen Limitationen und Herausforderungen haben wir in einem ausführlichen Blogpost zusammengetragen.

Unser Praxisansatz: Zwei MCP-Server für Berlins offene Daten

In diesem Projekt haben wir zwei MCP-Server für Berlin entwickelt und getestet:

Der Open Data Portal MCP-Server ermöglicht den direkten, KI-gestützten Zugriff auf das Berliner Datenportal. Nutzer:innen können in natürlicher Sprache nach Datensätzen suchen, Metadaten abrufen, Datenvorschauen anzeigen lassen oder Aggregationen und Analysen durchführen.

Beispielsweise können Fragen wie „In welchen Bezirken gibt es die meisten Fahrraddiebstähle pro Jahr?“ oder „Wo finde ich den nächsten Trinkbrunnen?“ direkt beantwortet werden.

Der Datawrapper MCP-Server geht einen Schritt weiter und ermöglicht die Erstellung von Visualisierungen ohne Programmierkenntnisse. Nutzer:innen können per Sprachbefehl Diagramme, Karten oder Tabellen erstellen und veröffentlichen.

Ein Beispiel: „Erstelle mir ein Balkendiagramm, das die Anzahl der Kitas in Berlin pro Bezirk zeigt.“

Fazit: Auf die Datenqualität kommt es an!

Die MCP-Server bieten einen schnellen Überblick über verfügbare Datensätze und unterstützen Nutzer:innen bei der Exploration und ersten Analysen. Besonders für Nutzer:innen ohne technisches Vorwissen erleichtern sie den Einstieg in die Arbeit mit offenen Daten.

Gleichzeitig zeigte sich, dass MCP-Server kein Ersatz für Fachwissen sind. Die Einordnung von Ergebnissen, die Bewertung der Datenqualität und komplexere Analysen erfordern weiterhin Hintergrundwissen. Auch bei der Erstellung von Visualisierungen sind spezialisierte Tools wie Datawrapper für präzise Anpassungen besser geeignet.

Ein weiteres wichtiges Ergebnis ist, dass die Qualität der Daten und Metadaten der entscheidende Faktor für die Leistungsfähigkeit der MCP-Server ist. Gut strukturierte und dokumentierte Datensätze ermöglichen deutlich bessere Ergebnisse als unstrukturierte oder schlecht dokumentierte Daten.

Weitere Informationen

Der zugrundeliegende Code unserer MCP-Server liegt auf GitHub offen zugänglich. Wir freuen uns über Feedback und Anmerkungen.

Verwandte Artikel

MCP-Server im Praxistest mit Berlins offenen Daten

15-20 Minuten

Generative KI hat das Potenzial, den Zugang zu offenen Daten zu vereinfachen. Wir haben zwei MCP-Server entwickelt, damit Berlins offene Daten mithilfe von KI-gestützten Schnittstellen noch besser gefunden, analysiert und visualisiert werden können. In diesem Praxisartikel erklären wir, wie MCP-Server funktionieren und was wir bei der Entwicklung gelernt haben.