Datenübernahme von CORRECTIV.Lokal
Auszug aus https://github.com/correctiv/grundwasser-data:
Grundwasser Daten
Das Grundwasser in Deutschland sinkt dramatisch. CORRECTIV hat erstmals für Daten von rund 6.700 Grundwassermessstellen einen Überblick erstellt und sie im Vergleich ausgewertet.
Methodik
Grundlage unserer Analyse sind Rohdaten von Grundwassermessstellen aus 13 Bundesländern. Wir haben die Daten durch eine Kombination aus Scraping, also dem Herunterladen von Daten von den Webseiten der Behörden, und Presseanfragen gesammelt. Die von uns ausgewerteten Grundwassermessstellen liegen in unterschiedlichen Tiefen.
In einigen Bundesländern werden die Grundwasserstände täglich gemessen. In anderen wird jede zweite Woche oder einmal im Monat gemessen. Um die Daten zu normalisieren, haben wir für jede Messstelle den durchschnittlichen Grundwasserstand für jeden Monat zwischen 1990 und 2021 berechnet. Wenn für eine Messstelle weniger als 95 Prozent der Monatsdaten zur Verfügung standen, haben wir sie aus unserer Analyse ausgeschlossen. In Bremen, Hamburg und dem Saarland war nach diesem Kriterium die Datenlage nicht ausreichend für unsere Auswertung.
Zusätzlich führten wir einen halbautomatischen Test auf Datengenauigkeit durch. Dafür haben wir das Changepoint package in R verwendet. Wir untersuchten für jede Messstelle sprunghafte Veränderungen im Werteverlauf, was auf Fehler in den Daten hindeuten kann. Wenn beispielsweise eine Messstelle ausgetauscht wird und die Messungen nicht für die neue Höhe neu kalibriert werden, kann es den Anschein haben, dass der Grundwasserspiegel plötzlich gestiegen ist. Anschließend haben wir die Daten für jede Messstelle, bei der solche Sprünge identifiziert wurden, visuell überprüft und die fehlerhaften Stationen aus unserer Analyse entfernt.
Schließlich berechneten wir den 32-Jahres-Trend mithilfe des Mann-Kendall-Trendtests, der auf langfristig steigende oder fallende Trends prüft. Wir haben die Trend-Free Pre-Whitening-Variante des Tests verwendet. Die Analyse ergab den Trend als Veränderung in Metern pro Monat. Um die Daten zu normalisieren, teilten wir dann für jede Messstelle den Trend durch den Werteumfang der Messstelle (Differenz zwischen dem höchsten und dem niedrigsten Monatsmittelwert) und rechneten ihn auf ein Jahr hoch, um den Trend in Prozent pro Jahr ausdrücken zu können.