GFF und AK Zensus legen Verfassungsbeschwerde gegen das Zensusvorbereitungsgesetz 2021 ein, und: Qualitätstests – Von der Unsinnigkeit der Begründung der Bundesregierung der heimlichen und nicht anonymisierten Volkszählung im Vorfeld des Zensus 2021

Zum Ende letzten Jahres beschlossen Bundesregierung und Bundesrat eiligst eine Ergänzung des „Zensusvorbereitungsgesetzes 2021“ (ZensVorbG2021), die mit fast unmittelbarer Wirkung im Januar 2019 dazu führte, dass von allen in Deutschland bei den Meldeämtern registrierten Menschen umfassende persönliche Daten zentral bei den Statistikämtern von Bund und Ländern zusammengetragen worden sind. Diese Daten werden – anders als bei jeder Volkszählung, die dem Volkszählungsurteil vom 15.12.1983 gerecht werden will – nicht anonymisiert und sollen zwei Jahre lang dazu dienen, dass die Programmierer der Statistikbehörden (oder der angeheuerten privaten IT-Unternehmen!) diese Daten zum Testen ihrer Software für die in 2021 bevorstehende nächste Volkszählung („Zensus 2021“) benutzen können.

Dieses Vorgehen widerspricht in vielem den Grundsätzen von Datensparsamkeit und Verhältnismäßigkeit. Eine Datenschutzfolgeabschätzung zu etwaigen Risiken und Folgen dieser Datensammelwut hat das Bundesinnenministerium bis zum Mai 2019 – also Wochen nach den massenhaften Datentransfers – noch gar nicht erstellt.

So ist es gut und richtig, dass gegen diese Maßnahme vor Gericht gezogen wird. Der zunächst eingelegte Eilantrag ist zwar gescheitert, aber die Richter des Bundesverfassungsgerichts (BVerfG) haben in ihrer Ablehnung ungewöhnlich offen mitgeteilt, dass sie die Skepsis teilen und (implizit) die Einlegung einer Verfassungsbeschwerde nahegelegt. Das ist seitens der Gesellschaft für Freiheitsrechte (GFF) in Zusammenarbeit mit dem Arbeitskreis Zensus (AK Zensus) vor einigen Wochen denn auch geschehen und der AK Zensus berichtet heute in einer aktuellen Pressemitteilung dazu.

Der folgende Gastbeitrag von Jens Kubieziel nimmt sich eines der Hauptargumente der Bundesregierung zur Begründung der Datensammlung vom Januar 2019 vor: Die angebliche Notwendigkeit dieser heimlichen Volkszählung zur Durchführung von Software-Qualitätstest. Der Beitrag wurde für den AK Zensus verfasst. Wir wünschen angenehme Lektüre und danken bei dieser Gelegenheit Jens Kubieziel für seine sachliche und expertise Auseinandersetzung zur Sache:

 

Im Rahmen der von der Bundesregierung beschriebenen Maßnahmen des neuen §9a ZensVorbG2021 soll die Korrektheit der Software für den Zensus 2021 sichergestellt werden. Hierzu werden die Daten aller Bürgerinnen und Bürger eingespielt und eventuelle Fehler sollen festgestellt werden.

Bezüglich dieser Vorgehensweise ist festzustellen, dass diese nur die Fehler erkennen kann, die im aktuellen Datensatz vorhanden sind. Fehler, die zukünftig entstehen können, werden dabei nicht berücksichtigt. Insofern ist sehr fraglich, ob dieses Vorgehen geeignet ist, um den vermuteten Zweck zu erfüllen.

Im Bereich der Software-Entwicklung haben sich verschiedene Methoden etabliert, um die Qualität von Software sicherzustellen. Dies wird mittels verschiedener Testverfahren sichergestellt und diese sollten sich durch den gesamten Entwicklungsprozess ziehen.

Es ist zu vermuten, dass mit der Einspielung aller Daten zum einen die korrekte Funktionsweise der Software wie auch die Reaktion der Software unter Last getestet werden sollte. Diesen Herausforderungen haben sich auch andere Softwareprodukte zu stellen und es ist nach aktuellem Stand der Technik absolut unüblich, hierfür Originaldaten zu verwenden.

Zur Prüfung auf eine korrekte Funktionsweise werden üblicherweise Testfälle mit Testdaten entwickelt. Testdaten sind dabei spezielle angefertigte Datensätze, die korrekte oder fehlerhafte Eingaben modellieren sollen. Ein Testfall nutzt dann ggf. die Testdaten, um einen oder mehrere Schritte im Ablauf der Software zu modellieren. Hierbei werden sowohl der korrekte, geplante Ablauf wie auch die Eingabe mit Störungen getestet.

In einem speziell angefertigtem Datensatz, hier zur Veranschaulichung am Beispiel für eine deutsche Postleitzahl verdeutlicht, können neben korrekten Daten (fünfstellige Zahl) folgende Testdaten eingearbeitet werden um in der entwickelnden Software die Verarbeitung dieser Fehlerdaten zu testen. Um beim Beispiel zu bleiben können folgende falsche Daten in dem Datensatz eingearbeitet werden. Die Testdaten zu einem Eingabefeld für eine deutsche Postleitzahl könnten dabei folgende Struktur haben:

  • fünfstellige Zahl (korrekte Eingabe)
  • Zahl, die weniger oder mehr als fünf Stellen hat
  • negative Zahl
  • Zahl mit Kommazeichen
  • Buchstaben oder andere Sonderzeichen
  • leere Eingabe (kein Wert)
  • fünfstellige Zahl, die keiner gültigen PLZ entspricht

Mittels dieser Daten oder anderer Eingaben wird das Verhalten der Software im Verhalten auf dieses des Eingabefeldes getestet. Die Software darf bei dieser Verarbeitung zum Einen nicht abstürzen und zum Anderen diese Fehler in der Eingabe erkennen und zurückmelden. Im Falle der Postleitzahl wäre eine grundsätzliche Prüfung auf Korrektheit der Eingabe als Postleitzahl möglich. Dieser Testfall entspricht einem einzelnen Softwaretest. Darüber hinaus könnte ein weiterer Testfall darin bestehen, ob die Zuordnung von Postleitzahl und Ort korrekt sind. Dieser Softwaretest verknüpft zwei Datenfelder und die Überprüfung der Eingaben miteinander.

Jeder Testfall modelliert ein Szenario. Die Aufgabe professioneller Software-Testerinnen und Software-Tester ist es, derartige Testfälle zu erstellen. Dabei helfen standardisierte Ansätze jedwede Möglichkeit abzudecken.

Insgesamt ergibt sich im Rahmen solcher Testfallerstellung eine Testabdeckung, die sowohl bisher bekannte wie auch zukünftig mögliche Fehler abdeckt. Dies hilft bereits jetzt die Qualität von Software sicherzustellen und gehört zu Verfahren, die bei der Herstellung von Software angewandt werden.

Wie oben dargestellt, sind für die Testfälle keine konkreten Daten aus dem Livebetrieb notwendig bzw. teilweise auch nicht zielführend. Auch für das Vorhaben der Bundesregierung ist nicht erkennbar, welchen positiven Zweck eine Verwendung der Echtdaten aller Mitbürgerinnen und Mitbürger haben sollte.

Weiterhin ist denkbar, dass die Reaktion der Software unter realistischen Belastungen getestet werden sollte. Es ist zu erwarten, wenn diese potentiell mehr als 80 Millionen Datensätze verarbeiten muss, anders reagiert, wie wenn 800 oder 8000 Testdaten verarbeitet werden. Daher ist es sinnvoll, die Software unter realistisch erwartbaren Bedingungen zu testen. Hierbei geht es darum, spezifische Reaktionen oder Fehlverhalten der Software unter reellen Bedingungen zu erkennen. Allerdings ist es in dem Fall ebenfalls unerheblich, ob die verwendeten Datenmenge echte Daten von Bürgerinnen und Bürgern sind oder ob konstruierte Testdaten verwendet werden. Das Verhalten der Software im realen Einsatz unter Last sollte mit Echtdaten oder mit Testdaten gleich sein. Daher spricht auch für diesen Zweck alles dafür, Testdaten zu verwenden.

Dieser Beitrag wurde unter Bericht, Gastbeitrag veröffentlicht. Setze ein Lesezeichen auf den Permalink.