Datenprodukte jenseits des Mythos „mehr Daten“ gestalten
Datenprodukte schaffen erst dann Wert, wenn Kontext, Interpretation, Governance und die menschliche Arbeit rund um Daten mitgestaltet werden.
Datenprodukte jenseits des Mythos „mehr Daten“ gestalten
Datenproduktteams starten häufig mit einer Wachstumsannahme: Mehr Daten machen das Produkt besser. Mehr Events, mehr Attribute, mehr Integrationen, mehr Dashboards, mehr Modellfeatures. Klaus Hoeyers Data Paradoxes bietet – ausgehend von Titel, Inhaltsverzeichnis und Einführung – eine notwendige Korrektur: Mehr Daten können Wert schaffen, aber sie können auch Paradoxien erzeugen.
Das Buch untersucht intensivierte Datenerhebung im heutigen Gesundheitswesen, vor allem am Beispiel Dänemarks. Dänemark wird nicht gewählt, weil es durchschnittlich ist, sondern weil es weit fortgeschritten ist: digitalisierte Gesundheitsdienste, integrierte Dateninfrastrukturen und Personenkennziffern, die Tracking über Sektoren und Lebensläufe hinweg ermöglichen. Damit wird es zu einem starken Testfall für datengetriebene Versprechen.
Der Auszug beschreibt diese Versprechen deutlich. Datengetriebene Medizin soll Krankheiten vorhersagen, Behandlungen personalisieren, manche menschliche Interpretation durch KI ersetzen, Gesundheitsversorgung günstiger machen und Governance durch smarte Algorithmen optimieren. Diese Versprechen kennt jedes Team, das Daten- und KI-Produkte baut. Sie klingen modern, rational und unvermeidlich.
Hoeyers Argument lautet jedoch, dass Datenversprechen mit lokalen Praktiken kollidieren. Daten sind nicht einfach Information, die nur extrahiert werden muss. Sie werden produziert, kategorisiert, bereinigt, bewegt, interpretiert und von unterschiedlichen Akteuren für unterschiedliche Zwecke verwendet. Dieselben Daten können Forschung, klinischer Versorgung, Administration, Politik, Governance und kommerziellen Interessen dienen. Diese Vielschichtigkeit erzeugt Spannungen.
Für Technologieberatung ist das eine Produktdesignfrage. Wenn Daten plural sind, kann ein Datenprodukt nicht nur um Speicher, Pipelines und Modelle herum entworfen werden. Es muss um Nutzungskontexte herum entstehen. Wer erzeugt die Daten? Wer trägt die Last der Datenarbeit? Wer interpretiert das Ergebnis? Wer profitiert? Wer ist Risiken ausgesetzt? Welche Entscheidungen beeinflusst das Produkt?
Das Inhaltsverzeichnis legt einen nützlichen Produkt-Rahmen nahe: Versprechen, Leben, Arbeit, Erfahrungen, Weisheit und Pandemiepolitik. In Produktbegriffe übersetzt braucht jedes Datenprodukt eine Versprechensschicht, eine Nutzerkontextschicht, eine Betriebsschicht, eine Erfahrungsschicht, eine Entscheidungsqualitätsschicht und eine Krisen- oder Edge-Case-Schicht.
Das ist besonders für KI-Systeme relevant. Viele KI-Fehler sind im engen Sinn keine Modellfehler, sondern Fehler der Datenpraxis. Daten können administrative Bequemlichkeit statt Realität abbilden. Kategorien können nicht zur Nutzererfahrung passen. Erhebung kann zusätzliche Arbeit erzeugen. Dashboards können falsche Sicherheit vermitteln. Modelle können Verantwortung auf Nutzer verschieben, die das Ergebnis nicht sinnvoll kontrollieren können.
Für OzyCore lautet die Lektion: Datenprodukte mit dem Ziel „bessere Datennutzung“ entwerfen, nicht mit „mehr Daten“ als Standard. Das bedeutet Governance im Produkt, Nachvollziehbarkeit, sichtbare Unsicherheit und Verständnis für den menschlichen Workflow rund um Daten. Es bedeutet auch, Hoeyers unbequeme Frage zu stellen: besser für wen und nach welchen Kriterien?
Eine reife Datenstrategie verehrt nicht das Datenvolumen. Sie behandelt Daten als Infrastruktur, Praxis und Macht. Produkte, die auf diesem Verständnis beruhen, werden vertrauenswürdiger, nützlicher und robuster.