Können wir vorhersagen, was uns im Leben passiert und wann wir sterben? Ein Forschungsteam ist dieser Frage nachgegangen und hat mit Hilfe von maschinellem Lernen ein Modell entwickelt, das bei der Lebensprognose helfen kann.
Forschende der TU Dänemark und der Northeastern University in den USA haben untersucht, wie vorhersehbar unser menschliches Leben ist. Dafür haben sie Daten von allen rund sechs Millionen Menschen in Dänemark ausgewertet – und zwar bezogen auf deren Wohnsitz, Bildung, Beruf, Einkommen, Gesundheit und andere Lebensereignisse.
Maschinelles Lernen hat bei Lebensprognose geholfen
Die Forschenden haben dafür auf maschinelles Lernen zurückgegriffen. Dabei ist das Ziel, einer Maschine – also einem Computer oder anderen künstlichen System – beizubringen, bestimmte Aufgaben auszuführen. Das lernt ein Algorithmus durch Wiederholung und Verallgemeinerung.
Forschende nutzten Daten von Behörden
Das heißt, die Maschine bekommt Daten und lernt, selbstständig deren Struktur zu erkennen und damit etwas zu machen. Das kann ein Roboter sein, der trainiert wird, etwas zu tun – oder, wie hier in diesem Fall, die Auswertung von Behördendaten.
"Maschinelles Lernen ist ein Teilgebiet von Künstlicher Intelligenz. Diese kann entweder durch maschinelles Lernen erzeugt werden oder sie basiert auf programmierten Abläufen."
Für ihr Modell haben die Forschenden detaillierte persönliche Daten von Menschen mit einer bestimmten Methode des maschinellen Lernens ausgewertet – einem sogenannten Transformer. So ein Modell wertet große Datenmengen aus und übersetzt sie dann.
Die Forschenden haben sich gedacht: Was wäre, wenn wir das Leben eines Menschen und die Ereignisse darin einfach wie eine Reihenfolge von Punkten darstellen, die miteinander verbunden sind – im Prinzip wie bei mathematischen Darstellungen. Also mit einer Linie für die voranschreitende Zeit oder das Alter und einer anderen Linie für die Ereignisse.
Daten aus zwölf Jahren in wenigen Tagen aufgeschlüsselt
Die Untersuchung basiert auf Daten von Menschen aus Dänemark über einen Verlauf von zwölf Jahren. Aufgeschlüsselt waren sie zum Teil nach wenigen Tagen. Anhand dieser Daten konnten die Forschenden zum Beispiel sehen, wer wie lange am Tag arbeitet, wer wann einen Herzinfarkt hatte – und ob zur selben Zeit auch das Einkommen gestiegen ist oder ein Umzug von der Stadt aufs Land stattfand.
Modell trifft Vorhersagen für die Zukunft
Mit diesen detaillierten Daten aus der Vergangenheit der Menschen haben die Forschenden ihr Modell dann auch Vorhersagen für die Zukunft treffen lassen – also wie sich ein Mensch auf der eigenen Zeitlinie weiterbewegen wird. Darunter waren auch Fragen wie: "Wird jemand innerhalb der nächsten vier Jahre sterben?"
Die Forschenden sagen, dass die Prognosen des Modells im Schnitt häufig stimmten, gerade bei jüngeren Menschen und Frauen.
"Besonders gut konnte ihr Modell das bei jüngeren Menschen berechnen und bei Frauen. Auch die Trefferquote für andere Lebensereignisse war mit dem Modell sehr gut."
Insgesamt war ihr Modell wohl ähnlich zutreffend wie Auswertungsmethoden in den Sozialwissenschaften. Die Forschenden schreiben im Fachmagazin Nature Computational Science, dass für sie das Spannende gar nicht die Möglichkeit der Vorhersage ist, sondern wie ihr Modell mit den Daten solche Antworten generieren kann.
Viele ethische Fragen und Konflikte
Dabei weisen sie allerdings deutlich darauf hin, dass viele ethische Fragen mit solchen Auswertungen verbunden sind:
- Es besteht die Gefahr von Voreingenommenheit in der Auswertung.
- Datenschutz: Es geht um sensible Daten, die die Forschenden ausschließlich zu wissenschaftlichen Zwecken verwendet haben.
- Um das klarzustellen: Die gut sechs Millionen Einwohner*innen Dänemarks können nach der Studie nicht online einsehen oder anderweitig Akteneinsicht beantragen, wie lange sie zum Beispiel laut der Prognose des Modells noch leben.