01.11.2004

Epidemische Epidemiologie

Kommentar von Rob Lyons

Die ängstliche Gesellschaft produziert wie am Fließband Rechtfertigungen für ihre Ängste ohne Rücksicht auf wissenschaftliche Standards und tatsächliche Relevanz.

Vor 50 Jahren haben wir festgestellt, dass Rauchen schlecht für uns ist. 1954 veröffentlichten Austin Bradford Hill und Richard Doll einen vorläufigen Report über eine Studie, die den Zusammenhang zwischen Rauchen und vorzeitigem Tod untersuchte.[1] In vieler Hinsicht hat diese Studie die medizinische Forschung in eine Sackgasse geführt. Während viele weitere Studien die schädliche Wirkung des Rauchens belegen konnten, sind alle Versuche fehlgeschlagen, ein „neues Rauchen“ zu finden – einen Umweltfaktor oder ein Lebensstilmerkmal, das ähnlich gravierende Auswirkungen hätte. Im Zuge dieses Bemühens wurden eine Menge wissenschaftlich mangelhafter Studien durchgeführt, deren vermeintlich alarmierende Ergebnisse genug Stoff für unzählige Gesundheitspaniken geliefert haben.
Diese Entwicklung hat John Brignell in seinem neuen Buch The Epidemiologists ausführlich beschrieben. Hill und Doll hatten die Aufgabe herauszufinden, weshalb das Auftreten von Lungenkrebs in nur 25 Jahren um das 15-fache angestiegen war. Ihr erster Versuch bestand darin, 649 Lungenkrebspatienten und 649 passende gesunde Kontrollpersonen nach ihren Gewohnheiten zu befragen. Sie fanden einen Zusammenhang zwischen Rauchen und Lungenkrebs, der nicht sehr stark war. Jedoch war er stark genug, um im zweiten Schritt eine große Gruppe von gesunden Menschen zu beobachten und den Zusammenhang zwischen Rauchgewohnheiten und auftretenden Krankheiten zu untersuchen.
Diese Studie begann 1951. Es wurden sämtliche Ärzte im Land schriftlich nach ihrem Rauchverhalten befragt. Von den rund 35.000, die antworteten, hatten 17 Prozent nie geraucht (wie sich die Zeiten ändern!). Drei Jahre später legten Hill und Doll ihre ersten Analyseergebnisse vor und konnten einen starken Zusammenhang zwischen Rauchen und Lungenkrebs zeigen. Sie fanden heraus, dass die Wahrscheinlichkeit, an Lungenkrebs zu erkranken, bei den dauerhaften Rauchern 25 Mal so hoch war wie bei Nichtrauchern. Zudem war das Risiko, an einem Herzleiden zu sterben, doppelt so hoch. Die Studie wurde alle paar Jahre wiederholt, das Ergebnis war immer dasselbe.
Hill machte jedoch klar, dass solche Untersuchungen einer Reihe von methodischen Kriterien gerecht werden müssen, um gültige Ergebnisse zu liefern. Es lohnt sich, diese Kriterien noch einmal aufzuführen. Denn sie sind bei vielen epidemiologischen Studien nicht erfüllt.

„Man kann leicht zeigen, dass Düngung zu einer größeren Ernte von Tomaten führt. Das heißt aber nicht, dass Düngemittel Tomaten verursachen; sie fördern lediglich das Wachstum. Das Gleiche gilt für das Rauchen und Lungenkrebs.“

  1. Stärke: Ist die Korrelation so stark, dass andere Faktoren ausgeschlossen werden können?
  2. Konsistenz: Konnten die Ergebnisse von anderen Forschern in anderen Zusammenhängen bestätigt werden?
  3. Spezifität: Besteht der Zusammenhang zwischen auslösendem Faktor und einer bestimmten Krankheit oder einer großen Zahl unterschiedlicher Erkrankungen?
  4. Zeitfolge: Ging der angenommene auslösende Faktor der angenommenen Wirkung zeitlich voraus?
  5. Biologische Gradualität: Führt höhere Exposition zu höherem Erkrankungsrisiko?
  6. Plausibilität: Gibt es einen glaubhaften biologischen Mechanismus, der den Zusammenhang erklären kann?
  7. Kohärenz: Ist die Korrelation mit dem historischen Verlauf der Krankheit vereinbar?
  8. Experimentelle Evidenz: Kann der Effekt experimentell (zum Beispiel im Tierversuch) bestätigt werden?
  9. Analogie: Sind an anderer Stelle vergleichbare Zusammenhänge gezeigt worden?

Eine Korrelation beweist noch keinen ursächlichen Zusammenhang. Brignell verdeutlicht das am Beispiel von Tomaten. Man kann leicht zeigen, dass Düngung zu einer größeren Ernte von Tomaten führt. Das heißt aber nicht, dass Düngemittel Tomaten verursachen; sie fördern lediglich das Wachstum. Das Gleiche gilt für das Rauchen und Lungenkrebs. Das Rauchen mag das Wachstum von Tumoren in der Lunge massiv fördern. Man kann daraus jedoch noch nicht folgern, dass es deren Entstehen auch verursacht.
Über die Verursachung können wir erst etwas aussagen, wenn wir die Mechanismen der Krebsentstehung in Zusammenhang mit dem Rauchen untersuchen. Hill und Doll beschrieben nicht, wie Lungentumoren entstehen. Sie haben uns lediglich einen sehr wertvollen Hinweis für weitere Forschung gegeben. Dennoch ist es natürlich vollkommen vernünftig, den Schluss zu ziehen, dass Raucher im Durchschnitt früher sterben als Nichtraucher. Und wir können, auch ohne die genauen Mechanismen zu kennen, zur Erkenntnis kommen, dass es für die Gesundheit gut ist, das Rauchen aufzugeben.
Nicht vernünftig sind jedoch die Reaktionen auf diese klassische Studie. Sie wurde als Legitimation für eine Intervention des Staates in die privaten Gewohnheiten der Bürger genutzt, wie sie bisher nie erfolgt war. Sie hat außerdem zu einer Fülle weiterer Studien ermutigt, in denen sehr viel unerheblichere Korrelationen zum Anlass für weiter gehende Behauptungen genommen wurden. Brignell nimmt in seinem Buch die Studien und Statistiken auseinander, die hinter dieser Epidemie der Epidemiologie stecken. Er zeigt, wie statistische Methoden für bestimmte Zwecke entwickelt, dann aber in ganz anderen Zusammenhängen genutzt wurden. So müssen abstrakte Kriterien für die Qualität von Ergebnissen herhalten, egal, ob sie für die wirkliche Welt in irgendeiner Weise wichtig sind. Besonders deutlich wird dies bei der statistischen Signifikanz. So ist es absurd, aus der Tatsache, dass einige Redaktionskollegen im Mai und im Juni, jedoch keiner im Juli geboren sind, zu folgern, dass im Frühsommer mehr Journalisten das Licht der Welt erblicken als im Hochsommer.
In der Forschung ist es daher nützlich, einen vorläufigen Test zu machen, um zu sehen, wie wahrscheinlich es ist, dass Ergebnisse einem bloßen Zufall zu verdanken sind. Üblicherweise wird die Auswertung von Ergebnissen weiterverfolgt, wenn die Chance, dass man es mit rein zufälligen zu tun hat, unter fünf Prozent liegt. Diese Hürde genommen zu haben, heißt jedoch noch nicht, dass man es nicht doch mit bloßem Zufall zu tun hat. Schon per definitionem müssten ja immer fünf Prozent aller Studien diesen Test bestehen, auch wenn die Ergebnisse bedeutungslos sind.

„Die Epidemiologie kann ein sehr effektives Werkzeug sein, wenn es um die Verbreitung von Infektionskrankheiten geht. Nur leider gibt es nicht genug Infektionskrankheiten, um die Existenz von so vielen Instituten und Wissenschaftlern zu rechtfertigen.“

Heutzutage scheint jedoch jedes Ergebnis, das die Fünf-Prozent-Hürde nimmt, als signifikant zu gelten. Fünf Prozent Zufallswahrscheinlichkeit erscheinen in der Tat als ausreichend hoch gestecktes Kriterium. Doch diese Einschätzung relativiert sich, wenn man sieht, wie Forscher alle denkbaren Risikofaktoren durchprobieren, bis sie zu einem anscheinend signifikanten Ergebnis kommen, und dann über einen möglichen zugrunde liegenden Mechanismus spekulieren, um Erklärungen zu finden, ganz egal, wie weit hergeholt das Ganze am Ende ist. So ist ein Test, der ursprünglich nur als erster grober Filter dienen sollte, zum Gütekriterium für zweifelhafte Ergebnisse geworden. Entsprechend führt Brignell eine lange Liste von Faktoren auf, die alle einmal als Ursache von Krebs bezeichnet wurden: Abtreibung, Acetaldehyd, Acrylamid, Agent Orange, Alar, Alkohol, Air pollution (Luftverschmutzung), Aldrin, Aflatoxin, Arsen, Asbest, Asphaltdämpfe, Atrazin, AZT ... – um nur die mit „A“ beginnenden zu nennen.
Es gibt auch eine Reihe von statistischen Methoden, um Annahmen mit den erhobenen Daten in Einklang zu bringen. Die beste davon ist die Trendanpassung. Kein Datensatz passt genau ins Muster, aber oft lässt sich dennoch ein deutlicher Trend finden. In vielen Studien scheint es jedoch, als ob einfach eine Linie durch eine offenbar unzusammenhängende Serie von Messwerten gezogen wird, um einen dahinter liegenden Trend zu demonstrieren.
Die Epidemiologie kann ein sehr effektives Werkzeug sein, wenn es um die Verbreitung von Infektionskrankheiten geht. Nur leider gibt es nicht genug Infektionskrankheiten, um die Existenz von so vielen Instituten und Wissenschaftlern zu rechtfertigen. Tatsächlich ist nach wie vor die Haupttodesursache in der entwickelten Welt das Alter – ein Faktor, der unglaublicherweise von vielen Forschern ignoriert wird. Mit über 80 hat man ein tausendfach höheres Risiko, an Krebs zu erkranken als mit Mitte 30. Dieser Faktor ist so stark, dass das meiste, was sonst noch an Einflussfaktoren untersucht wird, einfach nicht ins Gewicht fällt.
Alter ist etwas Offensichtliches; viele andere Faktoren, die noch eine Rolle spielen könnten, sind es nicht. Deshalb müssen wir zu Hills erstem Kriterium zurückgehen. Um sicher zu sein, dass wirklich etwas passiert, muss der Effekt stark sein. Sonst kann er sich schnell als Illusion erweisen. Ein aktuelles Beispiel hierfür liefert das Passivrauchen, das Brignell als „größten wissenschaftlichen Betrug aller Zeiten“ bezeichnet. 1992 hat die US-Umweltschutzbehörde EPA eine Metaanalyse zum Passivrauchen erstellt, in der alle Einzelstudien zusammengefasst sind. Leider waren die Ergebnisse negativ. Es zeigte sich, dass Passivrauchen kein Gesundheitsrisiko darstellt. Die Fakten gaben nicht genug her für eine Kampagne, daher war etwas Fantasie gefragt. Eine negative Studie wurde aus der Auswertung herausgenommen, aber es ergab sich immer noch kein signifikantes Ergebnis. Deshalb wurden die Torpfosten etwas auseinander geschoben. Die Behörde hatte herausgefunden, dass die Chance, es mit einem Zufallsergebnis zu tun zu haben, über fünf Prozent lag – aber immerhin unter zehn Prozent, also wurde das Ergebnis als signifikant akzeptiert. Mit anderen Worten: Die sonst gültigen Kriterien für Wissenschaftlichkeit wurden einfach abgesenkt. Das erhöhte Risiko für Lungenkrebs – 19 Prozent – war einfach zu gering, um mit den genutzten Methoden nachgewiesen zu werden. Es gibt viele Möglichkeiten, wie unkorrektes Vorgehen letztlich zu diesem Ergebnis geführt haben könnte. Man muss sich fragen, ob so viele verschiedene Studien, die unterschiedliche methodische Ansätze und unterschiedliche Forschungsziele verfolgten, überhaupt sinnvoll zusammengefasst werden können. Wie soll zudem für eine Person die Belastung durch Passivrauchen über viele Jahre korrekt gemessen werden? Wurden andere Faktoren wie Alter, Geschlecht und Einkommen akkurat kontrolliert?
Auf die Ergebnisse von Hill und Doll können wir uns verlassen. Denn der gefundene Effekt ist massiv: ein 25 Mal so großes Krebsrisiko für Raucher. Anzunehmen, dass ein Effekt von nur 19 Prozent mit dem dargestellten Vorgehen verlässlich bestimmt werden könnte, ist jedoch ähnlich unplausibel wie die Annahme, man könne ein Rennen mit einer Sonnenuhr messen. Dennoch wurde das Rauchen an öffentlichen Orten verboten mit der Begründung, Tausende könnten durch das Einatmen des Qualms sterben. Auch andere Maßnahmen der öffentlichen Gesundheitsvorsorge werden durch Forschungsergebnisse begründet, die im größeren Teil der Fälle komplett wertlos sind.
Zweifellos hat die Studie von Hill und Doll viele Menschen dazu gebracht, das Rauchen aufzugeben und so dafür gesorgt, dass viele sich eines längeren Lebens erfreuen konnten. Aber sie hat auch als Inspiration für eine Vielzahl unnötiger, weil wissenschaftlich unbegründeter Gesundheitspaniken gedient und dazu geführt, dass es heute Gesundheitsaktivisten gibt, die nur zu gerne bereit sind, uns zu erklären, wie wir unser Leben leben sollen.