18.07.2013

Zwischen Wissenschaft und Selbstbetrug

Essay von Romano Grieshaber

In der Debatte ums „Passivrauchen“ offenbaren sich viele methodische Schwächen und Selbstwidersprüche. Über den aktuellen Stand der epidemiologischen Wissenschaft.

In meinem Buch Passivrauchen – Götterdämmerung der Wissenschaft hatte ich in allgemeinverständlicher Form dargelegt, dass Rauchverbote in der Gastronomie als Nichtraucherschutzmaßnahme keine Krankheiten oder Todesfälle verhindern können; warum sie von Politik, Medien und Experten dennoch als solche vertreten, befürwortet und durchgesetzt werden und welche nicht erwünschten Folgen dadurch zu befürchten sind. Auf die wissenschaftlichen Grundlagen der Nichtraucherschutzgesetzgebung bin ich dabei recht ausführlich eingegangen, denn immerhin habe ich mich als Leiter der Prävention in der Berufsgenossenschaft Nahrungsmittel und Gastgewerbe (BGN) damit viele Jahre lang beschäftigt. Aber so ausführlich, wie ich es gerne getan hätte, jede einzelne unter den zahlreichen wichtigen Facetten der Gesamtproblematik zu behandeln, war unmöglich. Eigentlich müsste man außerdem jedes halbe Jahr ein neues Buch schreiben, denn das aggressive Marketing der Public-Health-Strategien zum Nichtraucherschutz hat ja seit der Veröffentlichung meines Buches nicht nachgelassen: Pausenlos werden neue Studien publiziert, neue Gesetze beschlossen, neue Forderungen erhoben. So bin ich doch lieber unter die Blogger gegangen, wo ich unter grieshaber.wordpress.com wichtige aktuelle Ereignisse zeitnah aufgreifen wie auch die Grundlagen meiner Arbeit noch detaillierter vermitteln kann, als mir das in meinem Buch möglich war. Über jene Grundlagen sollen Novo-Leser hier in komprimierter Form mehr erfahren. Ausführlicher werde ich dies im Lauf der nächsten Zeit in meinem Blog behandeln.

Deterministisches vs. systemorientiertes Wissenschaftsbild

Dass im Falle des Passivrauchens ein realitätsnahes Ergebnis offenbar gar nicht gewünscht ist, soll an dieser Stelle nicht vertieft werden: Dass epidemiologische Ergebnisse die Realität nicht abbilden, lässt sich nämlich keineswegs nur im Falle des Passivrauchens feststellen. Diese Mängel der Epidemiologie beruhen auf einem wissenschaftlichen Weltbild, das ich infrage stelle.

Die deterministisch-mechanistische, wissenschaftliche Herangehensweise der Epidemiologie erfasst und analysiert Monokausalbeziehungen (Ursache x = Wirkung y). Zuweilen sind es auch mehrere Monokausalbeziehungen, die untersucht werden, in diesem Fall ist von einer multifaktoriellen Herangehensweise die Rede. Auch multifaktorielle Analysen können aber nur mit gewissen Einschränkungen Kausalzusammenhänge beweisen:

  • Sofern keine Wechselwirkungen vorliegen,
  • das multifaktorielle Geflecht nicht auf komplexe Systeme (z.B. einen Organismus) und damit unvermeidlich wieder auf Wechselwirkungen trifft,
  • keine unbekannten Risikofaktoren bzw. Risikoindikatoren vorliegen,
  • alle Einwirkungsfaktoren und variablen Umfeldbedingungen messbar sowie quantitativ und qualitativ erfassbar sind.

Die systemorientierte wissenschaftliche Herangehensweise geht genau umgekehrt vor: Ihr Ansatzpunkt ist nicht die Wirkung eines oder mehrerer Einwirkungsfaktoren im komplexen System, sondern dessen Reaktion auf die Summe der unzähligen Einwirkungsvariablen, die es beeinflussen. Dies geschieht nicht nur in Form einer direkten Einwirkung, sondern auch in Form von Wechselwirkungen. Die Summe der Variablen verändert sich durch sich verändernde Einwirkungen und Wechselwirkungen ständig. Eine Monokausalbeziehung ist in dieser Betrachtung außerhalb von rein theoretischen Berechnungen gar nicht denkbar.

Dieses Defizit der monokausalen beziehungsweise multifaktoriellen epidemiologischen Methode ist mit keinem epidemiologisch-statistischen Modell kompensierbar. Insbesondere ist es ein Irrtum, multifaktorielle Betrachtungen gleichzusetzen mit Betrachtungen von komplexen Systemen. Bei diesen stößt die Epidemiologie grundsätzlich an ihre Grenzen. Die wichtigsten davon sind:

  • Nicht alle am spezifischen Erkrankungsrisiko ursächlich beteiligten Faktoren sind bekannt.
  • Nicht alle bekannten Faktoren, die für die spezifische Erkrankung ursächlich verantwortlich sind, wurden berücksichtigt.
  • Die Wirkung von bekannten Faktoren ist unbekannt (etwa Strahlenrisiko oder Nanopartikel, soziale, psychische Komponenten).

Auch unter Verwendung moderner mathematischer Verfahren ist es Epidemiologen nicht möglich, komplexe Systeme zu analysieren. Dies scheitert regelmäßig am äußerst variantenreichen wechselnden Antwortverhalten des Systems und den nicht berücksichtigten oder nicht bekannten ursächlichen Einflussfaktoren.

Kausalzusammenhänge ermitteln

Die epidemiologische Methode kann angesichts der beschriebenen Beschränkungen höchstens einen Verdacht gegen den untersuchten Faktor als Ergebnis erbringen. Wie wahrscheinlich dabei ein Kausalzusammenhang ist, hängt vor allem von der Stärke der Assoziation ab, die im so genannten relativen Risiko ausgedrückt wird. Ein relatives Risiko von 1,0 bedeutet ein Risiko von Null durch den untersuchten Faktor. Ein Wert, der höher liegt, repräsentiert ein erhöhtes Krankheitsrisiko. Liegt der Wert niedriger als 1,0, hat der Faktor eine Schutzwirkung vor Erkrankung. Allerdings ist die Aussagekraft dieser Werte, wie gesagt, eingeschränkt. Wissenschaftlern ist das grundsätzlich durchaus bekannt. Beispielhaft führt etwa das Umweltbundesamt dazu auf seiner Website aus:

Bei epidemiologischen Studien wird die Bevölkerung in einer realen Situation untersucht. (...) Aber im wirklichen Leben können die Randbedingungen nicht kontrolliert werden. Was gefunden wird, ist das Ergebnis vieler Einflussfaktoren, die auch nicht immer bekannt sind. (...) Epidemiologische Studien können Kausalität nie beweisen, aber doch wahrscheinlich machen, wenn bestimmte Anforderungen erfüllt sind.[1]

Etwas „wahrscheinlich machen“ bedeutet, dass die sogenannte „einfache Wahrscheinlichkeit“ gegeben ist: Es spricht mehr für einen Zusammenhang als dagegen. Warum das erst ab einem relativen Risiko von 2,0 der Fall ist, hatte ich in meinem Buch beschrieben

 

Das Risiko, das eindeutig einem bestimmten Risikofaktor – in diesem Fall: Passivrauchen – zugeordnet werden kann („attributables Risiko“), ist nicht identisch mit dem Relativen Risiko, sondern eine im vorliegenden Fall kaum präzise bestimmbare Teilmenge davon. Aussagen über das attributable Risiko können umso schwerer getroffen werden, je niedriger das Relative Risiko ausfällt.

Die übliche Berechnungsformel für das attributable Risiko lautet:

Relatives Risiko - 1,0 = Verursachungswahrscheinlichkeit
Relatives Risiko

Bei einem Relativen Risiko von 2,0 beträgt die Wahrscheinlichkeit eines attributablen Risikos also 50 Prozent.

RR 2,0 - 1,0 =0,5
RR 2,0

Liegt ein Relatives Risiko vor, das über dem Wert von 2,0 liegt, spricht deshalb mehr dafür als dagegen, dass ein ursächlicher Zusammenhang besteht, und je höher dieses Risiko ist, desto eher darf der Kausalzusammenhang als gesichert gelten. Ein Relatives Risiko von 1,25 hingegen enthält eine weitaus höhere Wahrscheinlichkeit, die gegen einen solchen Zusammenhang spricht.

Die irrige Annahme, dass komplexe Systeme mit epidemiologischen Methoden analysiert werden könnten, wurzelt wohl in dem Grundirrtum, ein System entspräche der Summe seiner Einzelelemente. Tatsächlich ist aber das Ganze im Fall eines komplexen Systems, wie es ja auch sprichwörtlich ist, weit mehr als nur die Summe seiner Teile. Wegen der vielen unbekannten Wirkfaktoren, die in dynamische Wechselwirkung treten und ihrerseits unbekannte Variablen ins System einbringen, gibt es keine mathematischen Modelle, durch die dies auf epidemiologischem Weg abgebildet werden kann.

Ein komplexes System kann mit epidemiologischen Methoden also von vornherein nicht auf Kausalitätsbeziehungen hin durchleuchtet werden. Diese Grenze der angewandten Methode zu kennen, ist mindestens genauso wichtig, wie jene Methode innerhalb dieser Grenze korrekt anwenden zu können.

Die DKFZ-Studie

Unbeeindruckt von diesen Einschränkungen hat das Deutsche Krebsforschungszentrum in Heidelberg (DKFZ) eine angeblich wahre Zahl von jährlichen Todesfällen errechnet, die durch Passivrauch ausgelöst werden sollen. Dieser Zahl, der berüchtigten „3301“, liegen keine Auswertungen von Krankheitsfällen, sondern zwei vorgegebene Variablen zugrunde:

  1. Das relative Risiko für eine bestimmte Erkrankung.
  2. Die Häufigkeit des Passivrauchens.
     

Was fällt an der ersten Variablen, dem relativen Risiko, sofort auf? Es liegt in allen Fällen weit unter dem Wert von 2,0, mit dem die einfache Wahrscheinlichkeit gegeben wäre:

Lungencarcinom: 1,25
COPD: 1,24 (Männer)/1,26 (Frauen)
Schlaganfall: 1,18
Herzinfarkt: 1,25

Bei der Festlegung dieser Variable des relativen Risikos berufen sich die Autoren des DKFZ auf die Ergebnisse sogenannter Meta-Analysen. Für jede Erkrankungsart wurden eine oder mehrere Meta-Analysen dem vom DKFZ vorausgesetzten relativen Risiko zugrunde gelegt. Eine dieser Meta-Analysen sei als Beispiel herausgegriffen: „The accumulated evidence on lung cancer and environmental tobacco smoke“ [2].

Verarbeitet wurden 37 Studien zum Lungencarcinom und Passivrauchen bei nichtrauchenden Partnern von Rauchern mit zusammengenommen 4626 Erkrankungsfällen bei weiblichen sowie 274 bei männlichen Patienten. Ergeben hatte sich in den einzelnen Studien jeweils ein relatives Risiko zwischen 0,75 und 2,68. (Betrachtet man nur die 13 aussagekräftigeren Studien mit einer Fallzahl von mindestens 100, schwanken die Ergebnisse zwischen 0,79 und 1,66.) Aus diesen 37 Einzelergebnissen wurde ein relatives Risiko von 1,24 als Gesamtergebnis errechnet, das dank komplexer mathematischer Berechnungsformeln angeblich das Risiko realistischer wiedergeben soll als die jeweiligen Einzelergebnisse.

Das Instrument der Meta-Analyse offenbart ein Kernproblem der Epidemiologie der Passivrauchforschung: Die Überführung in eine abstraktere Form ist nämlich das Gegenteil dessen, was sinnvoll wäre, um in der Frage der Kausalität Antworten zu finden. Im Vergleich zu den einzelnen Studienergebnissen entfernt sich die Meta-Analyse von einer Abbildung der Realität, statt sich ihr weiter anzunähern. Wie bereits in meinem Buch beschrieben, sind Meta-Analysen daneben fehler-, aber auch fälschungsanfällige Instrumente. Eine Untersuchung, die von uns bei Statistikspezialisten in Auftrag gegeben wurde, ergab folgendes, in meinem Buch zusammengefasstes Ergebnis:

Es gibt unterschiedliche methodische Ansätze, die bei Meta-Analysen angewandt werden können. Wurde die Methode der Autoren übernommen, dann ließ sich ihr Ergebnis nachvollziehen – Fehler hatten sie also keine gemacht. Dennoch war ihr Ergebnis letzten Endes ein Zufallsergebnis. Denn wählte man andere, ebenso gebräuchliche Ansätze, veränderte man damit auch das Ergebnis. Die Spannbreite reichte von RR 1,0 – also einem Null-Risiko – bis zu 1,7, einer Risikoerhöhung von 70 Prozent. Der Zufall als ergebnisbeeinflussender Faktor spielte aber auch an anderer Stelle eine Rolle, die eigentlich nicht sein dürfte: Nahm man eine einzelne Studie von den 22 aus der Meta-Analyse heraus, konnte das, je nachdem, welche der Studien man wählte, in manchen Fällen das Ergebnis stark verändern. Im Fall einer dieser Studien war etwa plötzlich gar kein statistisch bedeutsamer Zusammenhang mehr zwischen Dauer der Passivrauchbelastung und Erkrankungsgefahr mehr vorhanden. Die Herausnahme einer anderen Studie hingegen verstärkte diesen Faktor ganz erheblich.

Aus systemorientierter Sicht ist das nicht überraschend. Die in die Meta-Analyse überführten Ergebnisse umfassen Studien, in denen neben dem Passivrauchen zahllose unberücksichtigte Wirkfaktoren unterschiedlichster Art vorlagen, die sich voneinander erheblich unterscheiden. Frauen sind im Vergleich zu Männern deutlich überrepräsentiert. Auch die zahlreich vertretenen asiatischen Studien sind in Hinblick auf die Vergleichbarkeit mit größter Vorsicht zu genießen. Sowohl die Lebensgewohnheiten (etwa Koch- und Heizfeuer), die Feinstaubbelastung – in Peking werden im Moment Industriebetriebe abgeschaltet, damit die Bevölkerung noch atmen kann – wie auch die genetischen Voraussetzungen sind in Asien völlig anders als bei den Vergleichsgruppen: Weibliche Nichtraucher in Asien haben ein genetisch bedingt höheres spontanes Risiko für Lungencarcinome.

Mit dem vorgegebenen relativen Risiko, das vom DKFZ errechnet wurde, ist eigentlich also nicht viel zu beweisen. Die zweite Variable, die Daten zur Häufigkeit des Passivrauchens, ist aber auch nicht vertrauenerweckender. Der wichtigste von mehreren Haken: Es lag für die Altersgruppe 80+ gar keine Datengrundlage vor. Die Todesfälle in dieser Altersgruppe machen aber ungefähr die Hälfte aller Todesfälle aus!

Erwähnenswert ist auch, dass das DKFZ nur eine sehr reduzierte multifaktorielle Berechnung vorgenommen hatte: Nicht einmal das Alter, das bei der erwähnten Altersverteilung wohl als bedeutendste Todesursache gelten darf, wurde berücksichtigt.

Egal, von welcher Seite man sich der Beweisführung des DKFZ nähert, sie hält einer Überprüfung nicht stand, denn sie steckt voller Ungereimtheiten. Warum zum Beispiel sind bis zum Alter von 75 Jahren beide Geschlechter mit etwa gleicher Wahrscheinlichkeit betroffen, während das Risiko der Frauen danach nach oben schnellt? Frauen ab 85 Jahren haben nach jenen Berechnungen etwa das 2,6-fache Risiko gleichaltriger Männer für Schlaganfälle. Was sollte der Grund dafür sein? Und woher soll er eigentlich kommen, der Passivrauch, der das auslöst? In dieser Altersgruppe gibt es ja kaum noch aktive Raucher, die eine häusliche Passivrauchbelastung verursachen könnten. Einen Arbeitsplatz hat man nicht mehr und als besonders eifrige Gastronomiebesucher sind Frauen dieses Alters auch nicht bekannt. Der Verdacht liegt nahe, dass hier Zahlen auf irgendeine Weise „passend gemacht“ wurden, auch wenn das natürlich nicht zu beweisen ist.

Den Faktor einer möglichen absichtlichen Verfälschung ausgeklammert, bleibt gleichwohl nur die Zusammenfassung: Die „Passivrauchstudie“ des DKFZ sagt gar nichts darüber aus, wie viele Menschen in Deutschland am Passivrauch sterben. Hätte man einer solchen Hochrechnung reale Messergebnisse zugrunde gelegt, wären jene immerhin noch als Ausgangspunkt für weitere Untersuchungen tauglich. Beide tatsächlich verwendeten Variablen sind aber viel zu weit von der Realität entfernt, um mit ihrer Hilfe eine Aussage über die wirklichen Verhältnisse machen zu können. Diese Tatsache lässt sich auch durch die raffiniertesten mathematischen Berechnungsformeln nicht ändern.

Schlussfolgerungen und praktische Anwendung

Das komplexe System muss als „black box“ betrachtet werden, innerhalb der sich die Vorgänge abspielen, denen man auf den Grund zu gehen versucht. Die Epidemiologie sollte sich ausschließlich mit den wirklichen Zahlen am Eingang und Ausgang jener „black box“ befassen. Um Krankheitsrisiken wirklichkeitsgetreu abzubilden und geeignete Präventionsmaßnahmen zu entwickeln, ist folgender Weg erfolgversprechend:

  1. Eine epidemiologische Studie untersucht eine Expositionsgruppe (etwa zum Passivrauchen) und eine Vergleichsgruppe.
  2. Ergeben sich gleich hohe oder niedrigere Erkrankungszahlen/Todesfälle in der Expositionsgruppe, muss präventiv nichts weiter unternommen werden. Dies gilt, grob gesagt (es gibt Ausnahmen), bis zu einem relativen Risiko kleiner 2, da die einfache Wahrscheinlichkeit eines Kausalzusammenhangs ansonsten nicht erreicht ist.
  3. Weist die Expositionsgruppe mehr Erkrankungen als die Vergleichsgruppe auf und ist die einfache Wahrscheinlichkeit gegeben, ist der Verdacht auf eine funktionale Beziehung vorhanden. In diesem Fall müssen Einflussfaktoren, die als Confounder (Störfaktoren) wirken, geprüft oder es müssen Vorgänge innerhalb der „black box“ möglicherweise auch experimentell ursächlich ergründet werden.


Ein Beispiel für gelungene Präventionsarbeit auf Basis der systemorientierten Herangehensweise, an der klassische epidemiologische Methoden scheiterten, ist das Bäckerasthma. Eine Parallele zu der heutigen Passivrauchdebatte bestand darin, dass vor zwanzig Jahren die Lehrmeinung gelautet hatte, schon ein einziges Körnchen Mehlstaub könne diese Krankheit auslösen. Vor dem könne man aber einen Bäcker nicht bewahren, also sei im Erkrankungsfall ein Berufswechsel unausweichlich, um eine Verschlimmerung aufzuhalten.

Tatsächlich sind aber immer Ursachenbündel krankheitsauslösend, und diese setzen sich von Fall zu Fall unterschiedlich zusammen. Die systemorientierte Betrachtung ermöglichte deshalb die Entwicklung eines wirksamen Präventionskonzepts. Qualitatives Werten stand dabei gleichrangig neben quantifizierendem Messen, und nichtstoffliche Elemente wie zum Beispiel soziale und psychologische Wirkfaktoren spielten eine genauso große Rolle wie die „harten“ Faktoren des Stoffs, der Arbeitsumgebung und des Individuums. Nachtarbeit erwies sich zum Beispiel als ein nicht unbedeutender Einflussfaktor bei der Symptomausprägung.

Die Wirkung dieses Präventionskonzepts [3] war durchschlagend: Innerhalb von 20 Jahren kam es durch einfache, in den Bäckereien leicht umsetzbare Basis-Präventionsmaßnahmen zu einem Rückgang der Zahl an Erkrankungsfällen um fast zwei Drittel, darunter außerdem nur noch ein Bruchteil schwerer Erkrankungsfälle. Jeder Diagnose folgt ein individuell maßgeschneidertes Präventionskonzept, das dem Betroffenen in der Regel, anders als früher, den Verbleib im Beruf weiter möglich macht, ohne dass er eine Verschlimmerung der Erkrankung fürchten muss.

Nach diesem erfolgreichen Muster analysierten wir auch die Frage der passivrauchbedingten Erkrankungen bei Kellnern, die ich in meinem Buch beschrieben habe. Fast 100.000 Versicherte wurden einer Vergleichsgruppe von etwa 6,5 Millionen Erwerbstätigen anderer Berufe gegenübergestellt, eine hohe Zahl, bei der Zufallsschwankungen nur noch eine geringe Rolle spielen können. Erwartet wurde – und zwar auf Basis epidemiologisch-statistischer Berechnungen (u.a. jener des DKFZ) –, dass sich bei Kellnern eine höhere Zahl an Krankheits- oder Todesfällen ergeben würde als bei der Vergleichsgruppe. Diese höhere Zahl wäre dann die Grundlage gewesen, auf der wir eine Kausalbeziehung herzustellen und geeignete Präventionsmaßnahmen zu entwickeln und damit die Erkrankungszahlen zu vermindern versucht hätten.

Das Ergebnis war dann aber auch für uns eine Überraschung: Je nach Erkrankungsart fielen die Erkrankungszahlen der Kellner nur durchschnittlich bis sogar unterdurchschnittlich aus. Eine weitere Analyse der Wirkung anderer Einwirkungsfaktoren (als wichtigster Faktor aktives Rauchen) war mit einem solchen Ergebnis bereits überflüssig geworden. Eine Kausalbeziehung zur Exposition konnte offensichtlich nicht vorliegen. Ungeachtet dessen wäre ein Schutz der Kellner vor etwaigen Folgen des Passivrauchens aber natürlich genauso ohne Rauchverbot möglich, wie es nachweislich möglich gewesen ist, das Bäckerasthma ohne ein Verbot von Mehl zu bekämpfen. Da beim Passivrauchen aber von vornherein keine Risikoerhöhung zur Vergleichsgruppe feststellbar ist, wären aber natürlich keine Präventionserfolge in Form von sinkenden Erkrankungszahlen zu erwarten.

Es sind aber nicht nur die Kellner, bei denen eine hohe Passivrauchexposition mit einer geringen Erkrankungswahrscheinlichkeit an Lungencarcinom oder anderen tabakassoziierten Krankheiten einhergeht. Die Gruppe der Büro- und Verwaltungskräfte etwa hat unter allen Berufsgruppen eine der geringsten Lungencarcinom-Raten. Nach Messungen des DGUV (aus der Zeit vor den Nichtraucherschutzgesetzen) waren diese Büro- und Verwaltungskräfte aber im Untersuchungszeitraum ähnlich hohen Konzentrationen an Passivrauch ausgesetzt wie die Kellner in der Gastronomie. [4] Es handelt sich hier um die wohl beruflich größte Gruppe Deutschlands mit Millionen von Mitarbeiterinnen und Mitarbeitern. Daneben gibt es noch eine Untersuchung beim Flugbegleitpersonal, in der für Lungencarcinom ebenfalls kein erhöhtes Risiko festgestellt wurde. Wir haben also bei den genannten passivrauchbelasteten Berufsgruppen (Kellner, Büro-Verwaltung, Flugbegleitpersonal) kein erhöhtes Auftreten von Lungenkrebs gefunden.

Eigentlich müsste jeder aufrichtige Forscher eingestehen, dass an den Ergebnissen, die mit epidemiologischen Methoden erzielt werden, etwas nicht stimmen kann, wenn die Daten über wirkliche Erkrankungsfälle so eindeutig deren Gegenteil aussagen. Im Falle des Passivrauchens geschieht das aber nicht. Warum nicht? Um das herauszubekommen, muss wohl die Epidemiologengemeinde der Passivrauchforscher selbst als „black box“ aufgefasst werden. Durch das Zusammentragen von Indizien kann man sich dann, ähnlich wie beim Bäckerasthma, an die Gründe herantasten. In meinem Buch habe ich einen solchen Versuch unternommen, und in meinem Blog will ich mich einer Lösung noch weiter nähern.