2.8 Alle relevanten und fairen Behandlungsvergleiche müssen berücksichtigt werden

Dies ist der 20. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (IHC) Projektes erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

In Blog 2.1 haben wir bereits die Bedeutung fairer Behandlungsvergleiche festgestellt. Jetzt wollen wir uns ein paar Gedanken dazu machen, wie viele Behandlungsvergleiche berücksichtigt werden sollten.

Man kann sich natürlich leicht vorstellen, dass jeder relevante, faire Vergleich von Behandlungen einbezogen werden sollte – aber warum? In diesem Blog wird untersucht, wie wichtig es ist, alle relevanten fairen Behandlungsvergleiche zu berücksichtigen und was folgen kann, wenn das nicht passiert.

Sowohl Quantität als auch Qualität

Würden Sie von einem Arzt erwarten, dass er ein Medikament auf Basis einer einzigen, das Medikament als wirksam beschreibenden Studie verschreibt? Wohl kaum! Eine einzelne Studie wird wahrscheinlich keine unwiderlegbare Evidenz für eine Behandlung erbringen, unabhängig davon, wie sorgfältig sie durchgeführt wurde. Genauso wenig können aus einem einzigen Vergleich zweier oder mehrerer Behandlungen Schlussfolgerungen gezogen werden, denn die Ergebnisse können irreführend sein, weil sie dem Zufall geschuldet sein können.

Das trifft besonders auf kleine Studien zu, in denen wenige Behandlungsergebnisse beobachtet wurden. Die Zusammenfassung von Ergebnisdaten, zum Beispiel in Form einer Metaanalyse, ermöglicht uns die Durchführung statistischer Tests und die Bestimmung von Konfidenzintervallen unter Verwendung der gesamten verfügbaren relevanten Evidenz. Im Kern erleichtert es die Ermittlung der Wahrscheinlichkeit, mit der Behandlungswirkungen zufällig zustande gekommen sind, und bewahrt uns vor dem falschen Schluss, dass es zwischen zwei Behandlungen einen statistisch signifikanten Unterschied gibt bzw. nicht gibt.

Durch die Berücksichtigung aller relevanten fairen Behandlungsvergleiche können mehr Daten zu den betreffenden Behandlungen gewonnen werden. In der Praxis bedeutet das, dass Forscher und Ärzte die wahrscheinlichen Effekte einer Behandlung genauer und zuverlässiger einschätzen können, sei es durch Informationen zur wirksamsten Dosierung, zu häufigen Nebenwirkungen oder zur wahrscheinlichen Erfolgsquote.

Was sind die Folgen, wenn nur die „passenden“ Behandlungsvergleiche herangezogen werden?

Nicht alle relevanten fairen Behandlungsvergleiche zu berücksichtigen, kann schwerwiegende Folgen haben. Es kann bedeuten, dass Studienteilnehmer und Patienten Behandlungen erhalten, die ihnen womöglich schaden, oder dass ihnen nützliche Behandlungen vorenthalten werden.

Das trifft zum Beispiel auf die vielen schwangeren Frauen zu, die in den 1980er und 90er Jahren Frühgeburten hatten. Frühgeborene kommen oft mit nicht vollentwickelter Lunge oder anderen nicht ausgereiften Organen zur Welt. Eine mögliche Folge davon ist das Atemnotsyndrom des Frühgeborenen (infant respiratory distress syndrome, IRDS), das tödlich verlaufen kann.

In den 1980er Jahren ergab sich immer mehr überzeugende Evidenz für eine Abnahme von IRDS und der Säuglingssterblichkeit durch die Verabreichung von Kortikosteroiden an Schwangere, bei denen mit einer Frühgeburt zu rechnen war. Nichtsdestotrotz wurden in den folgenden zehn Jahren weitere Studien durchgeführt, in denen einige Teilnehmerinnen ein Placebo oder keine Behandlung erhielten. In einigen Fällen bezahlten die Neugeborenen das mit dem Leben.

Natürlich wollten die Forscher die Teilnehmerinnen nicht absichtlich schädigen, und sicherlich untersuchten sie nur eine ihrer Überzeugung nach berechtigte Frage mit dem Ziel, die Lebensqualität vieler Patientinnen zu verbessern. Diese Forschung als „schlecht“ zu bezeichnen wäre nicht fair; „unnötig“ trifft es vielleicht besser. Wären die Daten aus allen relevanten fairen Behandlungsvergleichen früher statistisch zusammengefasst worden (d. h. in einem systematischen Review mit einer Metaanalyse), wäre offenkundig geworden, dass weitere Studien sowohl unbegründet als auch unethisch wären. Die Berücksichtigung aller relevanten fairen Behandlungsvergleiche kann also helfen, Patienten und Studienteilnehmer vor vermeidbarem Schaden zu schützen.

Noch mehr unnötige Forschung

Das Beispiel oben ist eine drastische Veranschaulichung dessen, was passieren kann, wenn nicht alle relevanten Behandlungsvergleiche berücksichtigt werden. Es gibt aber auch nicht so gravierende Beispiele, von denen wir lernen können.

Nachtkerzenöl wurde in den frühen 1980er Jahren als sichere und wirksame Behandlung für Ekzeme beworben. Hinter der Behauptung steckte eine gewisse Logik: Nachtkerzenöl enthält die essenzielle Fettsäure Gamma-Linolensäure (GLA), von dem angenommen wird, dass es bei einem atopischen Ekzem nicht ausreichend vorhanden ist.

Daraufhin wurden mehrere Studien durchgeführt, die zu widersprüchlichen Ergebnissen führten. Bedenklich war, dass ein Großteil der veröffentlichten Studien von Herstellern des Nachtkerzenöls gesponsert wurde. Selbst in einer 1989 durchgeführten Metaanalyse der Studien zur Beurteilung der Wirksamkeit des Nachtkerzenöls bei atopischen Ekzemen wurde eine große Studie ausgelassen, die keinerlei Unterschied zwischen Nachtkerzenöl und einem Placebo gefunden hatte. Ein Vergleich aller relevanten fairen Untersuchungen wurde tatsächlich erst Mitte der 1990er von einer Gruppe unabhängiger Forscher durchgeführt, aber sogar diese Arbeit wurde von den Auftraggebern unterdrückt.

Trotzdem wurde die Marktzulassung für Nachtkerzenöl als Behandlung von Ekzemen nur wenige Jahre später von der Medicines and Healthcare products Regulatory Agency (der medizinischen Zulassungs- und Aufsichtsbehörde für Arzneimittel in Großbritannien) zurückgezogen. Warum? Im Jahr 2002 schaffte es ein Review aller relevanten fairen Behandlungsvergleiche (insgesamt 20 veröffentlichter und unveröffentlichter Studien) zur Veröffentlichung: Die Schlussfolgerung war, dass es für den Nutzen von Nachtkerzenöl bei Ekzemen keine Evidenz gab.

Im Gegensatz zum vorherigen Fall der Frühgeborenen mit IRDS entstand aus der Verwendung von Nachtkerzenöl für die Behandlung von Ekzemen zwar kein Schaden, aber es wurden wertvolle Ressourcen verschwendet. Umfangreiche Forschung wurde betrieben, um die wirksamste Dosis zu bestimmen, mögliche Nebenwirkungen zu erkennen und das Potenzial ähnlicher pflanzlicher Produkte für die Behandlung des atopischen Ekzems zu untersuchen. Die Arbeit und das Geld, das in diese Forschung investiert wurde, hätten währenddessen für nützlichere Studien eingesetzt werden können, wären alle relevanten Behandlungsvergleiche früher berücksichtigt worden.

Was folgt daraus?

In unzähligen Fällen wurden nicht alle relevanten Behandlungsvergleiche berücksichtigt. Sie alle aufzuzählen, würde diesen Blog unendlich lang werden lassen; die wesentlichen Erkenntnisse aus all diesen Fällen lassen sich aber in ein paar Punkten zusammenfassen. Die Berücksichtigung aller relevanten fairen Behandlungsvergleiche ist deshalb so wichtig, weil damit:

• die Unsicherheit von Behandlungsergebnissen quantifiziert werden kann
• zuverlässigere und statistisch genauere Schätzungen der Behandlungseffekte möglich sind
• Patienten und Studienteilnehmer vor vermeidbarem Schaden geschützt werden
• Ressourcenverschwendung in der Forschung und bei der Gesundheitsversorgung verhindert wird.
• Um diese Probleme anzugehen, wurde das Netzwerk Evidenzbasierte Forschung (EBRNetwork.org) gegründet.

Text: Neelam Khan

Übersetzt von: Katharina Jones

Zum Originaltext
Quellen

Testing Treatments
Klicken Sie hier für weitere Materialien zum Thema, warum alle relevanten fairen Behandlungsvergleiche berücksichtigt werden sollten

Alle Teilnehmer sollten nachbeobachtet werden

Dies ist der 19. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (IHC) Projektes erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Dass Teilnehmer aus Studien ausscheiden oder nicht nachbeobachtet werden können ist in der Forschung nichts ungewöhnliches, kann jedoch zu verzerrten Einschätzungen der Wirkung von Behandlungen führen.

Es gibt viele Gründe, warum Teilnehmer aus Studien ausscheiden oder für die Nachbeobachtung ‚verloren gehen‘ („lost to follow-up“), das heißt, fehlen [1]. Zum Beispiel ist die Teilnahme an einer Studie häufig mit einem Zeitaufwand verbunden, den einige Teilnehmer wegen anderer alltäglicher Verpflichtungen nicht einhalten können. Oder das Studienteam verliert aus irgendeinem Grund Kontakt zu Studienteilnehmern.

Wann wird die fehlende Nachbeobachtung zum Problem?

Zum Problem werden fehlende Nachbeobachtungen, wenn viele Teilnehmer „verloren gehen“, besonders wenn der Anteil der fehlenden Teilnehmer zwischen den verschiedenen Behandlungsgruppen ungleich verteilt ist [2]. Wenn zum Beispiel 75 % der Teilnehmer aus einer Gruppe und nur 15 % der Teilnehmer aus einer Vergleichsgruppe bei der Nachbeobachtung fehlen, ist ein Vergleich der Ergebnisse der verbleibenden Teilnehmer in den beiden Gruppen kein fairer Vergleich mehr.

Nehmen wir einmal an, in einer Studie wird ein neues Medikament gegen Kopfschmerzen (das „Amustriptan“ heißt) mit einem herkömmlichen Medikament verglichen, um zu bewerten, ob das neue Medikament besser gegen Kopfschmerzen wirkt als das alte. Die Teilnehmer der Studie werden gebeten, noch vor der Injektion des Medikaments sowie eine Woche und einen Monat danach einen Fragebogen auszufüllen.

Acht Prozent der Patienten, die der Behandlung mit Amustriptan zugeteilt waren, haben den letzten Fragebogen nicht ausgefüllt (fehlten bei der Nachbeobachtung), im Vergleich zu nur einem Prozent der Patienten in der Gruppe mit dem alten Medikament. Die vorliegenden Ergebnisse deuten darauf hin, dass Patienten aus der Amustriptan-Gruppe nach einem Monat Behandlung im Vergleich zu den Patienten, die das herkömmliche Medikament bekommen haben, weniger Kopfschmerzen hatten. Was aber ist mit denen, die nicht nachbeobachtet werden konnten?

Irreführende Ergebnisse?

Möglicherweise haben die Patienten in der Amustriptan-Gruppe ihren Fragebogen nach einem Monat nicht ausgefüllt, weil bei ihnen die Anzahl der Kopfschmerzattacken gestiegen war, und zwar so stark, dass Sie den Fragebogen nicht ausfüllen konnten. Zum Zeitpunkt, als sie das hätten tun sollten, lagen sie mit Kopfschmerzen im Bett. In diesem Szenario lassen die fehlenden Nachbeobachtungen das neue Medikament viel besser aussehen, als es ist, da die Ergebnisse der nicht einbezogenen Teilnehmer negativ waren.

Das kann auch in die umgekehrte Richtung gehen. Die Teilnehmer in der Amustriptan-Gruppe könnten ausgeschieden sein, weil sie sich sehr viel besser fühlten. Womöglich hatten sie seit der Injektion überhaupt keine Kopfschmerzen mehr und haben sich daher entschieden, nicht länger an der Studie teilzunehmen. In diesem Falle lässt das Fehlen bei der Nachbeobachtungen das neue Medikament tatsächlich schlechter aussehen, als es ist, da die Ergebnisse der nicht einbezogenen Teilnehmer positiv waren.

Es gibt auch noch eine dritte Möglichkeit: Mitunter führen fehlende Nachbeobachtungen nicht zu irreführenden Ergebnissen [3]. Wenn in der Amustriptan-Gruppe zum Beispiel ein größerer Anteil von Teilnehmern für die Nachbeobachtung fehlten, weil der Studienkoordinator vergaß, einem zufälligen Teil der Teilnehmer den Fragebogen einen Monat nach der Injektion auszuhändigen, könnten die Ergebnisse immer noch gültig sein. Grund dafür ist, dass der Verlust für die Nachbeobachtung zufällig erfolgte und nicht auf einem Unterschied zwischen den ausgeschiedenen und den nicht ausgeschiedenen Teilnehmern beruht.

Verzerrungen durch Analysen entgegenwirken

Wissenschaftler können den Auswirkungen des Ausscheidens von Teilnehmern oder des Fehlens bei der Nachbeobachtung manchmal mit einer „Intention-to-treat-Analyse“ entgegenwirken. Das bedeutet ganz einfach, dass alle Teilnehmer, die an einer randomisierten Studie teilnahmen, in die Analyse einbezogen werden, unabhängig davon, was nach der Randomisierung (Zuteilung der Teilnehmer in Studiengruppen nach dem Zufallsprinzip) passiert ist [4].

Wie sich zeigt, ist die Thematik fehlender Nachbeobachtungen gar nicht so einfach, wie es zunächst aussieht. Manchmal sind Ergebnisse aufgrund fehlender Nachbeobachtungen scheinbar schlechter, manchmal scheinbar besser und manchmal entstehen dadurch gar keine Verzerrungen. Intention-to-treat-Analysen sind ein nützliches Werkzeug für Wissenschaftler, um Verzerrungen im Zusammenhang mit fehlenden Nachbeobachtungen zu minimieren.

Nach einer Faustregel führt ein hoher Anteil von Teilnehmern, die aus einer Studie ausscheiden, in der Regel zu einer Verzerrung der Ergebnisse [2]. Ist der Anteil dagegen gering, sind die Gründe für das Ausscheiden der Teilnehmer entscheidend dafür herauszufinden, inwiefern die Ergebnisse beeinflusst worden sind und ob die Schlussfolgerungen aus ihnen verlässlich sind [3].

Text: Ed Walsh

Übersetzt von: Katharina Jones

Zum Originaltext

Referenzen

Klicken Sie hier für weitere Materialien zum Thema, warum alle Teilnehmer nachbeobachtet werden sollten.

 

Alle Ergebnisse von Teilnehmern einer Vergleichsstudie sollten auf dieselbe Weise ermittelt werden

Dies ist der 18. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (ICH) Projektes erarbeitet wurde. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Viele, die sich mit klinischer Forschung beschäftigen, kennen das Konzept der „Verblindung“: Ein Patient, der eine Behandlung erhält, oder ein Arzt (oder andere Person), die die Behandlung durchführt, haben keine Kenntnis davon, welche Behandlung der Patient bekommen bzw. der Arzt verabreicht hat. Reicht das aber aus, um einem ‚Beobachter-Bias‘ (der Verzerrung bzw. Verfälschung von Studienergebnissen durch die bewusste oder unbewusste Beeinflussung des Untersuchers aufgrund seiner Kenntnis der Zuteilung) vorzubeugen?

Schauen wir uns einmal folgendes Szenario an: In einer randomisierten Studie wird die Wirksamkeit von Morphium im Vergleich zu einem anderen Schmerzmittel zur Behandlung akuter Schmerzen untersucht. Die Patienten wissen nicht, welches Medikament sie einnehmen, und die Ärzte, die die Behandlung verabreichen, wissen es auch nicht: Sie nehmen einfach die Tabletten anhand der Patientennummer aus einer hierfür bestimmten Schachtel und geben sie an die Patienten aus. Das Risiko einer Verzerrung sollte in diesem Fall minimal sein, oder? Weiterlesen

Teilnehmer eines Behandlungsvergleichs sollten nicht wissen, welche Behandlung sie erhalten

Dies ist der 17. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (ICH) Projektes erarbeitet wurde. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Wenn Patienten eine Behandlung für ihr Gesundheitssproblem erhalten und daraufhin eine Verbesserung erfahren, wird häufig angenommen, dass dies auf dem naheliegendsten ‚Grund‘ basiert: die Behandlung selbst. Das kann natürlich stimmen, jedoch müssen wir andere mögliche Gründe ausschließen, bevor wir uns auf diese Schlussfolgerung verlassen können.

Zum Beispiel könnte die Erkrankung von selbst ausgeheilt sein; die Arzt-Patient-Interaktion könnte eine eigenständige Wirkung erbracht haben; Patienten könnten sich infolge der Behandlung anders verhalten haben; die Erwartungen der Patienten könnten ihre Wahrnehmung der Erkrankung beeinflusst haben und so weiter. Die automatische Annahme, dass ein beobachteter ‚Effekt‘ auf eine bestimmte ‚Behandlung‘ zurückgeht, war und ist die treibende Kraft für viele medizinische Behandlungen, die keinen wirklichen Nutzen bringen. Weiterlesen

2.3. Die Ergebnisse aller Teilnehmer einer Studie sollten in den ursprünglichen Gruppen ausgewertet werden

Dies ist der 15. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (ICH) Projektes erarbeitet wurde. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Stellen Sie sich vor, Sie lesen eine Studie und stellen fest, dass die Teilnehmer zwei Behandlungsgruppen zufällig („randomisiert“) zugeteilt wurden. Eine Gruppe wird einer operativen Behandlung zugeteilt, die andere einer medikamentösen. Großartig, denken Sie, die Teilnehmer wurden zufällig zugeteilt: dies hilft sicherzustellen, dass die Gruppen in ihren Eigenschaften vergleichbar sind. Das ist aber nicht alles. Einige Teilnehmer erhalten aus verschiedenen Gründen möglicherweise die ihnen zugeteilte Behandlung nicht. Zum Beispiel können sich Teilnehmer gegen die Behandlung entscheiden.

Es ist wichtig, dass – soweit möglich – alle Patienten, die den beiden Gruppen zugeordnet wurden, nachbeobachtet und in der Hauptanalyse der Gruppe erfasst werden, der sie ursprünglich zugeteilt wurden. Selbst wenn Teilnehmer – und dies mag auf den ersten Blick widersinnig erscheinen – die zugeteilte Behandlung tatsächlich nie erhalten haben. Der Grund hierfür ist, dass Teilnehmer, die nicht behandelt werden oder die Behandlung nicht einhalten, sich möglicherweise in ihren Eigenschaften von denjenigen, die die Behandlung einhalten, unterscheiden. Wenn Teilnehmer, die ihre Behandlung nicht eingehalten haben, aus der Analyse ausgeschlossen werden, bedeutet dies möglicherweise, dass der Behandlungsvergleich nicht mehr fair ist. Das heißt, es wird nicht mehr Gleiches mit Gleichem verglichen.

Weiterlesen