Jürgen Kriz, Osnabrück: Der Mensch als „Störgröße“
Macht es einen Unterschied, ob man zwei Maschinen, die Blechknöpfe ausstanzen, hinsichtlich ihres Ausschusses untersucht, ob man zwei Medikamente hinsichtlich ihrer Wirkung vergleicht oder ob man zwei Psychotherapieansätze auf ihre Wirksamkeit hin überprüft?
Jürgen Kriz
Diese Frage wird wohl von der überwiegenden Mehrheit mit „ja“ beantwortet – allerdings aus unterschiedlichen Gründen. So könnte man anführen, dass die Untersuchungsbereiche von „Maschinen“ über „Wirkstoffe“ hin zu „Psychotherapie“ zunehmend komplexer werden. Dies würde für die Wirksamkeit von Psychotherapie gegenüber der einer Maschine eine grundlegend andere Prüfmethodik erfordern, die beispielsweise die Erkenntnisse über Rückkopplungen und nichtlineare Entwicklungen berücksichtigt. Doch diese Aspekte berührt den Mainstream wenig. Stattdessen wird der Unterschied am Erreichen eines Ideal festgemacht, das methodisch einfach und damit „sauber“ untersucht werden kann. Das Ausstanzen von Blechknöpfen wird zum Grundmodell erhoben, demgegenüber die Prüfung von Wirkstoffen am Menschen „Verzerrungspotential“ hat, weil Untersucher als auch Patienten von ihren Vorannahmen, Interessen, usw. beeinflusst sein könnten. Um diese „Störgrößen“ hinreichend auszuschalten, ist man auf die Idee gekommen, eine „doppelte Verblindung“ zu fordern: Weder Patient noch Untersucher wissen, wer welches Medikament (oder ein Placebo) bekommt.
Noch größer ist dann das „Verzerrungspotential“ in der Psychotherapieforschung, weil es dort nicht einmal mehr den „objektiven“ Wirkstoff gibt, sondern Therapeut und Patient denkende Menschen sind. Wer nun aber meint, auf die Idee mit der „doppelte Verblindung“ könne ernsthaft niemand kommen, sollte sich den Bericht des IQWiG (Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen) zur systemischen Therapie ansehen (1). Das IQWiG wurde vom G-BA (Gemeinsamer Bundesausschuss) beauftragt, die „Bewertung der systemischen Therapie bei Erwachsenen“ durchzuführen (2). In dem 860-seitigen Abschlussbericht wurde bei den Therapiestudien durchgängig die fehlende Verblindung als Manko gewertet. Auf die Kritik daran durch die Antragsteller schreibt das IQWIG:
„Das Institut teilt die Einschätzung der Stellungnehmenden, dass eine Verblindung der Therapeuten wie auch der Patienten im Bereich von Psychotherapiestudien regelhaft nicht möglich ist. Jedoch kann eine fehlende Verblindung das Verzerrungspotenzial beeinflussen, ungeachtet dessen, ob es möglich ist, eine Studie verblindet durchzuführen. Der Aspekt der Verblindung muss also berücksichtigt werden.“ (S. 523)
Was sind nun diese „Störgrößen“ die man für eine saubere, „verzerrungsfreie“ Forschung nach diesem Modell möglichst eliminieren will? Auf den Punkt gebracht könnte man sagen: Alle jene Einflüsse, die im Wesentlichen den Kern von Psychotherapie ausmachen – allem voran die therapeutische Beziehung. Denn diese und weitere sog. „unspezifische Faktoren“ machen den allergrößten Teil des Erfolges einer Psychotherapie aus, wie praktisch die gesamte Forschung international in den letzten Jahrzehnten immer wieder gezeigt hat. Während das, was in den RCT—Studien als spezifische Wirkung geprüft wird, einen vergleichsweise sehr kleinen Anteil ausmacht. Dieses ist zwar, je nach therapeutischem Ansatz, unterschiedlich hoch. Allerdings ist sonst noch niemand auf die Idee gekommen, doppelte Verblindung hier als Qualitätsmerkmal anzusehen.
Schon im medizinischen Bereich ist das Problem aber keineswegs so einfach, wie man es sich am Schreibtisch ausdenkt. Denn nur auf den ersten (theoretischen) Blick lässt sich das Wissen des Arztes darüber, ob sein Patient das Medikament A oder B oder ein Placebo bekommt, als „Verzerrungspotential“ deuten, sofern man allein am Einfluss der Wirkstoffe interessiert ist. Und es sei nicht bestritten, dass der Einfluss von Wirkstoffen für die Forschung (auch!) eine interessante Frage ist. Jenseits der Forschung aber geht es nicht allein um Wirkstoffe, über deren prinzipielle Wirkung an verblindeten Probanden in abstrakten medizinischen Papers Berechnungen angestellt werden. Sondern es geht um ärztliche Heilkunst beim Menschen. Und dies ist weitaus komplexer, als das Verabreichen von Wirkstoffen. So kann man sich durchaus vorstellen, dass sehr viele Wirkaspekte relevant sind, wenn ein bestimmter Arzt das Medikament A in einer spezifischen Situation einem bestimmten Patienten verordnet: So ist beispielsweise seine persönliche ärztliche langjährige Erfahrung im Zusammenhang mit Medikament A bedeutsam, welche ihn befähigen, auf Nuancen im Krankheitsverlauf seines spezifischen Patienten zu achten, zu reagieren und ggf. mit weiteren Maßnahmen zu ergänzen. Daher kann er auch bei einem anderen Patienten trotz identischer diagnostischer Kategorisierung – aber deutlich anderen spezifischen und situativen Bedingungen – aus guten Gründen Medikament B bevorzugen.
Um beliebten Missverständnissen vorzubeugen sei betont, dass es hier nicht darum geht, Befunde einer „objektiven medizinischen Wissenschaft“ gegen „subjektive Erfahrung“ auszuspielen oder gar erstere durch letztere zu ersetzen. Beides ist wichtig. Aber wer behauptet, dass die ausgeblendeten „Störeinflüsse“ der „verzerrungsfreien“ Designs in der objektiven medizinischen Forschung für die Heilverläufe in der ärztlichen Praxis allesamt irrelevant wären – oder aber, anders herum, die notwendig reduzierten und standardisierten Forschungsroutinen vollständig die ärztliche Praxis abbilden würden – verzerrt seinerseits die Komplexität menschlicher Heilungsprozesse und ärztlichen Handelns zu einer vergleichsweise simplen Laborrealität.
Das ganze Procedere ist vergleichbar mit der Untersuchung des Nutzens von Fallschirmen durch ein dafür zuständiges Gremium, das sich dadurch auszeichnet, dass es gewöhnlich sehr sorgfältig „fallende Körper“, wie Kugeln, Steine etc., untersucht. Bekanntlich gib es auch bei Fall-Experimenten etliche „Störgrößen“ – besonders den Einfluss der Luft – weshalb man solche Untersuchungen in möglichst weitgehend luftleer gepumpten Zylindern durchführt. Wenn man nun mit dieser Logik und diesem Argument an die Überprüfung der Wirksamkeit von Fallschirmen herangeht, wird man unschwer finden, dass sich keine Bremswirkung nachweisen lässt: Das, worauf es ankommt, wurde eben als „Störgröße“ eliminiert, um das „Verzerrungspotential“ gering zu halten.
Ein Gremium, das so verfahren würde, wäre vermutlich auch gegenüber dem Argument immun, dass viele Jahrzehnte sehr erfolgreich Menschen mit Fallschirmen aus Flugzeugen und dergleichen gesprungen sind – ja, dass damit sogar viele Leben gerettet wurden. Denn als „Gegenargument“ könnte angeführt werden, dass es keine Kontrollgruppe gibt – also eine größere Gruppe Menschen, die ohne Fallschirm aus dem Flugzeug gesprungen sind. Kontrollgruppen sind aber nun einmal für sorgfältige wissenschaftliche Wirkstudien unumgänglich.
Das Ideal von Forschung, die sich an Blechknöpfe stanzenden Maschinen orientiert, kann Psychotherapieforschung aufgrund der Störgröße „Mensch“ nicht erreichen. Nicht einmal das Ideal doppelverblindeter Pharmaforschung. Die Frage ist daher: Macht es Sinn, sich an einem Spiel nach solchen Regeln weiter zu beteiligen?
Anmerkungen:
(1) Systemische Therapie bei Erwachsenen als Psychotherapieverfahren. IQWiG-Berichte – Nr. 513.
(2) Mit der Systemischen Therapie bei Kindern- und Jugendlichen hat der G-BA bisher noch nicht einmal angefangen, eine Prüfung einzuleiten, obwohl (oder weil?) die Wirksamkeit bei der Prüfung durch den „Wissenschaftlichen Beirat“ (WBP) besonders eindrucksvoll war. Offensichtlich fehlt bei den mächtigen Interessengruppen in Deutschland der Wille, dieses sehr wirksame Psychotherapieverfahren den Patienten in diesem Lande zu Verfügung zu stellen.
(Erweiterte Fassung von Der Mensch als „Störgröße“ in: Gesprächspsychotherapie und Personzentrierte Beratung 4/2017, S. 220)