Evidenz ist nicht gleich Evidenz

Teens & Twens mit GD leiden. Sie brauchen die bestmögliche Behandlung!

Die allermeisten ExpertInnen behaupten auf der Basis wissenschaftlicher Erkenntnisse zu arbeiten bzw. zu empfehlen. Aber Evidenz ist nicht gleich Evidenz. Oft werden bereits Expertenmeinungen als Evidenz angeführt, die primär auf Erfahrungen oder Einzelfällen und nicht auf wissenschaftlichen Fakten beruhen. Die höchste Evidenz-Qualität bieten systematische Reviews von unabhängigen Institutionen. Ein großes Problem besteht, weil vor allem Langzeit-Studien fehlen.
Eltern sollten einschätzen können, was mit Evidenz gemeint ist bzw. um welche Evidenz-Stufe es sich jeweils handelt. Als Eltern sind wir mitverantwortlich, wenn es um Entscheidungen zu medizinischen Behandlungen geht, die unser Kind anstrebt bzw. die von Experten vorgeschlagen werden. Genau wie bei jeder anderer medizinischen Versorgung geht es um Fragen wie:

  • Ist die Behandlung sicher und medizinisch notwendig?
  • Ist es wahrscheinlich, dass die Behandlung der Genderdysphorie wirksam ist?
  • Was sind die Risiken?

Unter evidenzbasierter Medizin (EBM) versteht man nach David L. Sackett u. a.: 

„the conscientious, explicit, and judicious use of current best evidence in making decisions about the care of individual patients. The practice of evidence based medicine means integrating individual clinical expertise with the best available external clinical evidence from systematic research.”

Die Evidenzpramide

Je nach Studiendesign sind Fehleranfälligkeit und Ergebnissicherheit stärker oder schwächer ausgeprägt. Randomisierte kontrollierte Studien (RCT) erzielen Studienergebnisse mit der höchsten internen.

Evidenzpyramide - Quelle: IQWIG
(RCT = Randomisierte kontrollierte Studien)

Expertenkonsens als unterste Stufe von Evidenz

Der Expertenkonsens (konsensbasierte Expertenmeinungen, von Kritikern auch halbernst „Eminenzbasierung” genannt), gilt als unterste Stufe der Evidenz-Pyramide und muss nicht unbedingt etwas mit empirischer Wahrheit zu tun haben. Er kann sogar in katastrophaler Weise weit davon entfernt sein:

„In the early 1900s, it was expert medical consensus that smoking cured asthma and other lung diseases. It is well within living memory that the expert consensus for treating back pain was bed rest and plenty of it. We now know this is likely to increase pain and prolong recovery.

The history of medicine is littered with these examples, and there are treatments we are recommending now with the full blessing of expert consensus that will eventually prove to be ineffectual at best, fatal at worst. (Baxendale)"

Evidenz zu vertrauen, die hauptsächlich aufgrund von Expertenkonsens zustande gekommen ist, kann also leicht zu Fehlentscheidungen führen.

Konsens kann bei Leitlinien-Empfehlungen auf klinischer Erfahrung beruhen, kann aber auch leicht durch andere Aspekte beeinflusst werden, wie fehlgeleitete Empathie, ideologischen oder politischen Einfluss, Beispiel: England GIDS und die Lobbyorganisation Mermaids.

Systematische Reviews bilden die Spitze

Systematische Analysen wissenschaftlicher Beweise stehen in der Evidenz-Pyramide ganz oben und gelten als „Goldstandard” in der Medizin. Eine strenge Prüfung aller verfügbaren Beweise z. B. auf Relevanz für eine konkrete Fragestellung soll das „Rosinenpicken” von Studien verhindern. Bei den relevanten Studien werden Ergebnisse und Qualität bewertet, auf dieser Grundlage schließlich Empfehlungen ausgesprochen.

Primer on Conducting a Systematic Review of Evidence, SE GM, 06.08.2023

Bei Systematischen Reviews werden viele Ressourcen benötigt, um zunächst die Studien herauszufinden, die relevant sind und strengen Qualitätskriterien entsprechen. Oft besteht ein Ergebnis solcher Recherchen in der Erkenntnis, dass es zu bestimmten Fragestellungen noch gar keine relevanten und hochwertigen Studien gibt. Ein Beispiel: eines schwedischen Reviews zu PB und CSH 2023:

PB und CSH - Systematisches Review aus Schweden, 2023

Unterschiedliche Evidenz-Niveaus bei Empfehlungen zur GD-Behandlung

Weltweit stehen allen ForscherInnen dieselben Studien zur Verfügung. Allerdings sind diverse Institutionen auf internationaler und nationaler Ebene zu unterschiedlichen Schlussfolgerungen hinsichtlich der Sicherheit und Wirksamkeit der medizinischen GD-Behandlungen gekommen.
Es gibt Unterschiede bei den Standards und Strukturen, die bei einer Bewertung von Belegen und bei der Umsetzung in Empfehlungen zugrunde gelegt werden. Außerdem spielt eine Rolle, inwieweit die Studien-Auswahl und -Bewertung transparent, neutral bzw. unabhängig erfolgt.

Gender dysphoria in young people is rising - and so is professional disagreement, J. Block, BMJ, 23.02.2023

Nennen Sie es nicht evidenzbasiert

Welche Evidenz haben die Empfehlungen in Deutschland?

AMWF-Leitlinien für Erwachsene - umstrittenes Evidenzniveau

Die Leitlinie „Geschlechtsinkongruenz, Geschlechtsdysphorie und Trans-Gesundheit" zur Diagnostik, Beratung und Behandlung erwachsener „binärer wie non-binärer trans Menschen" wurden 2018 veröffentlicht (Gültigkeit bis 18.09.2023) und ist für ÄrztInnen und PsychotherapeutInnen bestimmt. Die Empfehlungen dieser S3-Leitlinie sind überwiegend konsensbasiert,

Im Leitlinienreport werden die Evidenzbewertung der von der Kommission recherchierten Studienliteratur und das Konsensverfahren genauer erläutert, unter anderem heißt es:

"Die Aussagen und Empfehlungen zur Behandlung in der vorliegenden Leitlinie sind entweder empirisch fundiert und belegen dies mit der Angabe von Quellen (deren methodische Qualität zuvor gewichtet wurde) oder sie resultieren aus den therapeutischen Erfahrungen der an der Leitlinienentwicklung beteiligten Mandatsträger_innen."

Es wird bestätigt, dass eine unabhängige externe Begutachtung der Studienliteratur nicht stattgefunden hat. Außerdem:

"Die Leitlinie nimmt Bezug auf die Standards of Care (SoC) der World Professional Association for Transgender Health (WPATH). In ihrer siebten, 2011 herausgegebenen Version."

In der Begutachtungsrichtlinie „Geschlechtsangleichende Maßnahmen bei Transsexualismus" des GKV-Spitzenverbands für Erwachsene heißt es mehrfach, es sei

"zu berücksichtigen, dass die in der S3-LL 2018 zusammengetragenen wissenschaftlichen Belege in qualitativer Hinsicht auf niedrigem Evidenzniveau beruhen (Kohortenstudien und vorwiegend Expertenkonsens)."

Zu dieser Kritik haben etliche Fachverbände der AWMF-S3-LL-Kommission im April 2021 eine Stellungnahme verfasst,

AMWF-Leitlinien für GD-Kinder und Jugendliche

Seit 2018 gibt es keine gültigen Leitlinien für „Geschlechtsinkongruenz und Geschlechtsdysphorie im Kindes- und Jugendalter". Die Folgeversion der 2013 veröffentlichten S1-Leitlinie ist als S3-Leitlinie für Ende 2023 angekündigt.

Im April 2022 riet Prof. Dr. Kölch (Mitglied der Leitlinien-Kommission) in einer Antwort auf Fragen von TTSB-Eltern:

„Bis zur Veröffentlichung dieser neuen Leitlinien können Behandelnde in der Versorgungspraxis sich an aktuellen und wissenschafltich anerkannten internationalen Leitlinien orientieren (z. B. der WPATH sowie der Endocrine Society)."

Insofern ist davon auszugehen, dass sich die neuen Leitlinien für Minderjährige in Deutschland an den amerikanischen Empfehlungen von WPATH und Endocrine Society orientieren werden, die ihrerseits nicht auf der qualitativ besten Evidenzbasis beruhen (s. o.). Die Frage bleibt, inwieweit die Leitlinien-Kommission die systematischen Reviews einiger europäischen Länder (z. B. VK, F, S, NO) berücksichtigen oder ignorieren wird und ob die Gründe dafür transparent gemacht werden.

Der Koordinator der Leitlinienkommission, Prof. Dr. Romer deutete in einem Interview der SZ an, dass die Erwachsenen-Leitlinien auch eine gewisse Relevanz für Jugendliche hätten:

„Zunächst gilt in der Jugendmedizin, dass Behandlungen, die für Erwachsene hinreichend evidenzbasiert und bewährt sind, für Jugendliche nicht grundsätzlich falsch sind, nur weil die Studienlage im Vergleich dünner ist.” (SZ, 01.06.2023)

Die Ableitung aus der Erwachsenenbehandlung ist bei etlichen Themen problematisch bzw. unmöglich, z. B. spielen Pubertätsblocker bei der Erwachsenen-Transition keine Rolle, die Off-Label-Thematik stellt sich für Minderjährige sicherlich auch anders als bei Erwachsenen.

So wie die Leitlinien der Endocrine Society für Jugendliche aus der Forschung von Klinikern in den Niederlanden in den Jahren um die Jahrtausendwende hervorgegangen sind, nehmen auch die deutschen Experten der Leitlinienkommission diese oft als „Dutch Protocol” bezeichnete sog. Proof-of-Concept-Studie (bestehend aus den beiden Teil-Studien von 2011 und 2014) mit 70 bzw. 55 StudienteilnehmerInnen anscheinend weiterhin als Hauptreferenz für ihre Empfehlungen:

„Grundlage unserer heutigen Empfehlungen sind neben der gesammelten Praxiserfahrung vor allem die Erkenntnisse aus den bisherigen Verlaufsstudien, die sich am sogenannten Dutch Protocol orientiert und immer weiter verdichtet haben.” (SZ, 01.06.2023)

Das Dutch Protocol ist mittlerweile stark in die Kritik geraten, da den Studien gravierende methodische und qualitative Mängel nachgewiesen wurden. Darüber hinaus unterscheidet sich die Kohorte genderdysphorischer Jugendlicher heute stark von der der niederländischen Studien, so dass diese Referenzierung äußerst problematisch geworden ist:

Das Niederländische Modell - populär, aber evidenzschwach

Neue Kritik: Niederländischer Schlamassel statt Goldstand

Statt selbst zu forschen, referenzieren viele Praktiker in der westlichen Welt de facto seit vielen Jahren auf das mehr als 15 Jahre alte sog. Dutch Protokoll. Allerdings haben sich im Laufe der Zeit wesentliche Rahmenbedingungen geändert, sodass die Referenzierung selbst den niederländischen Pionieren mittlerweile Angst macht.

Stop ''blindly adopting our research'', Grace Williams, 16.03.2021

More research is urgently needed into transgender care for young people, 27.02.2021

Was die klinische Forschung angeht, wurde Deutschland kürzlich als „Studienmuffel” bezeichnet. Seit Jahren fordern fordern viele Experten beständig „mehr Forschung”, ohne dass im nennenswerten Umfang Forschungsprojekte mit genderdysphorischen Teens & Twens durchgeführt würden. Speziell in Deutschland wird generell sehr wenig geforscht. Gesundheitsminister Karl Lauterbach sagte kürzlich:

Wir haben sehr gute Wissenschaftler, aber diese Wissenschaftler verzweifeln, weil sie das nicht haben, was sie für ihre Studien bräuchten: Daten.(Rhein. Post, 09.08.2023)

In England, Dänemark und den USA befinden sich auf die Bevölkerung umgerechnet zehnmal mehr Patienten in klinische Studien als in Deutschland. ... Wir haben zu wenig Daten." (Rhein. Post, 09.08.2023)

Gesundheitsminister Karl Lauterbach vermittelte in seiner Interview-Serie weiteres medizinisches Grundlagenwissen, das auch für medizinische Entscheidungen genderdysphorischer Teens & Twens nicht unwichtig ist:

Bis zum 25. Lebensjahr wird das Gehirn noch umgebaut." (Welt, 09.08.2023)


Empfehlungs-Schlamassel

Die WPATH räumte ein, dass ihre Leitlinien auch auf konsensbasierten Expertenmeinungen beruht. Prof. Helfand (Professor für medizinische Informatik und klinische Epidemiologie) sagte dazu:

„In the absence of high quality evidence and the presence of a patient population in need - who are willing to take on more personal risk - consensus based guidelines are not unwarranted. But don’t call them evidence based.” (J. Block, BMJ)

Gender dysphoria in young people is rising - and so is professional disagreement, J. Block, BMJ, 23.02.2023

Nennen Sie es nicht evidenzbasiert

Die Bedenken von Heneghan und Jefferson

Interessanterweise hatten die Gutachter Carl Heneghan (Prof. für evidenzbasierte Medizin, Uni Oxford) und sein Kollege Tom Jefferson bereits 2019 im British Medicine Journal einen Evidenzbericht zu Pubertätsblockern veröffentlicht. Ihr Fazit war:

„that the use of these drugs with gender dysphoric children was so poorly evidenced that it was “largely experimental” and should be confined to a formal research setting.”

Gender-affirming hormone in children and adolescent, Heneghan & Jefferson, BMJ, 25.02.2019

Der Times sagte Heneghan

“Given paucity of evidence, the off-label use of drugs [for outcomes not covered by the medicine’s licence] in gender dysphoria treatment largely means an unregulated live experiment on children.”

Calls to end transgender ‘experiment on children, The Times, L. Bannerman, 08.04.2019

Der NHS hat mehr als 4 Jahre gebraucht, um schließlich im Juni 2023 zu ähnlichen Schlussfolgerungen zu kommen und die medizinischen Interventionen bei Minderjährigen aus der routinemäßig verfügbaren Behandlung herauszunehmen bzw. sie auf klinische Forschungsstudien zu begrenzen.

'Told you so' - There never was good quality evidence for paediatric gender change, Bernard Lane, 19.06.2023; enthält eine Variante der Evidenzpyramide

Transgender care needs better science, more transparency - Here are the holes in the gender-affirming narrative, L. Sapir, 19.08.2023


Bestmögliche Behandlung unserer Teens & Twens

Patrick K. Hunter amerikanischer Kinderarzt, sagt zur Debatte:

Children and youth with gender dysphoria are suffering. They need care—the best possible care, excellent care. We need to return to the community standard of care for treating stress and that is psychotherapy—ethical, compassionate psychotherapy that respects the child’s experience. Let me say that again: ethical, compassionate psychotherapy that respects the child’s experience.

This is what Europe [some countries] is doing. Our colleagues in Great Britain, Sweden, Finland and elsewhere agree change is needed. Less harm needs to be done. Safety and ethics need to prevail.

 Rede von Patrick K. Hunter, YT, 04.11.2023


Etliche Gender-Kliniker verstehen EBM nicht

Beispiel: Jack Turban (Kinder- und Jugendpsychiater in San Francisco), einer der führenden Vertreter der „gender-affirmierenden" Versorgung in Amerika, wird laut Leor Spier regelmäßig dafür kritisiert, dass er zutiefst fehlerhafte Forschungergebnisse vorlegt und die Veränderungen bei der Behandlung von GD-Jugendlichen in etlichen europäischen Ländern leugnet. Scheinbar versteht er auch die Grundprinzipien der evidenzbasierten Medizin (EBM) nicht.

Gerade die 3 systematischen Reviews aus England, Finnland und Schweden kommen zu demselben schwachen Evidenz-Ergebnis bei Pubertätsblockern. Das müsste eigentlich bei allen ExpertInnen weltweit die Alarmglocken klingeln lassen, denn Prof. Guyatt, der die Qualitätskriterien für die EBM maßgeblich mitentwickelt hat, erklärt

„Wenn alle systematischen Übersichten zu demselben Ergebnis kommen, erhöht das eindeutig unser Vertrauen in diese Schlussfolgerung".

Leo Sapir berichtet über Jack Turban, aber auch über viele interessante Details zur EBM und zur Evidenzpyramide:

The Deposition of Jack Turban, L. Sapir, 13.11.2023


The Band of Debunkers Busting Bad Scientists, wsj, Subbaraman, 24.09.2023