Å sammenlikne tilsynelatende like grupper av pasienter som har fått forskjellig type behandling i samme tidsperiode

Fremdeles sammenliknes erfaringer og resultater hos tilsynelatende like grupper av pasienter som har fått forskjellige typer behandling i samme tidsperiode, for å prøve å evaluere effektene av behandlingsmetoder. Men denne tilnærmingen kan også være villedende i alvorlig grad. Utfordringen – i likhet med historiske kontrollgrupper – er å kunne vite om gruppene som mottar forskjellig behandling, var tilstrekkelig like da de begynte behandlingen for at det skal kunne gjøres en gyldig sammenlikning – med andre ord om likt er blitt sammenliknet med likt. Som med historiske kontrollgrupper kan forskere gjøre statistiske korreksjoner og analyser for å prøve å rette opp dette, men bare hvis relevante karakteristika hos pasientene i sammenlikningsgruppene er blitt registrert og tatt med i beregningen. Det er så sjelden at disse forutsetningene er oppfylt, at slike analyser alltid må sees på med forsiktighet. Det kan få katastrofale følger hvis man velger å tro på dem.

Et godt eksempel på dette er hormontilskudd (HRT). Kvinner som hadde brukt HRT under og etter overgangsalder, ble sammenliknet med tilsynelatende samme typen kvinner som ikke hadde brukt det. Sammenlikningen anslo at HRT reduserte risikoen for hjerteinfarkt og hjerneslag, ­ noe som hadde vært en kjærkommen nyhet hvis den var riktig. Men dessverre var den ikke det. Påfølgende sammenlikninger, som ble utformet før behandlingen startet for å sikre at kontrollgruppene var like, viste at HRT hadde akkurat motsatt effekt; antall hjerteinfarkter og slag økte faktisk. I dette tilfellet skyldtes den tilsynelatende forskjellen i dødelighet at kvinner som brukte HRT, vanligvis var friskere enn dem som ikke tok HRT; ­ det skyldtes altså ikke HRT i seg selv. Forskning som ikke sørger for at likt faktisk blir sammenliknet med likt, kan resultere i skadelige konsekvenser for titusenvis av mennesker.

Som erfaringene med HRT viser, er det altså best å sette sammen kontrollgruppene før behandlingen starter. Gruppene må bestå av pasienter som er like, ikke bare med hensyn til kjente og målte faktorer som alder og sykdommens alvorlighetsgrad, men også faktorer som ikke måles, men som kan påvirke tilfriskningen etter sykdom, slik som kosthold, yrke og andre sosiale faktorer, engstelse for sykdom eller planlagte behandlinger. Det er alltid vanskelig – egentlig umulig i mange tilfeller – å være sikker på at behandlingsgrupper er like hvis de er satt sammen etter at behandlingen er startet.

Det avgjørende spørsmålet er: Tilsvarer forskjeller i resultatet forskjeller som ligger i effekten av behandlingen som blir sammenliknet, eller i forskjeller mellom pasientene i de ulike behandlingsgruppene?