Vigtige faktorer at overveje ved design og rapportering af dyreforsøg

Dyreforsøg Det er afgørende at sikre, at dyreforsøg leverer brugbare og pålidelige resultater til gavn for både forskningen og patienter. Og her kan faktorer som køn og alder af forsøgsdyr, randomisering, blinding af data og forregistrering spille en central rolle i at styrke resultaternes pålidelighed og overførbarhed.

Shutterstock 419784250 © Shutterstock
Indblik

Hvis vi skal kunne retfærdiggøre at udføre forsøg på levende dyr, må der komme brugbare resultater ud af forsøgene. Fundamentalt set må resultaterne derfor kunne reproduceres af andre forskere, og resultaterne fra biomedicinske forsøg skal i stort omfang kunne komme patienter til gode.

Imidlertid har dyreforsøg i flere år stået overfor problemer med manglende reproducerbarhed og overførbarhed til mennesker. Denne dobbelte krise har mange årsager, som i dag kun delvist er erkendte. Men en del af krisen skyldes utvivlsomt et mangelfuldt design og rapportering af mange dyreforsøg i de publicerede videnskabelige artikler. I denne oversigtsartikel vil nogle af disse problemstillinger bliver diskuteret – alle forhold som den enkelte forsker selv har mulighed for at gøre noget ved her og nu.

Dyrenes køn og alder

Forsøgsdyrenes køn og alder kan have stor betydning for de opnåede resultater. Historisk set er der anvendt langt flere handyr end hundyr i forskningen, særligt indenfor farmakologi, neurovidenskab og psykologi, hvor dette er velbeskrevet.

Kønsbias kan være medvirkende til tilbagetrækning af lægemidler fra markedet, når der opstår ukendte bivirkninger hos patienter. Ifølge forskeren Lee var årsagen til tilbagetrækningen af otte ud af ti lægemidler i USA i årene 1997-2000, at lægemidlerne forårsagede alvorlige og ukendte bivirkninger hos særligt de kvindelige patienter.

Selvom lægemidlerne ganske vist har været sikkerhedstestet hos dyr af begge køn, kan brugen af hanner i den forudgående forskning måske have maskeret visse bivirkninger hos kvinder. Det er derfor oplagt at inddrage forsøgsdyr af begge køn i sine studier, når dette er relevant og praktisk muligt. Data kan efterfølgende analyseres for hvert køn separat, og hvis ingen kønsforskelle påvises, kan data blot pooles i den endelige analyse. Dermed undgår man at bruge unødigt mange forsøgsdyr til sine forsøg, og samtidigt får man et indblik i datas eventuelle kønsafhængighed.

Også forsøgsdyrenes alder er en faktor, der bør tænkes ind i forsøgene, men som i dag forsømmes. Selvom megen forskning er relateret til sygdomme hos ældre mennesker, bliver størstedelen af forskningen stadig udført på yngre forsøgsdyr. Et nyligt publiceret oversigtsstudie af Klæstrup og medarbejdere viste således, at aldrende forsøgsdyr er bedre end unge forsøgsdyr til forskning i Parkinsons sygdom, der er en sygdom, der fortrinsvis rammer den ældre aldersgruppe. For nogle dyrearter, såsom grise, er det dog i dag næppe muligt at skaffe gamle forsøgsdyr, og derfor bliver forskningen i stedet udført på forsøgsgrise på under 2-3 år, hvilket utvivlsom er et problem for en del af de opnåede resultater.

Foruden køn og alder bør dyrenes forhistorie beskrives i artiklerne, fx stamme, leverandør, sundhedstilstand, opstaldningsbetingelser og akklimatiseringsperiode. Ligesom valget af dyreart også bør overvejes og gerne begrundes i de videnskabelige artikler. Sidstnævnte sker kun sjældent. Nogle tidsskrifter trykker artikler med loft over antal ord, og her kan det være vanskeligt at få plads til alle disse data, men ofte er det muligt at lægge ekstra oplysninger i artiklens appendiks.

Randomisering

At man bør anvende en metode til lodtrækning af sine forsøgsdyr er ganske logisk og banalt, men ikke desto mindre tyder systematiske oversigtsartikler på, at det ofte bliver forsømt. Ikke at de publicerede artikler direkte anfører, at der ingen randomisering er foregået, blot at metodeafsnittet ikke nævner noget herom.

En egentlig randomisering i form af lodtrækning bør foretrækkes, og man bør således ikke blot tage de førstfangne dyr i buret og lade dem udgøre sin egen gruppe, men må sikre sig, at fordelingen er foregået tilfældigt. Alternativt kan forsøgsdyrene stratificeres, hvilket vil sige, at man fordeler dem efter vægt, således at behandlingsgrupperne bliver så ens som muligt. Hvad enten den ene eller anden metode anvendes, så bør det beskrives i de videnskabelige artikler.

Blinding af data

Selvom forskere tilstræber at være objektive, når de analyserer og fortolker data, risikerer de alligevel at være påvirkede af egne forventninger og håb til resultaterne. Det er så menneskeligt at lade sig påvirke af de forventninger, man har, at det nærmest er umuligt at lægge fra sig. Dette er baggrunden for, at man bør overveje at blinde sine forsøg, når det er muligt.

At blinde forsøgene betyder, at de der arbejder med dyrene, forsøgene og data ikke på forhånd har kendskab til, hvilke forsøgsdyr, der har fået hvilke behandlinger. I praksis udstyres hvert dyr med en neutral kode, og først efter endt dataanalyse afsløres det, hvilke dyr, der har fået hvilke behandlinger. Blinding bør ligesom randomisering nævnes i publikationerne.

I et berømt rotteeksperiment fra 1963 udleverede psykolog Robert Rosenthal rotter til sine studerende, som skulle træne og teste dyrene i en adfærdstest. Rotterne blev tilfældigt fordelt blandt de studerende, men de studerende, der fik at vide, at de havde fået særligt kloge rotter, opnåede bedre resultater med dem, end de studerende, der fik det modsatte at vide. Rotternes præstationer var altså afhængige af, hvilke forventninger de studerende havde til dem – en effekt kaldet Rosenthal-effekten. Dette fænomen er måske årsagen til, at der i litteraturen er større tendens til at finde virkningsfulde lægemidler mod Alzheimers sygdom, når dyreforsøgene ikke har været blindet. Altså at forventningen til, at et nyt lægemiddels gode effekter har påvirket resultaterne. Som det fremgår af boksen, har ingen af disse lægemidler dog efterfølgende vist sig i stand til at helbrede Alzheimers sygdom hos mennesker.

Forregistrere studier

Det kan være fristende at analysere sine data og først herefter finde frem til målparametre og statistiske metoder. Dette kaldes at »fiske« efter signifikans. Men dette kan føre til, at talmæssigt tilfældige fund bliver forstørret op, som var det et positivt resultat. Her skal det erindres, at hvis man blot analyserer 20 parametre, vil sandsynligvis et af dem ved en tilfældighed falde signifikant ud på 5 procent-niveau (falsk-positiv). Det har derfor været foreslået, at dyreforsøg med fordel kan forregistreres, sådan som mange kliniske forsøg på mennesker bliver det i dag. Det vil sige, at designet af forsøget indsendes forud for forsøget, således at forskerne ikke efterfølgende bliver fristet til at ændre analyserne, når først de står med resultaterne. Utvivlsomt vil sådanne forregistreringer i nogle typer af forsøg kunne anvendes, selvom det næppe er løsningen for alle typer af dyreforsøg. Alternativt kan forskerne også blot for sig selv nedskrive, hvordan de vil analysere data, og så trofast holde fast herved ved den senere dataanalyse.

PREPARE- og ARRIVE-guidelines

I et forsøg på at designe bedre eksperimenter og rapportere dem korrekt kan man gøre brug af de såkaldte PREPARE- og ARRIVE-guidelines.

PREPARE-guidelines er en række råd til, hvordan man bør designe sine forsøg, altså hvilke forhold og faktorer, man på forhånd bør gennemtænke, inden man udfører forsøget.

ARRIVE-guidelines er tilsvarende en slags huskeliste for nogle af de oplysninger, der bør gives i de publicerede artikler.

Selvom de to guidelines kan være nyttige, erstatter de dog aldrig en individuel og kritisk tænkning over egne forsøg. PREPARE og ARRIVE er ikke nogen garanti for, at resultaterne bliver reproducerbare og overførbare, men de er nyttige redskaber på vejen.